|
有个网页 其html代码如下
[{'all':'<tbody id=timebuy> <tr><td height=27 align=center>现货铂金</td><td height=18 align=center>286.77</td><td height=18 align=center class=fontok>-0.24</td><td height=18 align=center>-0.08%</td><td height=18 align=center>287.58</td><td height=18 align=center>286.29</td></tr><tr><td height=27 align=center>现货钯金</td><td height=18 align=center>146.34</td><td height=18 align=center class=fontok>-0.44</td><td height=18 align=center>-0.30%</td><td height=18 align=center>147.63</td><td height=18 align=center>146.28</td></tr><tr><td height=27 align=center>现货白银</td><td height=18 align=center>4036</td><td height=18 align=center class=fontok>+25</td><td height=18 align=center>+0.62%</td><td height=18 align=center>4074</td><td height=18 align=center>4031</td></tr></tbody>'},{
这个是一个网页的行情没有换行,我想把里面带颜色的内容给提取出来, 希望提取出来,然后存储备用进行分析,但是自己刚刚开始学习正则表达式,搞了一晚上,也没有搞明白,我参考网站上的例子,做了一个正则,但是怎么也搞不出来,求助一下大家
我希望就是把 带颜色的部分提取出来,然后存储以备程序使用。
当然绿色部分的内容如果能够单独提取出来更好。如果不成,不考虑也成
下面是我模仿写的正则表达式,我是把所有的内容全部写上提取的,如下
<tr><td height=27 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center class=fontok>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td></tr><tr><td height=27 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center class=fontok>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td></tr><tr><td height=27 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center class=fontok>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td><td height=18 align=center>([\d\D]*)</td></tr>
能够提取处理内容,但是感觉相当麻烦,想求助一下,有没有好的办法,效率速度更高的呢?
谢谢大家了,另外自己也没有处理过相应的东东,想问一下,提取出来的汉字还需要有什么注意事项么?
|
|