我在做一个爬虫目标网页之一昰:
因为报告往往不止一页,所以我需要从网页的源代码中找到页面总数,用 BeautifulSoup + lxml 解析后的部分网页代码如下:
本人正则 或表达式不够熟练目前我用的办法是,但是觉得不够好:
在一个表中存在类似如下数据:
F01仩海线淮海路支线
来自 “ ITPUB博客 ” 链接://viewspace-588687/,如需转载请注明出处,否则将追究法律责任
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。