请教一个正则 或问题

我在做一个爬虫目标网页之一昰:

因为报告往往不止一页,所以我需要从网页的源代码中找到页面总数,用 BeautifulSoup + lxml 解析后的部分网页代码如下:

本人正则 或表达式不够熟练目前我用的办法是,但是觉得不够好:

}

在一个表中存在类似如下数据:

F01仩海线淮海路支线


字母和数字单独一组每个“线”字作为一个分组标识,没有“线”字和字母的则单独作为一个分组并在结果中去掉“线”字。转换结果应如下显示:

来自 “ ITPUB博客 ” 链接://viewspace-588687/,如需转载请注明出处,否则将追究法律责任

}

我要回帖

更多关于 什么是正则 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信