python爬取以...config.jsp和...cache.jsp结尾的字符串怎么写正则表达式。

正则本身就是一门语言:

  正則表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串在文本处理方面功能非常强大,也经常用作爬虫来爬取特定內容,Python本身不支持正则但是通过导入re模块,Python也能用正则表达式下面就来讲一下python正则表达式的用法。

  大多数的字符和字母都会和自身匹配

如果一个匹配规则以后要使用多次,就可以先将其编译以后就不用每次都在去写匹配规则

  这个方法是Pattern类的工厂方法,用于將字符串形式的正则表达式编译为
Pattern对象 第二个参数flag是匹配模式,取值可以使用按位或运算符'|'

除了简单地判断是否匹配之外正则表达式還有提取子串的强大功能。用()表示的就是要提取的分组可以有多个组,分组的用法很多这里只是简单的介绍一下

# 下面的返回None 为什么是涳?而匹配不到3gg7因为\1的不仅表示第一组,而且匹配到的内容也要和第一组匹配到的内容相同第一组匹配到3,第二组匹配到7 不相同所以返回空 # 分组是从已经匹配到的里面去取值
}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信