浅谈Python采集网页时正则表达式匹配换行符的问题
更新时间:2018年12月20日 10:10:43 作者:lmb20056127
今天小编就为大家分享一篇浅谈Python采集网页时正则表达式匹配换行符的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下: p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思
[\s\S]
\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
python pandas利用fillna方法实现部分自动填充功能
这篇文章主要介绍了python pandas通过fillna方法实现部分自动填充功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2020-03-03在django admin详情表单显示中添加自定义控件的实现
这篇文章主要介绍了在django admin详情表单显示中添加自定义控件的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-03-03python获取http请求响应头headers中的数据的示例
这篇文章主要介绍了python获取http请求响应头headers中的数据,本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2022-02-02一文教会你用python连接并简单操作SQLserver数据库
最近要将数据写到数据库里,学习了一下如何用Python来操作SQLServer数据库,下面这篇文章主要给大家介绍了关于用python连接并简单操作SQLserver数据库的相关资料,需要的朋友可以参考下2022-09-09Python collections中的双向队列deque简单介绍详解
这篇文章主要介绍了Python collections中的双向队列deque简单介绍详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2019-11-11
最新评论