python使用正则表达式提取网页URL的方法

更新时间：2015年05月26日 12:35:29 作者：八大山人

这篇文章主要介绍了python使用正则表达式提取网页URL的方法,涉及Python中urllib模块及正则表达式的相关使用技巧,需要的朋友可以参考下

本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下：

import re
import urllib
url="https://www.jb51.net"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
 print i
else:
 print 'this is over'

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：
http://tools.jb51.net/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

您可能感兴趣的文章:

python发送byte数据组到tcp的server问题
这篇文章主要介绍了python发送byte数据组到tcp的server问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-09-09
pandas实现手机号号码中间4位匿名化的示例代码
本文主要介绍了pandas实现手机号号码中间4位匿名化的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-08-08
Python中的星号*还能这么用你知道吗
这篇文章主要为大家详细介绍了Python中的星号*用法的相关资料，文中的示例代码讲解详细，具有一定的学习价值，感兴趣的小伙伴可以跟随小编一起了解一下
2023-06-06
Python中实现 xls 文件转 xlsx的4种方法(示例详解)
在 Python 中,可以采用 pandas、pyexcel、win32com 和 xls2xlsx 这四个模块,实现 xls 转 xlsx 格式,本文以 Excel 示例文件test_Excel.xls 为例结合示例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
2024-06-06
最新2019Pycharm安装教程亲测
这篇文章主要介绍了最新2019Pycharm安装教程，这篇教程亲测试过，本文内容有点长，通过截图的形式给大家介绍的非常详细,需要的朋友可以参考下
2020-02-02
Python使用sklearn实现的各种回归算法示例
这篇文章主要介绍了Python使用sklearn实现的各种回归算法,结合实例形式分析了Python使用sklearn库实现的决策树回归、线性回归、SVM回归、KNN回归、随机森林回归等各种回归算法,需要的朋友可以参考下
2019-07-07
使用 Python 清理收藏夹里已失效的网站
这篇文章主要介绍了用 Python 清理收藏夹里已失效的网站,本文通过截图实例代码的形式给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-12-12
python 将numpy维度不同的数组相加相乘操作
这篇文章主要介绍了python 将numpy维度不同的数组相加相乘操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-03-03
Python编程利用Numpy和PIL库将图片转化为手绘
这篇文章主要介绍了Python编程利用Numpy和PIL库将一张图片转化为手绘风格，文中附含详细实现的示例代码，有需要的朋友可以借鉴参考下
2021-09-09
Python程序打包工具py2exe和PyInstaller详解
这篇文章主要介绍了Python程序打包工具py2exe和PyInstaller详解,如果可以提前将程序打包成 Windows平台的 .exe 文件或者是Linux下的 .sh 脚本，那么使用起来就会方便很多,需要的朋友可以参考下
2019-06-06

python使用正则表达式提取网页URL的方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具