python获取指定网页上所有超链接的方法

 更新时间:2015年04月04日 12:57:23   作者:令狐不聪  
这篇文章主要介绍了python获取指定网页上所有超链接的方法,涉及Python使用urllib2模块操作网页抓取的技巧,非常具有实用价值,需要的朋友可以参考下

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

  • Python 图形绘制详细代码(一)

    Python 图形绘制详细代码(一)

    这篇文章主要介绍了Python 图形绘制详细代码,文章主要从最简单图像的开始,在同一图上绘制两条或多条线一些简单操作,想了解的小伙伴可以学习一下,希望对你的学习有所帮助
    2021-12-12
  • django admin 添加自定义链接方式

    django admin 添加自定义链接方式

    这篇文章主要介绍了django admin 添加自定义链接方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Pyinstaller打包.py生成.exe的方法和报错总结

    Pyinstaller打包.py生成.exe的方法和报错总结

    今天小编就为大家分享一篇关于Pyinstaller打包.py生成.exe的方法和报错总结,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-04-04
  • 通过 for 循环比较 Python 与 Ruby 的编程区别

    通过 for 循环比较 Python 与 Ruby 的编程区别

    这篇文章主要介绍了通过 for 循环比较 Python 与 Ruby 的编程区别,Ruby 与 Python 之间的差异在很大程度上可通过for循环看出本质,下文详细介绍需要的小伙伴可以参考一下
    2022-05-05
  • python防止随意修改类属性的实现方法

    python防止随意修改类属性的实现方法

    这篇文章主要介绍了python防止随意修改类属性的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • python获取当前git的repo地址的示例代码

    python获取当前git的repo地址的示例代码

    大家好,当谈及版本控制系统时,Git是最为广泛使用的一种,而Python作为一门多用途的编程语言,在处理Git仓库时也展现了其强大的能力,本文给大家介绍了python获取当前git的repo地址的方法,需要的朋友可以参考下
    2024-09-09
  • 分析在Python中何种情况下需要使用断言

    分析在Python中何种情况下需要使用断言

    这篇文章主要介绍了分析在Python中何种情况下需要使用断言,以避免在断言使用中经常可能碰到的错误,作者给出了具体代码示例,需要的朋友可以参考下
    2015-04-04
  • python如何统计序列中元素

    python如何统计序列中元素

    这篇文章主要为大家详细介绍了python如何统计序列中的元素,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • python抽象基类用法实例分析

    python抽象基类用法实例分析

    这篇文章主要介绍了python抽象基类用法,实例分析了Python抽象基类的使用方法与相关注意事项,需要的朋友可以参考下
    2015-06-06
  • Python 平方列表中每个数字的多种操作

    Python 平方列表中每个数字的多种操作

    这篇文章主要介绍了Python 平方列表中每个数字的多种操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03

最新评论