python获取指定网页上所有超链接的方法

 更新时间:2015年04月04日 12:57:23   作者:令狐不聪  
这篇文章主要介绍了python获取指定网页上所有超链接的方法,涉及Python使用urllib2模块操作网页抓取的技巧,非常具有实用价值,需要的朋友可以参考下

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

  • Python pandas如何向excel添加数据

    Python pandas如何向excel添加数据

    这篇文章主要介绍了Python pandas如何向excel添加数据,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-05-05
  • django 前端页面如何实现显示前N条数据

    django 前端页面如何实现显示前N条数据

    这篇文章主要介绍了django 前端页面如何实现显示前N条数据。具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python中logging实例讲解

    Python中logging实例讲解

    在本篇文章里小编给大家分享的是关于Python中logging的详细介绍内容,有兴趣的朋友们跟着学习下。
    2019-01-01
  • 用Python写一个模拟qq聊天小程序的代码实例

    用Python写一个模拟qq聊天小程序的代码实例

    今天小编就为大家分享一篇关于用Python写一个模拟qq聊天小程序的代码实例,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • 基于python实现模拟数据结构模型

    基于python实现模拟数据结构模型

    这篇文章主要介绍了基于python实现模拟数据结构模型,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python常见字符串操作函数小结【split()、join()、strip()】

    Python常见字符串操作函数小结【split()、join()、strip()】

    这篇文章主要介绍了Python常见字符串操作函数,结合实例形式总结分析了split()、join()及strip()的常见使用技巧与注意事项,需要的朋友可以参考下
    2018-02-02
  • Python实现二分查找与bisect模块详解

    Python实现二分查找与bisect模块详解

    二分查找又叫折半查找,二分查找应该属于减治技术的成功应用。python标准库中还有一个灰常给力的模块,那就是bisect。这个库接受有序的序列,内部实现就是二分。下面这篇文章就详细介绍了Python如何实现二分查找与bisect模块,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-01-01
  • Python爬取股票信息,并可视化数据的示例

    Python爬取股票信息,并可视化数据的示例

    这篇文章主要介绍了Python爬取股票信息,并可视化数据的示例,帮助大家更好的理解和使用python爬虫,感兴趣的朋友可以了解下
    2020-09-09
  • python学生管理系统

    python学生管理系统

    这篇文章主要为大家详细介绍了python学生管理系统的相关代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • 详解Python中httptools模块的使用

    详解Python中httptools模块的使用

    httptools 是一个 HTTP 解析器,它首先提供了一个 parse_url 函数,用来解析 URL。这篇文章就来和大家聊聊它的用法吧,感兴趣的可以了解一下
    2023-03-03

最新评论