Python提取网页中超链接的方法

 更新时间:2016年09月18日 10:19:32   投稿:daisy  
很多人在一开始学习Python,会打算用作爬虫开发。既然要做爬虫,首先就要抓取网页,并且从网页中提取出超链接地址。这篇文章给大家分享一个简单的方法,有需要的可以参考借鉴。

下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接

代码如下:

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。

相关文章

  • 基于Python编写一个中秋节嫦娥投食小游戏

    基于Python编写一个中秋节嫦娥投食小游戏

    今天给大家带来的是给玉兔投喂月饼的小游戏。八月十五中秋夜晚,让我们对着月亮许愿:希望我们在意和在意我们的人,诸邪避退、百事无忌、平安喜乐、万事胜意。提前祝大家中秋节快乐
    2022-09-09
  • Python 中的lambda函数介绍

    Python 中的lambda函数介绍

    Lambda函数,即Lambda 表达式(lambda expression),是一个匿名函数(不存在函数名的函数),这篇文章主要介绍了Python lambda函数的基础知识,需要的朋友可以参考下
    2018-10-10
  • 基于python yield机制的异步操作同步化编程模型

    基于python yield机制的异步操作同步化编程模型

    这篇文章主要介绍了基于python yield机制的异步操作同步化编程模型,需要的朋友可以参考下
    2016-03-03
  • Python json解析库jsonpath原理及使用示例

    Python json解析库jsonpath原理及使用示例

    这篇文章主要介绍了Python json解析库jsonpath原理及使用示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • 关于Python下载大文件时哪种方式速度更快

    关于Python下载大文件时哪种方式速度更快

    这篇文章主要介绍了关于Python下载大文件时哪种方式速度更快,通常,我们都会用 requests 库去下载,这个库用起来太方便了,需要的朋友可以参考下
    2023-04-04
  • Python生成器深度解析如何构建强大的数据处理管道

    Python生成器深度解析如何构建强大的数据处理管道

    这篇文章主要为大家介绍了Python生成器深度解析如何构建强大的数据处理管道,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • Numpy数组array和矩阵matrix转换方法

    Numpy数组array和矩阵matrix转换方法

    这篇文章主要介绍了Numpy数组array和矩阵matrix转换方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • python字符串下标与切片及使用方法

    python字符串下标与切片及使用方法

    这篇文章主要介绍了python字符串下标与切片及使用方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • python批量赋值操作实例

    python批量赋值操作实例

    今天小编就为大家分享一篇python批量赋值操作实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python音频处理库pydub的使用教程详解

    Python音频处理库pydub的使用教程详解

    Pydub是Python音频处理库,可以对音频进行切割、合并、转换、调整音量等操作。本文将对pydub各个知识点和案例进行介绍,需要的可以参考一下
    2023-03-03

最新评论