Python抓取百度查询结果的方法

更新时间：2015年07月08日 10:34:38 作者：光索与诺

这篇文章主要介绍了Python抓取百度查询结果的方法,涉及Python正则匹配及字符串与URL操作的相关技巧,需要的朋友可以参考下

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下：

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

您可能感兴趣的文章:

python统计多维数组的行数和列数实例
今天小编就为大家分享一篇python统计多维数组的行数和列数实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
python距离测量的方法
这篇文章主要为大家详细介绍了python距离测量的方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-03-03
GitHub 热门：Python 算法大全,Star 超过 2 万
4 月 27 日，GitHub 趋势榜第 3 位是一个用 Python 编码实现的算法库，Star 数早已达到 26000+
2019-04-04
Python中os.system函数的用法详解
在 Python 的众多模块中,os模块是一个功能强大的工具,它为开发者提供了与操作系统交互的接口,其中,os.system函数作为os模块的一部分,扮演着重要的角色,本文给大家介绍了Python中os.system函数的用法,需要的朋友可以参考下
2025-02-02
Python中的单行、多行、中文注释方法
今天小编就为大家分享一篇Python中的单行、多行、中文注释方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-07-07
keras 读取多标签图像数据方式
这篇文章主要介绍了keras 读取多标签图像数据方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
Python内存池机制的实现
Python内存池是Python解释器为了提高内存分配效率而设计的一种内存管理机制,本文主要介绍了Python内存池机制的实现,具有一定的参考价值,感兴趣的可以了解一下
2025-04-04
python 多线程爬取壁纸网站的示例
这篇文章主要介绍了python 多线程爬取壁纸网站的示例，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下
2021-02-02
Python中的数据分析详解
这篇文章主要介绍了Python中的数据分析详解,对数据进行分析，数据分析是指根据分析目的，用适当的统计分析方法及工具，对收集来的数据进行处理与分析，提取有价值的信息，发挥数据的作用,需要的朋友可以参考下
2023-07-07
pytorch torch.expand和torch.repeat的区别详解
这篇文章主要介绍了pytorch torch.expand和torch.repeat的区别详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-11-11

Python抓取百度查询结果的方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具