python网络爬虫采集联想词示例

 更新时间:2014年02月11日 10:03:47   作者:  
这篇文章主要介绍了python网络爬虫采集联想词示例,需要的朋友可以参考下

python爬虫_采集联想词代码

复制代码 代码如下:

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']

list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }

    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})

    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)

    for key in headers:
        req.add_header(key,headers[key])

    html = urllib2.urlopen(req).read()

    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)

相关文章

  • python使用pyplot绘制横轴为时间的图

    python使用pyplot绘制横轴为时间的图

    介绍了如何在Python中使用matplotlib库进行绘图,并处理字符串日期格式转换为date对象以及自定义x轴日期显示格式的方法,首先,导入必要的环境和绘图方法,其次,处理横坐标数组,将字符串型的日期转换成date对象,以便用于绘图
    2024-09-09
  • Python著名游戏实战之方块连接 我的世界

    Python著名游戏实战之方块连接 我的世界

    读万卷书不如行万里路,学的扎不扎实要通过实战才能看出来,本篇文章手把手带你模仿著名游戏——我的世界,大家可以在过程中查缺补漏,看看自己掌握程度怎么样
    2021-10-10
  • python随机数分布random均匀分布实例

    python随机数分布random均匀分布实例

    今天小编就为大家分享一篇python随机数分布random均匀分布实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • python使用socket向客户端发送数据的方法

    python使用socket向客户端发送数据的方法

    这篇文章主要介绍了python使用socket向客户端发送数据的方法,涉及Python使用socket实现数据通信的技巧,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • Python中apply函数的用法实例教程

    Python中apply函数的用法实例教程

    这篇文章主要介绍了Python中apply函数的用法,配合实例解说,可加深读者对apply函数的理解,需要的朋友可以参考下
    2014-07-07
  • python继承threading.Thread实现有返回值的子类实例

    python继承threading.Thread实现有返回值的子类实例

    这篇文章主要介绍了python继承threading.Thread实现有返回值的子类实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python lxml解析HTML并用xpath获取元素的方法

    Python lxml解析HTML并用xpath获取元素的方法

    今天小编就为大家分享一篇Python lxml解析HTML并用xpath获取元素的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python版的文曲星猜数字游戏代码

    Python版的文曲星猜数字游戏代码

    最近开始研究python,于是写了个Python版的文曲星猜数字游戏,喜欢的朋友可以参考下
    2013-09-09
  • python查询mysql中文乱码问题

    python查询mysql中文乱码问题

    本文主要是解决python2.7在查询mysql时产生中文乱码的处理方法,非常的有用,亲测可行,推荐给大家
    2014-11-11
  • 快速一键生成Python爬虫请求头

    快速一键生成Python爬虫请求头

    这篇文章主要介绍了如何快速一键生成Python爬虫请求头,帮助大家更好的理解和学习使用python爬虫,感兴趣的朋友可以了解下
    2021-03-03

最新评论