Python数据抓取爬虫代理防封IP方法

 更新时间:2018年12月23日 13:45:28   作者:ygjgdcmyzyq  
在本篇内容里小编给大家分享了关于Python数据抓取爬虫代理防封IP方法讲解,需要的朋友们可以跟着学习下。

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

3、接着再用build_opener()来构建一个opener对象。

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对脚本之家的支持。

相关文章

  • Python批处理删除和重命名文件夹的实例

    Python批处理删除和重命名文件夹的实例

    今天小编就为大家分享一篇Python批处理删除和重命名文件夹的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python 有可能删除 GIL 吗?

    Python 有可能删除 GIL 吗?

    这篇文章主要介绍了Python 有可能删除 GIL 吗,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-03-03
  • python实现自主查询实时天气

    python实现自主查询实时天气

    这篇文章主要为大家详细介绍了python实现自主查询实时天气,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • python实现的生成word文档功能示例

    python实现的生成word文档功能示例

    这篇文章主要介绍了python实现的生成word文档功能,涉及Python数据查询、遍历及word文档生成相关操作技巧,需要的朋友可以参考下
    2019-08-08
  • python3.6 实现AES加密的示例(pyCryptodome)

    python3.6 实现AES加密的示例(pyCryptodome)

    本篇文章主要介绍了python3.6 实现AES加密的示例(pyCryptodome),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-01-01
  • python中json操作之json.loads、json.load、json.jumps及json.jump用法

    python中json操作之json.loads、json.load、json.jumps及json.jump用法

    最近在python里面用json读取json文件,可是老是不成功,特此记录一下,下面这篇文章主要给大家介绍了关于python中json操作之json.loads、json.load、json.jumps及json.jump用法的相关资料,需要的朋友可以参考下
    2022-08-08
  • Python数据结构之链表详解

    Python数据结构之链表详解

    在顺序存储方式中,根据数据元素的序号就可随机存取表中任何一个元素,但同时在插入和删除运算需要移动大量的元素,造成算法效率较低。解决此缺陷的一个办法是:对线性表采用链式存储方式。本文将介绍链式存储结构的特点以及各种基本操作的实现。需要的可以参考一下
    2022-01-01
  • Python开发微信公众平台的方法详解【基于weixin-knife】

    Python开发微信公众平台的方法详解【基于weixin-knife】

    这篇文章主要介绍了Python开发微信公众平台的方法,结合实例形式分析了Python基于weixin-knife针对微信公众平台消息、接口调用及事件处理的基本操作技巧与相关注意事项,需要的朋友可以参考下
    2017-07-07
  • Python generator生成器和yield表达式详解

    Python generator生成器和yield表达式详解

    这篇文章主要介绍了Python generator生成器和yield表达式详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Keras中的多分类损失函数用法categorical_crossentropy

    Keras中的多分类损失函数用法categorical_crossentropy

    这篇文章主要介绍了Keras中的多分类损失函数用法categorical_crossentropy,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06

最新评论