python网络爬虫之如何伪装逃过反爬虫程序的方法

 更新时间:2017年11月23日 09:15:03   作者:Master HaKu  
本篇文章主要介绍了python网络爬虫之如何伪装逃过反爬虫程序的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

有的时候,我们本来写得好好的爬虫代码,之前还运行得Ok, 一下子突然报错了。

报错信息如下:

Http 800 Internal internet error

这是因为你的对象网站设置了反爬虫程序,如果用现有的爬虫代码,会被拒绝。

之前正常的爬虫代码如下:

from urllib.request import urlopen
...
html = urlopen(scrapeUrl)
bsObj = BeautifulSoup(html.read(), "html.parser")

这个时候,需要我们给我们的爬虫代码做下伪装,

给它添加表头伪装成是来自浏览器的请求

修改后的代码如下:

import urllib.parse
import urllib.request
from bs4 import BeautifulSoup
...
req = urllib.request.Request(scrapeUrl)
req.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)') 
response = urllib.request.urlopen(req) 
html = response.read()
 
bsObj = BeautifulSoup(html, "html.parser")

Ok,一切搞定,又可以继续爬了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 关于Python连接Cassandra容器进行查询的问题

    关于Python连接Cassandra容器进行查询的问题

    这篇文章主要介绍了Python连接Cassandra容器进行查询的问题,问题的关键在于寻找到Cassandra的9042端口,从而获取数据,具有内容详情跟随小编一起看看吧
    2021-11-11
  • PyQt5 在QListWidget自定义Item的操作

    PyQt5 在QListWidget自定义Item的操作

    这篇文章主要介绍了PyQt5 在QListWidget自定义Item的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Pytorch maxpool的ceil_mode用法

    Pytorch maxpool的ceil_mode用法

    今天小编就为大家分享一篇Pytorch maxpool的ceil_mode用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python中创建表格详细过程

    Python中创建表格详细过程

    这篇文章主要介绍了Python中创建表格,在python中使用tabulate库来创建表格,并针对输出形式进行不断改进来美化输出效果,并给出了代码示例。需要的小伙伴可以参考一下
    2022-02-02
  • django orm 通过related_name反向查询的方法

    django orm 通过related_name反向查询的方法

    今天小编就为大家分享一篇django orm 通过related_name反向查询的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python使用Pygame实现时钟效果

    Python使用Pygame实现时钟效果

    这篇文章主要为大家详细介绍了Python使用Pygame实现时钟效果,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-08-08
  • Python request操作步骤及代码实例

    Python request操作步骤及代码实例

    这篇文章主要介绍了Python request操作步骤及代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • Python设计模式之命令模式原理与用法实例分析

    Python设计模式之命令模式原理与用法实例分析

    这篇文章主要介绍了Python设计模式之命令模式,结合具体实例形式分析了Python命令模式相关概念、原理、定义及使用方法,需要的朋友可以参考下
    2019-01-01
  • 一篇文章带你了解Python的进程,线程和协程

    一篇文章带你了解Python的进程,线程和协程

    这篇文章主要为大家介绍了Python的进程,线程和协程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • 详解Python查找谁删了你的微信

    详解Python查找谁删了你的微信

    微信好友长时间不联系就可能被对方删除,但是微信也不会主动通知你。那么我们就来用python写一个工具查验一下谁删除了你的微信
    2022-02-02

最新评论