python爬虫添加请求头代码实例

 更新时间:2019年12月28日 10:07:06   作者:Lust4Life  
这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python shell命令行中import多层目录下的模块操作

    python shell命令行中import多层目录下的模块操作

    这篇文章主要介绍了python shell命令行中import多层目录下的模块操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • node.js获取参数的常用方法(总结)

    node.js获取参数的常用方法(总结)

    下面小编就为大家带来一篇node.js获取参数的常用方法(总结)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • 详解如何使用SQLAlchemy连接数据库

    详解如何使用SQLAlchemy连接数据库

    这篇文章主要为大家详细介绍了如何使用 SQLAlchemy 连接数据库、建立模型、操作表、以及查询操作表数据等内容,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-11-11
  • Python子类继承父类构造函数详解

    Python子类继承父类构造函数详解

    在本文里我们给大家分享一篇关于Python 子类继承父类构造函数的相关知识点内容,需要的朋友们跟着学习下。
    2019-02-02
  • Python制作七夕表白案例分享

    Python制作七夕表白案例分享

    这篇文章主要介绍了Python制作七夕表白案例分享,文章利用Python的基本操作实现七夕表白案例,需要的小伙伴可以参考一下
    2022-08-08
  • 使用Python进行稳定可靠的文件操作详解

    使用Python进行稳定可靠的文件操作详解

    在本文中,主要分享一些如何在Python代码中改善I/O可靠性的见解,大家参考使用吧
    2013-12-12
  • Python数据可视化之使用matplotlib绘制简单图表

    Python数据可视化之使用matplotlib绘制简单图表

    这篇文章主要为大家详细介绍了使用matplotlib绘制简单图表的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-03-03
  • Python模块介绍与使用详细讲解

    Python模块介绍与使用详细讲解

    这篇文章主要介绍了Python模块介绍与使用详细讲解,包括模块的相关概念和使用方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04
  • python中pivot()函数基础知识点

    python中pivot()函数基础知识点

    在本篇内容里小编给大家分享的是一篇关于python中pivot()函数基础知识点内容,对此有兴趣的朋友们可以参考学习下。
    2021-01-01
  • Pycharm没有报错提示(误触ignore)的完美解决方案

    Pycharm没有报错提示(误触ignore)的完美解决方案

    这篇文章主要介绍了Pycharm没有报错提示(误触ignore)的解决方案,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-12-12

最新评论