Python requests获取网页常用方法解析

 更新时间:2020年02月20日 11:20:15   作者:酸果实爱吐泡泡的鱼  
这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

主要记录使用 requests 模块获取网页源码的方法

class Crawler(object):
 """
 采集类
 """
 def __init__(self, base_url):
  self._base_url = base_url
  self._cookie = None
  self._getCookie()

 def _getCookie(self):
  """
  获取站点cookie
  :return:
  """
  try:
   res = requests.get(self._base_url)
   res.raise_for_status()
   # TODO response.cookies获取到的是一个cookiejar对象,需要使用requests.utils.dict_from_cookiejar来
   # TODO 将cookiejar对象转换为一个字典,这个字典后续使用的时候,在请求时直接传入就可以了,
   # 如 requests.get(url, cookies=cookies)
   self._cookie = requests.utils.dict_from_cookiejar(res.cookies)
   print self._cookie
  except Exception as e:
   print e

 def get_html_text(self, url, **kwargs):
  """
  爬取网页的通用代码框架
  :param url:
  :param method:
  :param kwargs:
  :return:
  """
  try:
   kwargs.setdefault('cookies', self._cookie)
   res = requests.get(url, **kwargs)
   # TODO 若响应状态码不是200, 抛出 HTTPError 异常
   res.raise_for_status()
   res.encoding = res.apparent_encoding
   # print requests.utils.dict_from_cookiejar(res.cookies)
   return res.text
  except Exception as e:
   print traceback.print_exc()
   return

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python如何实时获取tcpdump输出

    python如何实时获取tcpdump输出

    这篇文章主要介绍了python如何实时获取tcpdump输出,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-09-09
  • PyQt编程之如何在屏幕中央显示窗体的实例

    PyQt编程之如何在屏幕中央显示窗体的实例

    今天小编就为大家分享一篇PyQt编程之如何在屏幕中央显示窗体的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • python使用 request 发送表单数据操作示例

    python使用 request 发送表单数据操作示例

    这篇文章主要介绍了python使用 request 发送表单数据操作,结合实例形式分析了Python基于requests模块的表单数据发送操作相关实现技巧,需要的朋友可以参考下
    2019-09-09
  • python读取excel文件的方法

    python读取excel文件的方法

    文章介绍了在Python中读取Excel文件的两种方法:使用pandas库和使用openpyxl库,pandas适合数据分析和处理,而openpyxl提供了更多的Excel文件操作功能,感兴趣的朋友跟随小编一起看看吧
    2024-11-11
  • Python中的HTTP请求库Requests的具体使用

    Python中的HTTP请求库Requests的具体使用

    Python作为一种功能强大且易于学习的编程语言,提供了许多用于处理HTTP请求的库,其中,Requests库是最受欢迎的选择之一,本文主要介绍了Python中的HTTP请求库Requests的具体使用,感兴趣的可以了解一下
    2023-12-12
  • Python删除Java源文件中全部注释的实现方法

    Python删除Java源文件中全部注释的实现方法

    这篇文章主要介绍了Python删除Java源文件中全部注释的实现方法,涉及Python读取文件、正则匹配、字符串查找、替换等相关操作技巧,需要的朋友可以参考下
    2017-08-08
  • python深度学习tensorflow入门基础教程示例

    python深度学习tensorflow入门基础教程示例

    这篇文章主要为大家介绍了python深度学习tensorflow入门基础教程示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • python + pyqt5制作一个串口助手

    python + pyqt5制作一个串口助手

    这篇文章主要介绍了python + pyqt5制作一个串口助手,串口助手是串口通信使用的工具,为整合知识,打算做个串口助手,本文给大家讲解的非常详细,需要的朋友可以参考下
    2023-04-04
  • Python返回数组/List长度的实例

    Python返回数组/List长度的实例

    今天小编就为大家分享一篇Python返回数组/List长度的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python Opencv提取图片中某种颜色组成的图形的方法

    Python Opencv提取图片中某种颜色组成的图形的方法

    这篇文章主要介绍了Python Opencv提取图片中某种颜色组成的图形的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09

最新评论