python中urllib.request和requests的使用及区别详解

更新时间：2020年05月05日 17:59:04 作者：野‘’狼

这篇文章主要介绍了python中urllib.request和requests的使用及区别详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

urllib.request

我们都知道，urlopen()方法能发起最基本对的请求发起，但仅仅这些在我们的实际应用中一般都是不够的，可能我们需要加入headers之类的参数,那需要用功能更为强大的Request类来构建了

在不需要任何其他参数配置的时候，可直接通过urlopen()方法来发起一个简单的web请求

发起一个简单的请求

import urllib.request
url='https://www.douban.com'
webPage=urllib.request.urlopen(url)
print(webPage)
data=webPage.read()
print(data)
print(data.decode('utf-8'))

urlopen()方法返回的是一个http.client.HTTPResponse对象，需要通过read（）方法做进一步的处理。一般使用read（）后，我们需要用decode（）进行解码，通常为utf-8，经过这些步骤后，最终才获取到我们想要的网页。

添加Headers信息

import urllib.request
url='https://www.douban.com'
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
 }
response=urllib.request.Request(url=url,headers=headers)
webPage=urllib.request.urlopen(response)
print(webPage.read().decode('utf-8'))

使用Request类返回的又是一个urllib.request.Request对象了。

通常我们爬取网页，在构造http请求的时候，都需要加上一些额外信息，什么Useragent，cookie等之类的信息，或者添加代理服务器。往往这些都是一些必要的反爬机制

requests

通常而言，在我们使用python爬虫时，更建议用requests库，因为requests比urllib更为便捷，requests可以直接构造get,post请求并发起，而urllib.request只能先构造get，post请求，再发起。

import requests
url='https://www.douban.com'
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
}
get_response = requests.get(url,headers=headers,params=None)
post_response=requests.post(url,headers=headers,data=None,json=None)
print(post_response)
print(get_response.text)
print(get_response.content)
print(get_response.json)

get_response.text得到的是str数据类型。

get_response.content得到的是Bytes类型,需要进行解码。作用和get_response.text类似。

get_response.json得到的是json数据。

总而言之，requests是对urllib的进一步封装，因此在使用上显得更加的便捷，建议小伙伴们在实际应用当中尽量使用requests。

补充知识：python中urllib.request.Request()与urllib.request.urlopen()区别

蟒蛇中urllib.request.Request（）与urllib.request.urlopen（）的区别：

相对于urllib.request.urlopen（）来说urllib.request.Request是进一步的包装请求，下面是请求类的源码示例：

class Request:
  
  # 主要看这块，构造函数中指明了Request进一步包装请求中可以传递的参数有（url，data，headers，            
  # origin_req_host，unverifiable，method）
 
  def __init__(self, url, data=None, headers={},
         origin_req_host=None, unverifiable=False,
         method=None):
    self.full_url = url
    self.headers = {}
    self.unredirected_hdrs = {}
    self._data = None
    self.data = data
    self._tunnel_host = None
    for key, value in headers.items():
      self.add_header(key, value)
    if origin_req_host is None:
      origin_req_host = request_host(self)
    self.origin_req_host = origin_req_host
    self.unverifiable = unverifiable
    if method:
      self.method = method
  pass

我们可以这样使用（以下是模拟有道字典翻译发送的请求）：

# 请求地址url
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
 
# 请求头
request_headers = {
  'Host':'fanyi.youdao.com',
  "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36",
}
 
# 发送给服务器的表单
form_data = {
  "i": word,
  "from": "AUTO",
  "to": "AUTO",
  "smartresult": "dict",
  "doctype": "json",
  "version": "2.1",
  "keyfrom": "fanyi.web",
  "action": "FY_BY_REALTIME",
  "typoResult": "false"
}
 
# POST发送的data必须为bytes或bytes类型的可迭代对象，不能是字符串
form_data = urllib.parse.urlencode(form_data).encode()
 
# 构造请求对象Request
req = urllib.request.Request(url, data=form_data, headers=request_headers)
 
# 发起请求
response = urllib.request.urlopen(req)
data = response.read().decode()
print(data)

所以，总的来说，如果我们在获取请求对象时，不需要过多的参数传递，我么可以直接选择urllib.request.urlopen（）;如果需要进一步的包装请求，则需要用urllib.request里。的urlopen（）进行包装处理。

以上这篇python中urllib.request和requests的使用及区别详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

基于Python构建深度学习图像分类模型
在人工智能的浪潮中,图像分类作为计算机视觉领域的基础任务之一,一直备受关注,本文将介绍如何使用Python和PyTorch框架,构建一个简单的深度学习图像分类模型,感兴趣的可以了解下
2024-12-12
Django ORM filter() 的运用详解
这篇文章主要介绍了Django ORM filter() 的运用详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-05-05
python爬虫智能翻页批量下载文件的实例详解
在本篇文章里小编给大家整理的是一篇关于python爬虫智能翻页批量下载文件的实例详解内容，有兴趣的朋友们可以学习下。
2021-02-02
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
这篇文章主要介绍了Python3.5 win10环境下导入keras/tensorflow报错的解决方法,较为详细的分析了Python3.5在win10环境下导入keras/tensorflow提示错误的原因与相关解决方法,需要的朋友可以参考下
2019-12-12
python安装读取grib库总结(推荐)
这篇文章主要介绍了python安装读取grib库总结,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-06-06
Python实现数据库表的监控警告的项目实践
本文主要介绍了使用Python 实现对数据库表的监控告警功能, 并将告警信息通过钉钉机器人发送到钉钉群,具有一定的参考价值,感兴趣的可以了解一下
2024-05-05
Pytorch之nn.Upsample()和nn.ConvTranspose2d()用法详解
nn.Upsample和nn.ConvTranspose2d是PyTorch中用于上采样的两种主要方法,nn.Upsample通过不同的插值方法（如nearest、bilinear）执行上采样,没有可学习的参数,适合快速简单的尺寸增加,而nn.ConvTranspose2d通过可学习的转置卷积核进行上采样
2024-10-10
基于PyQt5制作一个猜数字小游戏
这篇文章主要为大家介绍了如何用Python中的PyQt5模块制作一个带GUI的猜数字小游戏，文中的示例代码讲解详细，感兴趣的可以了解一下
2022-03-03
Python中UserWarning：The NumPy module was
在 Python 项目中,我们经常需要导入许多库来完成各种任务,NumPy 作为一个核心的科学计算库,被广泛应用于数据处理和分析,然而,有时我们会遇到 NumPy 重载的警告,本文将详细讲解这一警告的原因,并提供解决方案,需要的朋友可以参考下
2024-07-07
Python迭代用法实例教程
这篇文章主要介绍了Python迭代用法,包括了迭代的定义及具体用法,是一个非常实用的技巧,需要的朋友可以参考下
2014-09-09

python中urllib.request和requests的使用及区别详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具