python3中编码获取网页的实例方法

 更新时间:2020年11月16日 08:34:01   作者:PYCN  
在本篇文章里小编给大家整理了一篇关于python3中编码获取网页的实例方法,有兴趣的朋友们可以学习下。

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用django自带的user做外键的方法

    使用django自带的user做外键的方法

    这篇文章主要介绍了使用django自带的user做外键的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Python version 2.7 required, which was not found in the registry

    Python version 2.7 required, which was not found in the regi

    这篇文章主要介绍了安装PIL库时提示错误Python version 2.7 required, which was not found in the registry问题的解决方法,需要的朋友可以参考下
    2014-08-08
  • Python抓取框架Scrapy爬虫入门:页面提取

    Python抓取框架Scrapy爬虫入门:页面提取

    Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改,下面这篇文章主要给大家介绍了关于Python抓取框架Scrapy爬虫入门之页面提取的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下。
    2017-12-12
  • Python+smtplib库实现邮件发送功能

    Python+smtplib库实现邮件发送功能

    这篇文章主要为大家详细介绍了Python如何通过smtplib库实现简单的邮件发送功能,文中的示例代码借鉴一下,有需要的小伙伴可以参考一下
    2025-02-02
  • Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程

    Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程

    Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛,框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便
    2021-11-11
  • 详解Python列表赋值复制深拷贝及5种浅拷贝

    详解Python列表赋值复制深拷贝及5种浅拷贝

    这篇文章主要介绍了Python列表赋值,复制,深拷贝以及5种浅拷贝详解,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-05-05
  • python3.8中关于sklearn问题(win10)

    python3.8中关于sklearn问题(win10)

    这篇文章主要介绍了python3.8中关于sklearn问题(win10),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • 如何用Python合并lmdb文件

    如何用Python合并lmdb文件

    这篇文章主要为大家详细介绍了如何用Python合并lmdb文件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07
  • 详解Python的Django框架中Manager方法的使用

    详解Python的Django框架中Manager方法的使用

    这篇文章主要介绍了Python的Django框架中Manager方法的使用,包括修改初始Manager QuerySets和增加额外的Manager方法等操作,需要的朋友可以参考下
    2015-07-07
  • matplotlib更改窗口图标的方法示例

    matplotlib更改窗口图标的方法示例

    这篇文章主要介绍了matplotlib更改窗口图标的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02

最新评论