python BeautifulSoup设置页面编码的方法

 更新时间:2015年04月03日 08:55:42   投稿:junjie  
这篇文章主要介绍了python BeautifulSoup设置页页编码的方法,本文直接给出代码救命,需要的朋友可以参考下

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

复制代码 代码如下:

import urllib2 
from BeautifulSoup import BeautifulSoup 
 
page = urllib2.urlopen('http://www.163.com'); 
soup = BeautifulSoup(page,from_encoding="gb2312") 
 
print soup.originalEncoding
print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么

相关文章

  • python实现高效的遗传算法

    python实现高效的遗传算法

    这篇文章主要介绍了python实现高效的遗传算法。想了解算法的同学,可以参考下
    2021-04-04
  • 对python中词典的values值的修改或新增KEY详解

    对python中词典的values值的修改或新增KEY详解

    今天小编就为大家分享一篇对python中词典的values值的修改或新增KEY详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python、PyCharm安装及使用方法(Mac版)详解

    Python、PyCharm安装及使用方法(Mac版)详解

    这篇文章主要为大家详细介绍了Mac版的Python、PyCharm安装及使用方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-04-04
  • Python学生信息管理系统修改版

    Python学生信息管理系统修改版

    这篇文章主要为大家详细介绍了python学生信息管理系统,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • python with statement 进行文件操作指南

    python with statement 进行文件操作指南

    在Python中,with关键字是一个替你管理实现上下文协议对象的好东西。例如:file等。在file的结束,会自动关闭该文件句柄。而这正是本文所需要的
    2014-08-08
  • Python接口自动化浅析Token应用原理

    Python接口自动化浅析Token应用原理

    本文主要介绍token基本概念、运行原理及在自动化中接口如何携带token进行访问,附含源码,内容非常详细易理解,有需要的朋友可以参考下
    2021-08-08
  • python如何计算圆的周长和面积

    python如何计算圆的周长和面积

    这篇文章主要介绍了python如何计算圆的周长和面积问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-07-07
  • 用Python将动态GIF图片倒放播放的方法

    用Python将动态GIF图片倒放播放的方法

    GIF(Graphics Interchange Format) 是一种可以用来呈现动画效果的图片格式,原理就是保存很多帧(Frame)静态图像,然后连续呈现。这篇文章主要介绍了用Python将动态GIF图片倒放播放的方法,需要的朋友可以参考下
    2016-11-11
  • 初步理解Python进程的信号通讯

    初步理解Python进程的信号通讯

    这篇文章主要介绍了初步理解Python进程的信号通讯,作者列举了Linux系统下的信号通讯示例,需要的朋友可以参考下
    2015-04-04
  • django中row语法详解

    django中row语法详解

    在Django模板中,使用{{ row }}语法可以输出列表row的所有元素,但是如果你想要输出列表中的某个元素,需要使用下标来访问它,这篇文章主要介绍了django中row语法详解,需要的朋友可以参考下
    2023-06-06

最新评论