python爬虫获取百度首页内容教学

 更新时间:2018年12月23日 09:19:37   作者:1002002100a  
在本篇内容里小编给大家分享了关于python爬虫获取百度首页内容教学,需要的朋友们可以跟着学习下。

由传智播客教程整理,我们这里使用的是python2.7.x版本,就是2.7之后的版本,因为python3的改动略大,我们这里不用它。现在我们尝试一下url和网络爬虫配合的关系,爬浏览器首页信息。

1、首先我们创建一个urllib2_test01.py,然后输入以下代码:

2、最简单的获取一个url的信息代码居然只需要4行,执行写的python代码:

3、之后我们会看到一下的结果

4、

实际上,如果我们在浏览器上打开网页主页的话,右键选择“查看源代码”,你会发现,跟我们刚打印出来的是一模一样的。也就是说,上面的4行代码就已经帮我们把百度的首页和全部代码爬了下来了 。

5、下面我们介绍一下这四行代码,第一行如下图,这个就是将urllib2组件进入进来,供给我们使用。

6、图片下面这步骤是调用urllib2库中的urlopen方法,该方法接受一个url地址,然后将请求后的得到的回应封装到一个叫respones对象当中。

7、最后这里,是调用response对象的read()方法,将请求的回应内容以字符串的形式给html变量。最后的print html就是将字符串打出来,所以说一个基本的url请求是对应的python代码是很简单的。

总结:以上就是关于利用python爬虫获取百度信息的步骤内容,感谢大家的学习和对脚本之家的支持。

相关文章

  • python变量的作用域是什么

    python变量的作用域是什么

    在本篇内容里小编给大家分享了关于python变量的作用域的实例及用法,有兴趣的朋友们可以学习下。
    2020-05-05
  • 实例讲解Python中浮点型的基本内容

    实例讲解Python中浮点型的基本内容

    在本文里小编给大家整理了关于Python中浮点型的基本知识点内容,有兴趣的朋友们学习下。
    2019-02-02
  • Python使用pickle模块储存对象操作示例

    Python使用pickle模块储存对象操作示例

    这篇文章主要介绍了Python使用pickle模块储存对象操作,结合实例形式分析了Python使用pickle模块针对文件读写与转换的相关操作技巧,需要的朋友可以参考下
    2018-08-08
  • Python中的heapq模块解析

    Python中的heapq模块解析

    这篇文章主要介绍了Python中的heapq模块解析,heapq模块是Python标准库中的一个模块,用于实现堆队列(heapq)数据结构,它提供了一种方便的方式来实现堆排序等算法,需要的朋友可以参考下
    2023-09-09
  • 用Python把csv文件批量修改编码为UTF-8格式并转为Excel格式的方法

    用Python把csv文件批量修改编码为UTF-8格式并转为Excel格式的方法

    有时候用excel打开一个csv文件,中文全部显示乱码,然后手动用notepad++打开,修改编码为utf-8并保存后,再用excel打开显示正常,本文将给大家介绍一下用Python把csv文件批量修改编码为UTF-8格式并转为Excel格式的方法,需要的朋友可以参考下
    2023-09-09
  • Python Django 封装分页成通用的模块详解

    Python Django 封装分页成通用的模块详解

    这篇文章主要介绍了Python Django 封装分页成通用的模块详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python更新所有已安装包的操作

    Python更新所有已安装包的操作

    今天小编就为大家分享一篇Python更新所有已安装包的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python将主机名转换为IP地址的方法

    Python将主机名转换为IP地址的方法

    今天小编就为大家分享一篇Python将主机名转换为IP地址的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • python高级特性简介

    python高级特性简介

    这篇文章主要介绍了python高级特性的相关内容,其中包括切片,迭代,列表生成式,生成器,迭代器,感兴趣的朋友可以了解下
    2020-08-08
  • Python3如何解决字符编码问题详解

    Python3如何解决字符编码问题详解

    字符串是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。下面这篇文章主要给大家介绍了关于Python3如何解决字符编码问题的相关资料,文中介绍的还是相对比较详细的,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-04-04

最新评论