Python爬虫学习之获取指定网页源码

 更新时间:2019年07月30日 14:43:42   作者:罗思洋  
这篇文章主要为大家详细介绍了Python爬虫学习之获取指定网页源码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了Python获取指定网页源码的具体代码,供大家参考,具体内容如下

1、任务简介

前段时间一直在学习Python基础知识,故未更新博客,近段时间学习了一些关于爬虫的知识,我会分为多篇博客对所学知识进行更新,今天分享的是获取指定网页源码的方法,只有将网页源码抓取下来才能从中提取我们需要的数据。

2、任务代码

Python获取指定网页源码的方法较为简单,我在Java中使用了38行代码才获取了网页源码(大概是学艺不精),而Python中只用了6行就达到了效果。

Python中获取网页源码最简单的方法就是使用urllib包,具体代码如下:

import urllib.request    #导入urllib.request库
b = str(input("请输入:"))  #提示用户输入信息,并强制类型转换为字符串型
a = urllib.request.urlopen(b)#打开指定网址
html = a.read()       #读取网页源码
html = html.decode("utf-8") #解码为unicode码
print(html)         #打印网页源码

我输入的网址是我博客主页的网址https://blog.csdn.net/lsylsy726

运行结果如下:


3、总结

这篇博客介绍的方法较为简单,其实有的网站会“反爬虫”,这时就需要我们使用User-Agent或者代理,这些东西都会在后面的博客中进行更新,我预计在后面博客中更新“读取CSDN博客访问量的小程序”和“有道翻译小程序”及其他更难一些的知识,由于刚开始学习爬虫,水平有限,请大家多多包涵。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • py-charm延长试用期限实例

    py-charm延长试用期限实例

    今天小编就为大家分享一篇py-charm延长试用期限实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Python合并ts文件至mp4格式及解密教程详解

    Python合并ts文件至mp4格式及解密教程详解

    m3u8准确来说是一种索引文件,使用m3u8文件实际上是通过它来解析对应的放在服务器上的视频网络地址,从而实现在线播放。本文给大家介绍Python合并ts文件至mp4格式及解密教程,需要的朋友参考下吧
    2021-07-07
  • Python 存储字符串时节省空间的方法

    Python 存储字符串时节省空间的方法

    这篇文章主要介绍了Python 存储字符串时节省空间的方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-04-04
  • django如何连接已存在数据的数据库

    django如何连接已存在数据的数据库

    这篇文章主要给大家介绍了关于django如何连接已存在数据的数据库的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用django具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-08-08
  • Python坐标线性插值应用实现

    Python坐标线性插值应用实现

    这篇文章主要介绍了Python坐标线性插值应用实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • Flask框架模板渲染操作简单示例

    Flask框架模板渲染操作简单示例

    这篇文章主要介绍了Flask框架模板渲染操作,结合实例形式分析了flask框架模板渲染与变量操作相关技巧,需要的朋友可以参考下
    2019-07-07
  • 聊聊Python中end=和sep=的区别

    聊聊Python中end=和sep=的区别

    这篇文章主要介绍了Python中end=和sep=的区别说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • Python纯代码通过神经网络实现线性回归的拟合方式

    Python纯代码通过神经网络实现线性回归的拟合方式

    这篇文章主要介绍了Python纯代码通过神经网络实现线性回归的拟合方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-05-05
  • python selenium参数详解和实现案例

    python selenium参数详解和实现案例

    这篇文章主要介绍了python selenium参数详解和实现案例,无头模式添加,可以让selenium模拟登录,进入到后台运行,本文以登录打开公司内网下载数据为例,给大家详细讲解,需要的朋友可以参考下
    2022-10-10
  • Django的models模型的具体使用

    Django的models模型的具体使用

    这篇文章主要介绍了Django的models模型的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07

最新评论