用Python下载一个网页保存为本地的HTML文件实例

 更新时间:2018年05月21日 14:26:06   作者:麦克斯韦的妖精  
今天小编就为大家分享一篇用Python下载一个网页保存为本地的HTML文件实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。

比如我们要下载山东大学新闻网的一个页面,该网页如下:

实现代码如下:

import urllib.request

def getHtml(url):
 html = urllib.request.urlopen(url).read()
 return html

def saveHtml(file_name, file_content):
 # 注意windows文件命名的禁用符,比如 /
 with open(file_name.replace('/', '_') + ".html", "wb") as f:
  # 写文件用bytes而不是str,所以要转码
  f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)

print("下载成功")

打开相应的目录可以看到这个网页已经被下载保存成功了

我们用浏览器打开这个网页文件如下

由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。

以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python区块链简易版交易实现示例

    python区块链简易版交易实现示例

    这篇文章主要为大家介绍了python区块链简易版交易实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 有关pycharm登录github时有的时候会报错connection reset的问题

    有关pycharm登录github时有的时候会报错connection reset的问题

    这篇文章主要介绍了有关pycharm登录github时有的时候会报错connection reset的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-09-09
  • Python函数式编程模块functools的使用与实践

    Python函数式编程模块functools的使用与实践

    本文主要介绍了Python函数式编程模块functools的使用与实践,教你如何使用 functools.partial、functools.wraps、functools.lru_cache 和 functools.reduce,感兴趣的可以了解一下
    2024-03-03
  • Python实现计算圆周率π的值到任意位的方法示例

    Python实现计算圆周率π的值到任意位的方法示例

    这篇文章主要介绍了Python实现计算圆周率π的值到任意位的方法,简单分析了圆周率的计算原理,并结合实例形式分析了Python计算圆周率的相关操作技巧,需要的朋友可以参考下
    2018-05-05
  • Python Pycharm虚拟下百度飞浆PaddleX安装报错问题及处理方法(亲测100%有效)

    Python Pycharm虚拟下百度飞浆PaddleX安装报错问题及处理方法(亲测100%有效)

    最近很多朋友给小编留言在安装PaddleX的时候总是出现各种奇葩问题,不知道该怎么处理,今天小编通过本文给大家介绍下Python Pycharm虚拟下百度飞浆PaddleX安装报错问题及处理方法,真的有效,遇到同样问题的朋友快来参考下吧
    2021-05-05
  • python中dot函数运算过程总结

    python中dot函数运算过程总结

    dot函数为numpy库下的一个函数,主要用于矩阵的乘法运算,其中包括:向量内积、多维矩阵乘法和矩阵与向量的乘法,下面这篇文章主要给大家介绍了关于python中dot函数运算过程的相关资料,需要的朋友可以参考下
    2022-09-09
  • Python多线程编程(六):可重入锁RLock

    Python多线程编程(六):可重入锁RLock

    这篇文章主要介绍了Python多线程编程(六):可重入锁RLock,本文直接给出使用实例,然后讲解如何使用RLock避免死锁,需要的朋友可以参考下
    2015-04-04
  • python正则表达式实现自动化编程

    python正则表达式实现自动化编程

    这篇文章主要介绍了python正则表达式实现自动化编程,re模块的compile()方法是构成正则表达式的方法,向compile()传入一个字符串表示正则表达式,该方法返回一个Regex模式的对象,需要的朋友可以参考下
    2023-01-01
  • python 爬虫如何实现百度翻译

    python 爬虫如何实现百度翻译

    这篇文章主要介绍了python 爬虫 简单实现百度翻译的示例,帮助大家更好的理解和使用python 爬虫,感兴趣的朋友可以了解下
    2020-11-11
  • TensorFlow变量管理详解

    TensorFlow变量管理详解

    这篇文章主要为大家详细介绍了TensorFlow变量管理的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03

最新评论