Python使用urllib2模块抓取HTML页面资源的实例分享

 更新时间:2016年05月03日 17:58:27   作者:larry  
这篇文章主要介绍了Python使用urllib2模块抓取HTML页面资源的实例分享,将要抓取的页面地址写在单独的规则列表中方便组织和重复使用,需要的朋友可以参考下

先把要抓取的网络地址列在单独的list文件中

https://www.jb51.net/article/83440.html
https://www.jb51.net/article/83437.html
https://www.jb51.net/article/83430.html
https://www.jb51.net/article/83449.html

然后我们来看程序操作,代码如下:

#!/usr/bin/python

import os
import sys
import urllib2
import re

def Cdown_data(fileurl, fpath, dpath):
 if not os.path.exists(dpath):
  os.makedirs(dpath)
 try:
  getfile = urllib2.urlopen(fileurl) 
  data = getfile.read()
  f = open(fpath, 'w')
  f.write(data)
  f.close()
 except:
 print 

with open('u1.list') as lines:
 for line in lines:
  URI = line.strip()
  if '?' and '%' in URI:
   continue
 elif URI.count('/') == 2:
   continue
  elif URI.count('/') > 2:
   #print URI,URI.count('/')
  try:
    dirpath = URI.rpartition('/')[0].split('//')[1]
    #filepath = URI.split('//')[1].split('/')[1]
    filepath = URI.split('//')[1]
   if filepath:
     print URI,filepath,dirpath
     Cdown_data(URI, filepath, dirpath)
   except:
    print URI,'error'

相关文章

  • Python调用API接口实现人脸识别

    Python调用API接口实现人脸识别

    本文主要介绍了Python调用API接口实现人脸识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • Python时间戳与时间字符串互相转换实例代码

    Python时间戳与时间字符串互相转换实例代码

    这篇文章主要介绍了Python时间戳与时间字符串互相转换实例代码,大家参考使用
    2013-11-11
  • 聊聊python的gin库的介绍和使用

    聊聊python的gin库的介绍和使用

    gin像一个封装了参数配置的类,使用这个类将使得大量的参数配置变得简单清晰,本文重点给大家介绍python的gin库的介绍和使用,感兴趣的朋友跟随小编一起看看吧
    2021-04-04
  • 使用Python实现文本转语音(TTS)并播放音频

    使用Python实现文本转语音(TTS)并播放音频

    在开发涉及语音交互或需要语音提示的应用时,文本转语音(TTS)技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本转换为语音并播放音频文件吧
    2025-03-03
  • django models里数据表插入数据id自增操作

    django models里数据表插入数据id自增操作

    这篇文章主要介绍了django models里数据表插入数据id自增操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • Python使用pyexecjs代码案例解析

    Python使用pyexecjs代码案例解析

    这篇文章主要介绍了Python使用pyexecjs代码实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 浅谈Tensorflow模型的保存与恢复加载

    浅谈Tensorflow模型的保存与恢复加载

    本篇文章主要介绍了浅谈Tensorflow模型的保存与恢复加载,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-04-04
  • Matplotlib.pyplot 三维绘图的实现示例

    Matplotlib.pyplot 三维绘图的实现示例

    这篇文章主要介绍了Matplotlib.pyplot 三维绘图的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • Python中String模块示例详解

    Python中String模块示例详解

    string模块主要包含关于字符串的处理函数,这篇文章主要介绍了Python中String模块示例代码,代码简单易懂,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-12-12
  • Python中空格的转义字符方式

    Python中空格的转义字符方式

    这篇文章主要介绍了Python中空格的转义字符方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03

最新评论