python urllib爬取百度云连接的实例代码

 更新时间:2017年06月19日 10:22:35   作者:baddog_  
本篇文章主要介绍了python urllib爬取百度云连接的实例代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 对python 通过ssh访问数据库的实例详解

    对python 通过ssh访问数据库的实例详解

    今天小编就为大家分享一篇对python 通过ssh访问数据库的实例详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • Python虚拟环境安装及操作命令详解

    Python虚拟环境安装及操作命令详解

    本文主要介绍了Python虚拟环境安装及操作命令详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • python如何获取列表中每个元素的下标位置

    python如何获取列表中每个元素的下标位置

    这篇文章主要介绍了python如何获取列表中每个元素的下标位置,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • python栈的基本定义与使用方法示例【初始化、赋值、入栈、出栈等】

    python栈的基本定义与使用方法示例【初始化、赋值、入栈、出栈等】

    这篇文章主要介绍了python栈的基本定义与使用方法,结合实例形式分析了Python栈的初始化、赋值、入栈、出栈等相关操作技巧,需要的朋友可以参考下
    2019-10-10
  • 使用Python给Excel工作表设置背景色或背景图

    使用Python给Excel工作表设置背景色或背景图

    Excel是工作中数据处理和分析数据的重要工具,面对海量的数据和复杂的表格,如何提高工作效率、减少视觉疲劳并提升数据的可读性是不容忽视的问题,而给工作表设置合适的背景是表格优化的一个有效方式,本文将介绍如何用Python给Excel工作表设置背景色或背景图
    2024-07-07
  • PyCharm配置KBEngine快速处理代码提示冲突、配置命令问题

    PyCharm配置KBEngine快速处理代码提示冲突、配置命令问题

    这篇文章主要介绍了PyCharm配置KBEngine,解决代码提示冲突、配置命令,本文通过图文并茂的形式给大家介绍的超详细,需要的朋友可以参考下
    2021-04-04
  • Python开发中常用操作方法代码汇总笔记

    Python开发中常用操作方法代码汇总笔记

    Python具有易学、易用、易扩展、可移植性强等特点,被广泛应用于数据分析、人工智能、Web开发、自动化测试等领域。Python在使用过程中也会遇到一些常见技术问题,本文汇总Python开发中实用操作方法代码笔记。
    2023-06-06
  • 9种python web 程序的部署方式小结

    9种python web 程序的部署方式小结

    python有很多web 开发框架,代码写完了,部署上线是个大事,通常来说,web应用一般是三层结构web server ---->application -----> DB server
    2014-06-06
  • python 字符串常用方法超详细梳理总结

    python 字符串常用方法超详细梳理总结

    字符串是Python中基本的数据类型,几乎在每个Python程序中都会使用到它。本文为大家总结了Python中必备的31个字符串方法,需要的可以参考一下
    2022-03-03
  • Python中matplotlib如何改变画图的字体

    Python中matplotlib如何改变画图的字体

    这篇文章主要介绍了Python中matplotlib如何改变画图的字体,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08

最新评论