python抓取京东商城手机列表url实例代码

 更新时间:2013年12月18日 15:25:21   作者:  
python抓取京东商城手机列表url实例分享,大家参考使用吧

复制代码 代码如下:

#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5

@author: good-temper
'''

import urllib2
import bs4
import time

def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content

def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'

    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''

def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])

        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list

def analyzeContent(url):

    return ''

def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()

if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'

    writeToFile(list, u'E:\\jd_phone_list.dat');

相关文章

  • Windows下pycharm创建Django 项目(虚拟环境)过程解析

    Windows下pycharm创建Django 项目(虚拟环境)过程解析

    这篇文章主要介绍了Windows下pycharm创建Django 项目(虚拟环境)过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • Python 里最强的地图绘制神器

    Python 里最强的地图绘制神器

    这篇文章主要介绍了Python 里最强的地图绘制神器,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-03-03
  • Python 使用threading+Queue实现线程池示例

    Python 使用threading+Queue实现线程池示例

    今天小编就为大家分享一篇Python 使用threading+Queue实现线程池示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • 浅谈matplotlib默认字体设置探索

    浅谈matplotlib默认字体设置探索

    这篇文章主要介绍了matplotlib默认字体设置探索,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python实现学员管理系统

    python实现学员管理系统

    这篇文章主要为大家详细介绍了python实现学员管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-02-02
  • Python中Pyspider爬虫框架的基本使用详解

    Python中Pyspider爬虫框架的基本使用详解

    这篇文章主要介绍了Python中Pyspider爬虫框架的基本使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • Python脚本启动应用并输入账号或密码的操作命令

    Python脚本启动应用并输入账号或密码的操作命令

    这篇文章主要介绍了Python脚本启动应用并输入账号或密码,安装所需要的模块pyautogui、subprocess、psutil等,可以通过pip安装,下面以安装pyautogui为例cmd命令行中输入,需要的朋友可以参考下
    2024-05-05
  • Python的函数使用详解

    Python的函数使用详解

    大家好,本篇文章主要讲的是Python的函数使用详解,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2021-12-12
  • 解决Python 写文件报错TypeError的问题

    解决Python 写文件报错TypeError的问题

    这篇文章主要介绍了解决Python 写文件报错TypeError的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-10-10
  • matplotlib绘制正余弦曲线图的实现

    matplotlib绘制正余弦曲线图的实现

    这篇文章主要介绍了matplotlib绘制正余弦曲线图的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02

最新评论