python抓取京东商城手机列表url实例代码

 更新时间:2013年12月18日 15:25:21   作者:  
python抓取京东商城手机列表url实例分享,大家参考使用吧

复制代码 代码如下:

#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5

@author: good-temper
'''

import urllib2
import bs4
import time

def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content

def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'

    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''

def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])

        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list

def analyzeContent(url):

    return ''

def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()

if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'

    writeToFile(list, u'E:\\jd_phone_list.dat');

相关文章

  • python爬虫获取多页天涯帖子

    python爬虫获取多页天涯帖子

    本篇文章通过爬取多页天涯帖子内容来教给大家深入理解python爬虫相关知识,有兴趣的参考学习下。
    2018-02-02
  • Jupyter Notebook/VSCode导出PDF中文不显示的解决

    Jupyter Notebook/VSCode导出PDF中文不显示的解决

    这篇文章主要介绍了Jupyter Notebook/VSCode导出PDF中文不显示的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • 对Python+opencv将图片生成视频的实例详解

    对Python+opencv将图片生成视频的实例详解

    今天小编就为大家分享一篇对Python+opencv将图片生成视频的实例详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python Pygame实战之打砖块小游戏

    Python Pygame实战之打砖块小游戏

    打砖块最早是由雅达利公司开发的一款独立游戏,也是无数人的童年记忆。本文将利用Python中的Pygame模块制作经典的打砖块游戏,需要的可以参考一下
    2022-02-02
  • Python使用pandasai实现数据分析

    Python使用pandasai实现数据分析

    本文主要介绍了Python使用pandasai实现数据分析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • Python的面向对象思想分析

    Python的面向对象思想分析

    这篇文章主要介绍了Python的面向对象思想分析,以实例形式较为详细的分析了封装,继承,多态的具体用法,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-01-01
  • 在python image 中安装中文字体的实现方法

    在python image 中安装中文字体的实现方法

    今天小编大家分享一篇在python image 中安装中文字体的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • Django实现翻页的示例代码

    Django实现翻页的示例代码

    翻页是经常使用的功能,Django提供了翻页器。用Django的Paginator类实现,有需要了解Paginator类用法的朋友可参考。希望此文章对各位有所帮助
    2021-05-05
  • Python用栈实现队列的基本操作

    Python用栈实现队列的基本操作

    队列(Queue)和栈(Stack)是常见的数据结构,它们在计算机科学中有着广泛的应用,在Python中,可以使用列表(List)来实现栈,但要用栈来实现队列需要一些巧妙的操作,本文就给大家详细介绍一下Python中如何用栈实现队列,需要的朋友可以参考下
    2023-11-11
  • Python写的贪吃蛇游戏例子

    Python写的贪吃蛇游戏例子

    这篇文章主要介绍了Python写的贪吃蛇游戏例子,练手作品,又好玩又可以学到东西,需要的朋友可以参考下
    2014-06-06

最新评论