python基于BeautifulSoup实现抓取网页指定内容的方法
更新时间:2015年07月09日 10:12:50 作者:光索与诺
这篇文章主要介绍了python基于BeautifulSoup实现抓取网页指定内容的方法,涉及Python使用BeautifulSoup模块解析html网页的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
本文实例讲述了python基于BeautifulSoup实现抓取网页指定内容的方法。分享给大家供大家参考。具体实现方法如下:
# _*_ coding:utf-8 _*_
#xiaohei.python.seo.call.me:)
#win+python2.7.x
import urllib2
from bs4 import BeautifulSoup
def jd(url):
page = urllib2.urlopen(url)
html_doc = page.read()
soup = BeautifulSoup(html_doc.decode('gb2312','ignore'))
for i in soup.find_all('div', id="sortlist"):
one = i.find_all('a')
two = i.find_all('li')
print ("%s %s" % (one,two))
jd("http://channel.jd.com/computer.html")
希望本文所述对大家的Python程序设计有所帮助。
相关文章
python email smtplib模块发送邮件代码实例
本篇文章给大家分享了python email smtplib模块发送邮件的相关代码分享,有需要的朋友参考学习下。2018-04-04
Python进阶学习之pandas中read_csv()用法详解
python中数据处理是比较方便的,经常用的就是读写文件,提取数据等,本文主要介绍其中的一些用法,这篇文章主要给大家介绍了关于Python进阶学习之pandas中read_csv()用法的相关资料,需要的朋友可以参考下2024-03-03
react中useLayoutEffect 和useEffect区别
本文主要介绍了react中useLayoutEffect 和useEffect区别,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下2021-12-12


最新评论