python实现网页链接提取的方法分享
更新时间:2014年02月25日 10:11:33 作者:
这篇文章主要介绍了python实现的网页链接提取的方法,需要的朋友可以参考下
复制代码 代码如下:
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
port=socket.getservbyname(servname)
s.connect((host,port))
return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
相关文章
python 办公自动化——基于pyqt5和openpyxl统计符合要求的名单
前几天接到的一个需求,因为学校给的名单是青年大学习已学习的名单,然而要知道未学习的名单只能从所有团员中再排查一次,过程相当麻烦。刚好我也学过一些操作办公软件的基础,再加上最近在学pyqt5,所以我决定用python写个自动操作文件的脚本给她用用。2021-05-05


最新评论