python实现查询苹果手机维修进度
万恶的苹果,我的5s最近坏了,官方的零售店是根本就预约不到啊预约不到啊,所以只好去找授权维修点了,昨天送去之后人家说可能要返厂,周期大概20天左右,我直接就醉了,20天啊,快一个月啊,等手机到手都快清明了,fuck.今天下午无聊在网上搜了下看能不能查到维修进度,发现在苹果官网就可以查看,不过我的机子目测还没有送修,现在还查不到维修进度,趁着无聊没事干,写了个程序来即使的查看维修进度.
python的urllib2已经添加了对于cookie的支持,这对于抓取一些要登录的站点或者要设置cookie的站点很方便.
而且urllib2模块支持调试模式,可以看到你的程序向服务器发送的请求已经服务器返回的信息,这样就可以很方便的看清楚自己程序是否有问题.
好了,不说废话了,下面贴出代码
from bs4 import BeautifulSoup
import urllib2
import urllib
import cookielib
urllib2.urlopen('http://www.baidu.com').read()
baseurl='https://selfsolve.apple.com/repairstatus/GetRepairDetails.do'
headers = {
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Host':'selfsolve.apple.com',
'Origin':'https://selfsolve.apple.com',
'Referer':'https://selfsolve.apple.com/repairstatus/main.do',
'Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4',
'Cache-Control':'max-age=0',
'Connection':'keep-alive',
'Content-Length':45,
'Content-Type':'application/x-www-form-urlencoded',
'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36',
}
postData={
'repair_id':'aaaaaa',#维修序号
'serial_number':'bbbbb'#手机序列号
}
if __name__=='__main__':
cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(
cookie_support,
urllib2.HTTPHandler(debuglevel=1),
urllib2.HTTPSHandler(debuglevel=1)
)
urllib2.install_opener(opener)
StrpostData=urllib.urlencode(postData)
req=urllib2.Request(baseurl,StrpostData,headers)
rsp=urllib2.urlopen(req)
text=rsp.read()
file=open('repair.html','w')
file.write(text)
file.close()
print text
raw_input()
好了,程序就是这样子,上面说的添加cookie支持和开启调试模式就是下面这段代码
cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(
cookie_support,
urllib2.HTTPHandler(debuglevel=1),
urllib2.HTTPSHandler(debuglevel=1)
)
urllib2.install_opener(opener)
然后可以很方便的看到程序运行时候的输出,如下图
接下来就可以通过得到的html来抓取需要的信息了.
相关文章
python小巧而强大的网络爬虫工具Grab轻松抓取站点信息
Grab 是一个强大的 python 网络爬虫框架,由 Greg Lavr 开发,它能够让你轻松地从互联网上抓取所需的信息,Grab 基于 pycurl[1],是性能十分优越的一个 HTTP 客户端,由于采用了异步网络 I/O 模型,Grab 甚至可以并行处理数千个网络连接2024-01-01
最新评论