Python3爬虫之urllib携带cookie爬取网页的方法

 更新时间:2018年12月28日 11:49:52   作者:haeasringnar  
今天小编就为大家分享一篇Python3爬虫之urllib携带cookie爬取网页的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python使用openpyxl库处理Excel文件详细教程

    python使用openpyxl库处理Excel文件详细教程

    这篇文章主要给大家介绍了关于python使用openpyxl库处理Excel文件详细教程的相关资料,openpyxl属于第三方模块,在python中用来处理excel文件,可以对excel进行的操作有读写、修改、调整样式及插入图片等,需要的朋友可以参考下
    2023-11-11
  • Python学习之异常中的finally使用详解

    Python学习之异常中的finally使用详解

    这篇文章主要为大家介绍一下Python异常语法中的另一个成员—finally,通过学习finally,可以帮助我们更好的处理异常,快来跟随小编一起学习一下吧
    2022-03-03
  • 利用Python绘制虎年烟花秀

    利用Python绘制虎年烟花秀

    2022虎年新年即将来临,小编为大家带来了一个利用Python编写的虎年烟花特效,文中的示例代码简洁易懂,感兴趣的同学可以动手试一试
    2022-01-01
  • 解决Django的request.POST获取不到内容的问题

    解决Django的request.POST获取不到内容的问题

    今天小编就为大家分享一篇解决Django的request.POST获取不到内容的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • Python版的文曲星猜数字游戏代码

    Python版的文曲星猜数字游戏代码

    最近开始研究python,于是写了个Python版的文曲星猜数字游戏,喜欢的朋友可以参考下
    2013-09-09
  • 详细解读tornado协程(coroutine)原理

    详细解读tornado协程(coroutine)原理

    这篇文章主要介绍了详细解读tornado协程(coroutine)原理,涉及协程定义,生成器和yield语义,Future对象,ioloop对象,函数装饰器coroutine等相关内容,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • 基于pytorch中的Sequential用法说明

    基于pytorch中的Sequential用法说明

    这篇文章主要介绍了基于pytorch中的Sequential用法说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python(PyS60)实现简单语音整点报时

    Python(PyS60)实现简单语音整点报时

    这篇文章主要为大家详细介绍了Python(PyS60)实现简单语音整点报时,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-11-11
  • python3实现SMTP发送邮件详细教程

    python3实现SMTP发送邮件详细教程

    这篇文章主要为大家详细介绍了python3实现SMTP发送邮件的详细教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • python执行shell脚本的四种方法

    python执行shell脚本的四种方法

    在Python中提供了很多的方法可以调用并执行shell脚本,本文主要介绍了python执行shell脚本的四种方法,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06

最新评论