Python实现爬取需要登录的网站完整示例

 更新时间:2017年08月19日 11:32:56   作者:罗兵  
这篇文章主要介绍了Python实现爬取需要登录的网站,结合完整实例形式分析了Python登陆网站及数据抓取相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python爬取需要登录的网站实现方法。分享给大家供大家参考,具体如下:

import requests
from lxml import html
# 创建 session 对象。这个对象会保存所有的登录会话请求。
session_requests = requests.session()
# 提取在登录时所使用的 csrf 标记
login_url = "https://bitbucket.org/account/signin/?next=/"
result = session_requests.get(login_url)
tree = html.fromstring(result.text)
authenticity_token = list(set(tree.xpath("//input[@name='csrfmiddlewaretoken']/@value")))[0]
payload = {
  "username": "<你的用户名>",
  "password": "<你的密码>",
  "csrfmiddlewaretoken": authenticity_token # 在源代码中,有一个名为 “csrfmiddlewaretoken” 的隐藏输入标签。
}
# 执行登录
result = session_requests.post(
  login_url,
  data = payload,
  headers = dict(referer=login_url)
)
# 已经登录成功了,然后从 bitbucket dashboard 页面上爬取内容。
url = 'https://bitbucket.org/dashboard/overview'
result = session_requests.get(
  url,
  headers = dict(referer = url)
)
# 测试爬取的内容
tree = html.fromstring(result.content)
bucket_elems = tree.findall(".//span[@class='repo-name']/")
bucket_names = [bucket.text_content.replace("n", "").strip() for bucket in bucket_elems]
print(bucket_names)

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • Python OpenCV学习之特征点检测与匹配详解

    Python OpenCV学习之特征点检测与匹配详解

    提取图像的特征点是图像领域中的关键任务,不管在传统还是在深度学习的领域中,特征代表着图像的信息,对于分类、检测任务都是至关重要的。这篇文章主要为大家详细介绍了OpenCV特征点检测与匹配,需要的可以参考一下
    2022-01-01
  • django如何通过类视图使用装饰器

    django如何通过类视图使用装饰器

    这篇文章主要介绍了django如何设计装饰器过滤黑名单,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • 十个简单使用的Python自动化脚本分享

    十个简单使用的Python自动化脚本分享

    今天小编给大家分享10个Python高级脚本,帮助我们减少无谓的时间浪费,提高工作学习中的效率。文中示例代码讲解详细,需要的可以参考一下
    2022-05-05
  • Golang GBK转UTF-8的例子

    Golang GBK转UTF-8的例子

    今天小编就为大家分享一篇Golang GBK转UTF-8的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • 如何利用pyinstaller打包Python程序为exe可执行文件

    如何利用pyinstaller打包Python程序为exe可执行文件

    这篇文章主要给大家介绍了关于如何利用pyinstaller打包Python程序为exe可执行文件的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • tensorflow获取变量维度信息

    tensorflow获取变量维度信息

    这篇文章主要为大家详细介绍了tensorflow获取变量维度信息,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • 深入理解python中实例方法的第一个参数self

    深入理解python中实例方法的第一个参数self

    在Python中,self 是类的实例方法的一个参数,代表类的实例对象本身,在本篇文章中,我们将深入探讨 self 的工作原理以及它在Python编程中的重要性,需要的可以参考下
    2023-09-09
  • python字符串编码解码的使用

    python字符串编码解码的使用

    在Python中,字符串的编码和解码操作可以通过字符串的encode()和decode()方法来实现,本文主要介绍了python字符串编码解码的使用,感兴趣的可以了解一下
    2023-12-12
  • Python易忽视知识点小结

    Python易忽视知识点小结

    这篇文章主要介绍了Python易忽视知识点,实例分析了Python中容易被忽视的常见操作技巧,需要的朋友可以参考下
    2015-05-05
  • Python爬取微信小程序Charles实现过程图解

    Python爬取微信小程序Charles实现过程图解

    这篇文章主要介绍了Python爬取微信小程序Charles实现过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-09-09

最新评论