python模拟登陆网站的示例

更新时间：2021年03月15日 15:59:07 作者：可爱的黑精灵

这篇文章主要介绍了python模拟登陆网站的示例，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下

使用已有cookie登陆

使用浏览器登陆，获取浏览器中的cookie信息，来进行登陆。

我们以博客园为例，先登录博客园账号。我们访问随笔列表，在控制台我们可以看到我们登陆后浏览器的cookie

剔除一些数据统计及分析的cookie，剩下的就是登陆可能需要的.CNBlogsCookie和.Cnblogs.AspNetCore.Cookies

# _ga google分析 cookie
# UM_distinctid 友盟cookie
# CNZZxxx CNZZcookie
# __utma,__utmc,__utmz google统计网站
# Hm_lvt_xxx 百度统计网站

import urllib.request

url = 'https://i.cnblogs.com/posts'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

#浏览器登录后得到的cookie，也就是刚才复制的字符串
cookie_str = '.CNBlogsCookie=xxx; .Cnblogs.AspNetCore.Cookies=xxx'

headers = {
 'User-Agent': user_agent,
 'cookie':cookie_str
}

req = urllib.request.Request(url,headers=headers)
resp = urllib.request.urlopen(req).read().decode('utf-8')

print(resp)

登陆获取cookie

登陆的表单一般是使用的form data，现在也有些表单使用request payload使用json格式传参。

form data如药智网

request payload如博客园

form data

博客园的登陆需要拖动验证所以略过。我们以药智网为例，我们打开控制台可以看到登陆需要传的表单参数，这里是使用的form data表单。我们模拟登陆后获取到登陆后的cookie，然后访问登录后的个人中心页面。

import urllib.request
import http.cookiejar

url = 'https://www.yaozh.com/login'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

# formData数据
data = {'username': '用户名',
  'pwd': '密码',
  'formhash': 'C3086BBA84',
  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}

post_data = urllib.parse.urlencode(data).encode('utf-8')

# 请求头设置
headers = {
 'User-Agent': user_agent
}

# 构造登陆请求
req = urllib.request.Request(url, headers=headers, data=post_data)

# cookie
cookie = http.cookiejar.CookieJar()

# 构造一个opener携带登录后的cookie
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))

# 发送登陆请求
resp = opener.open(req)

print(resp)

# 登录后个人中心
url = 'https://www.yaozh.com/member/'

# 构造访问请求
req = urllib.request.Request(url, headers=headers)

resp = opener.open(req).read().decode('utf-8')

print(resp)

request payload

如果登陆需要request payload我们需要将参数转为json字符串并在头部设置Content-Type

import json
...

data = {'loginType': '1',
  'pwdOrVerifyCode': '密码',
  'userIdentification': '账号',
  'uaToken': '',
  'webUmidToken':''}

headers = {
 'Content-Type': 'application/json;charset=UTF-8',
 'User-Agent': user_agent
}


req = urllib.request.Request(url, headers=headers, data=json.dumps(data))
...

登陆后用session保持登陆状态

我们用requests模块的Session对象来保存回话信息

import requests

url = 'https://www.yaozh.com/login'

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'

# formData数据
data = {'username': 'chenjy1225',
  'pwd': '19931225yjy',
  'formhash': 'C3086BBA84',
  'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}


#构造Session
session = requests.Session()

# 发送post请求
resp = session.post(url, data)

# 登录后个人中心
url = 'https://www.yaozh.com/member/'

# 发送请求访问个人中心
resp = session.get(url).content.decode('utf-8')

print(resp)

调用浏览器登陆

我们也可以在程序中调用一个浏览器来访问登陆网站。在python中使用Selenium库就能轻松实现调用浏览器，被控制的浏览器可以是chrome、firefox等。
以前较常用的还是PhantomJS但是PhantomJS被python弃用了。

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '

firefox对应的geckodriver

chrome对应的chrnpm.taobao.org/mirrors/chromedriveromedriver

1.下载Selenium、firefox浏览器及firefox驱动。

2.将下载的firefox驱动geckodriver放在firefox浏览器安装目录

3.将firefox浏览器安装目录添加到path中

4.重启ide

我们找到需要登陆时候输入的元素id及登陆button id。

from selenium import webdriver
import time

# 新建selenium浏览器对象，后面是geckodriver.exe下载后本地路径
browser = webdriver.Firefox()

url = 'https://www.yaozh.com/login'

# 浏览器访问登录页面
browser.get(url)

# 等待3s用于加载脚本文件
browser.implicitly_wait(3)

# 输入用户名
username = browser.find_element_by_id('username')
username.send_keys('chenjy1225')

# 输入密码
password = browser.find_element_by_id('pwd')
password.send_keys('19931225yjy')

# 点击登录按钮
login_button = browser.find_element_by_id('button')
login_button.submit()

# 网页截图
browser.save_screenshot('screenshot.png')

# 强制等待5s，等待登录后的跳转
time.sleep(5)

url = 'https://www.yaozh.com/member/'

browser.get(url)

# 网页截图个人中心
browser.save_screenshot('screenshot1.png')

# 关闭浏览器
browser.quit()

screenshot.png：

screenshot1.png：

以上就是python模拟登陆网站的示例的详细内容，更多关于python模拟登陆网站的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python读取DataFrame的某行或某列的方法实现
Dataframe是Python中一种重要的数据处理工具,它能够以表格形式存储并处理数据,本文主要介绍了Python读取DataFrame的某行或某列的方法实现,具有一定的参考价值,感兴趣的可以了解一下
2024-04-04
基于PyQT5制作一个课堂点名系统
这篇文章主要为大家介绍一个基于PyQt5实现的抖音同款课堂点名系统，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起动手试一试
2022-02-02
python中数组array和列表list的基本用法及区别解析
大家都知道数组array是同类型数据的有限集合，列表list是一系列按特定顺序排列的元素组成，可以将任何数据放入列表，且其中元素之间没有任何关系，本文介绍python中数组array和列表list的基本用法及区别，感兴趣的朋友一起看看吧
2022-05-05
详解python多线程之间的同步(一)
这篇文章主要介绍了python多线程之间的同步，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-04-04
Python中类的初始化特殊方法
本文给大家介绍一下Python中类才初始化时候的特殊方法，通过实例给大家做了分析，一起来学习下。
2017-12-12
Python 绘制北上广深的地铁路线动态图
这篇文章主要介绍了用python制作北上广深——地铁线路动态图，文中的示例代码讲解详细，对我们的工作或学习都有一定的价值，感兴趣的同学可以学习一下
2021-12-12
Python3.5编程实现修改IIS WEB.CONFIG的方法示例
这篇文章主要介绍了Python3.5编程实现修改IIS WEB.CONFIG的方法,涉及Python针对xml格式文件的读写以及节点操作相关技巧,需要的朋友可以参考下
2017-08-08
python中如何打包用户自定义模块
在本篇文章里小编给大家整理的是一篇关于python中如何打包用户自定义模块的相关文章，有兴趣的朋友们可以参考下。
2020-09-09
Python使用Pygame实现时钟效果
这篇文章主要为大家详细介绍了Python使用Pygame实现时钟效果，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-08-08
pycharm找不到conda可执行文件怎么解决
这篇文章主要给大家介绍了关于pycharm找不到conda可执行文件怎么解决的相关资料,文中通过图文介绍非常的详细,对大家的学习或者工作具有一的参考学习价值,需要的朋友可以参考下
2023-07-07