python通过pillow识别动态验证码的示例代码

 更新时间:2021年11月23日 15:40:08   作者:香博士  
在上网时,经常会遇到验证码,本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。感兴趣的可以了解一下

生活中,我们在登录微博,邮箱的时候,常常会碰到验证码。在工作时,如果想要爬取一些数据,也会碰到验证码的阻碍。本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。

环境配置

  • Python 2.7
  • Pillow 模块

有个问题就是python2.7目前只能让使用到2020年,现在再利用2.7下载好多东西都会报错,也该是时候更新到python3.7了,本文还是依赖于2.7的环境。

在这里插入图片描述

识别验证码的代码下载地址:python_captcha_jb51.rar

 安装 pillow(PIL)库

sudo apt-get update
sudo apt-get install python-dev libtiff5-dev libjpeg8-dev zlib1g-dev libfreetype6-dev liblcms2-dev libwebp-dev tcl8.6-dev tk8.6-dev python-tk
sudo pip2 install pillow

识别过程

将验证码文件python_captcha下载到运行目录下,解压后,在 python_captcha 目录新建 crack.py 文件,进行编辑。

#-*- coding:utf8 -*-
from PIL import Image

im = Image.open("captcha.gif")
#(将图片转换为8位像素模式)
im.convert("P")

# 打印颜色直方图
print im.histogram()

输出:

在这里插入图片描述

颜色直方图的每一位数字都代表了在图片中含有对应位的颜色的像素的数量。

每个像素点可表现 256 种颜色,你会发现白点是最多(白色序号 255 的位置,也就是最后一位,可以看到,有 625 个白色像素)。红像素在序号 200 左右,我们可以通过排序,得到有用的颜色。

his = im.histogram()
values = {}

for i in range(256):
    values[i] = his[i]

for j,k in sorted(values.items(),key=lambda x:x[1],reverse = True)[:10]:
    print j, k

输出:

在这里插入图片描述

我们得到了图片中最多的 10 种颜色,其中 220 与 227 才是我们需要的红色和灰色,可以通过这一讯息构造一种黑白二值图片。

#-*- coding:utf8 -*-
from PIL import Image

im = Image.open("captcha.gif")
im.convert("P")
im2 = Image.new("P",im.size,255)


for x in range(im.size[1]):
    for y in range(im.size[0]):
        pix = im.getpixel((y,x))
        if pix == 220 or pix == 227: # these are the numbers to get
            im2.putpixel((y,x),0)

im2.show()

输出:

在这里插入图片描述

局限及遇到的问题

#-*- coding:utf8 -*-

此行命令流在windows环境下运行会报错,具体原因可参考python(2)中文编码乱码问题

该命令流有很大的局限性,识别的动态代买也只有此类:

在这里插入图片描述

到此这篇关于python通过pillow识别动态验证码的示例代码的文章就介绍到这了,更多相关python pillow识别动态验证码内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python脚本文件打包成可执行文件的方法

    Python脚本文件打包成可执行文件的方法

    这篇文章主要介绍了Python脚本文件打包成可执行文件的方法,本主要讲解了Python2.X版本的打包方法,对Python3.X的打包也有简单介绍,需要的朋友可以参考下
    2015-06-06
  • Python 高级变量之字典和字符串详解

    Python 高级变量之字典和字符串详解

    这篇文章主要为大家介绍了Python 字典和字符串,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • 如何将一个CSV格式的文件分割成两个CSV文件

    如何将一个CSV格式的文件分割成两个CSV文件

    这篇文章主要介绍了如何将一个CSV格式的文件分割成两个CSV文件,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • Python字符串格式化输出方法分析

    Python字符串格式化输出方法分析

    这篇文章主要介绍了Python字符串格式化输出方法,结合实例形式分析了Python格式化构建字符串的三种常用技巧,需要的朋友可以参考下
    2016-04-04
  • 使用pytorch 筛选出一定范围的值

    使用pytorch 筛选出一定范围的值

    这篇文章主要介绍了使用pytorch 筛选出一定范围的值,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • python中二维阵列的变换实例

    python中二维阵列的变换实例

    这篇文章主要介绍了python中二维阵列的变换实例,通过对比两种不同的方法分析了二维阵列变换的实现方法,需要的朋友可以参考下
    2014-10-10
  • python中偏函数partial用法实例分析

    python中偏函数partial用法实例分析

    这篇文章主要介绍了python中偏函数partial用法,实例分析了偏函数partial的功能、定义及使用方法,需要的朋友可以参考下
    2015-07-07
  • Python3数据库操作包pymysql的操作方法

    Python3数据库操作包pymysql的操作方法

    这篇文章主要介绍了Python3数据库操作包pymysql的操作方法,文章通过实例代码相结合给大家介绍的非常详细,需要的朋友可以参考下
    2018-07-07
  • Tensor和NumPy相互转换的方法

    Tensor和NumPy相互转换的方法

    本文主要介绍了Tensor和NumPy相互转换的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • 在Python中处理字符串之ljust()方法的使用简介

    在Python中处理字符串之ljust()方法的使用简介

    这篇文章主要介绍了在Python中处理字符串之ljust()方法的使用,是Python学习中的基础知识,需要的朋友可以参考下
    2015-05-05

最新评论