python验证码识别教程之利用投影法、连通域法分割图片

更新时间：2018年06月04日 11:24:50 作者：Hi!Roy!

这篇文章主要给大家介绍了关于python验证码识别教程之利用投影法、连通域法分割图片的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起看看吧

前言

今天这篇文章主要记录一下如何切分验证码，用到的主要库就是Pillow和Linux下的图像处理工具GIMP。首先假设一个固定位置和宽度、无粘连、无干扰的例子学习一下如何使用Pillow来切割图片。

使用GIMP打开图片后，按加号放大图片，然后点击View->Show Grid来显示网格线：

其中，每个正方形边长为10像素，所以数字1切割坐标为左20、上20、右40、下70。以此类推可以知道剩下3个数字的切割位置。

代码如下：

from PIL import Image
p = Image.open("1.png")
# 注意位置顺序为左、上、右、下
cuts = [(20,20,40,70),(60,20,90,70),(100,10,130,60),(140,20,170,50)]
for i,n in enumerate(cuts,1):
 temp = p.crop(n) # 调用crop函数进行切割
 temp.save("cut%s.png" % i)

切割后得到4张图片：

那么，如果字符位置不固定怎么办呢？现在假设一种随机位置宽度、无粘连、无干扰线的情况。

第一种方法，也是最简单的方法叫做”投影法”。原理就是将二值化后的图片在竖直方向进行投影，根据投影后的极值来判断分割边界。这里我依然使用上面的验证码图片来进行演示：

def vertical(img):
 """传入二值化后的图片进行垂直投影"""
 pixdata = img.load()
 w,h = img.size
 ver_list = []
 # 开始投影
 for x in range(w):
 black = 0
 for y in range(h):
  if pixdata[x,y] == 0:
  black += 1
 ver_list.append(black)
 # 判断边界
 l,r = 0,0
 flag = False
 cuts = []
 for i,count in enumerate(ver_list):
 # 阈值这里为0
 if flag is False and count > 0:
  l = i
  flag = True
 if flag and count == 0:
  r = i-1
  flag = False
  cuts.append((l,r))
 return cuts

p = Image.open('1.png')
b_img = binarizing(p,200)
v = vertical(b_img)

通过vertical函数我们就得到了一个包含所有黑色像素在X轴上投影后左右边界的位置。由于验证码没有任何干扰，所以我的阈值设定为0。关于binarizing函数可以参考上一篇文章

输出如下：

[(21, 37), (62, 89), (100, 122), (146, 164)]

可以看到，投影法给出左右边界和我们手工查看得到很接近。对于上下边界，偷懒的可以直接使用0和图片的高度，也可以在水平方向进行投影，这里有兴趣的小伙伴可以自己尝试。

但是，对于字符间有粘连的情况，投影法就会出现拆分错误，比如上篇文章中的：

修改阈值为5后，投影法给出的左右边界是：

[(5, 27), (33, 53), (59, 108)]

明显最后的6和9数字没有切割。

修改阈值为7，结果则是：

[(5, 27), (33, 53), (60, 79), (83, 108)]

所以对于简单粘连的情况，调整阈值也是可以解决的。

第二种方法，叫做CFS连通域分割法。原理就是假定每个字符都由一个单独的连通域组成，换言之就是无粘连，找到一个黑色像素并开始判断，直到所有相连的黑色像素都被遍历标记过后即可判断出这个字符的分割位置。算法如下：

将二值化后的图片进行从左到右、从上到下的遍历，如果遇到黑色像素并且这个像素没有没访问过，就将这个像素入栈并标记为已经访问。
如果栈不为空，则继续探测周围8个像素，并执行第2步；如果栈空，则代表探测完了一个字符块。
探测结束，这样就确定了若干字符。

代码如下：

import queue

def cfs(img):
 """传入二值化后的图片进行连通域分割"""
 pixdata = img.load()
 w,h = img.size
 visited = set()
 q = queue.Queue()
 offset = [(-1,-1),(0,-1),(1,-1),(-1,0),(1,0),(-1,1),(0,1),(1,1)]
 cuts = []
 for x in range(w):
  for y in range(h):
   x_axis = []
   #y_axis = []
   if pixdata[x,y] == 0 and (x,y) not in visited:
    q.put((x,y))
    visited.add((x,y))
   while not q.empty():
    x_p,y_p = q.get()
    for x_offset,y_offset in offset:
     x_c,y_c = x_p+x_offset,y_p+y_offset
     if (x_c,y_c) in visited:
      continue
     visited.add((x_c,y_c))
     try:
      if pixdata[x_c,y_c] == 0:
       q.put((x_c,y_c))
       x_axis.append(x_c)
       #y_axis.append(y_c)
     except:
      pass
   if x_axis:
    min_x,max_x = min(x_axis),max(x_axis)
    if max_x - min_x > 3:
     # 宽度小于3的认为是噪点，根据需要修改
     cuts.append((min_x,max_x))
 return cuts

调用后输出结果和使用投影法是一样的。另外我看网上还有一种叫做“泛洪填充(Flood Fill)”的方法，似乎和连通域是一样的。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

TensorFlow 模型载入方法汇总(小结)
这篇文章主要介绍了TensorFlow 模型载入方法汇总(小结),小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-06-06
python爬虫增加访问量的方法
这篇文章主要介绍了python爬虫增加访问量的方法，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2019-08-08
python在windows和linux下获得本机本地ip地址方法小结
这篇文章主要介绍了python在windows和linux下获得本机本地ip地址方法,实例分析了Python获得IP地址的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-03-03
Python的时间模块datetime详解
本文给大家分享的是在python中的时间模块datetime的使用方法，注意事项以及简单示例，有需要的小伙伴可以参考下
2017-04-04
浅谈Python如何获取excel数据
这篇文章主要介绍了Python如何获取excel数据，本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2021-10-10
python如何实时获取tcpdump输出
这篇文章主要介绍了python如何实时获取tcpdump输出，帮助大家更好的理解和使用python，感兴趣的朋友可以了解下
2020-09-09
python实现跨进程(跨py文件)通信示例
本文主要介绍了python实现跨进程(跨py文件)通信示例，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-03-03
python使用Pycharm创建一个Django项目
这篇文章主要介绍了python使用Pycharm创建一个Django项目，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-03-03
python安装gdal的两种方法
这篇文章主要介绍了python安装gdal的两种方法,每种方法给大家介绍的都非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-10-10
Django 博客实现简单的全文搜索的示例代码
这篇文章主要介绍了Django 博客实现简单的全文搜索的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-02-02

python验证码识别教程之利用投影法、连通域法分割图片

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具