OpenCV(python)版实现文本分割之水平投影法
对于如下一张图片,如何将文本区域分割成一行一行的了?
在文本分割领域中有一种很优秀的算法:投影法,包括水平投影法和垂直投影法。本文主要讲述水平投影法,水平投影法可以理解为一束光线从图像的左侧向右边进行照射,每一条光线可以理解为图像的一行,计算每一行上图像的黑色像素点,从而可以对图像进行分割。
import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的区间 vv_list=list() v_list=list() for index,i in enumerate(list_data): if i>0: v_list.append(index) else: if v_list: vv_list.append(v_list) #list的clear与[]有区别 v_list=[] return vv_list if __name__=='__main__': img_bgr=cv2.imread('./testImg/1.png',1) if not img_bgr is None: img=img_bgr.copy() img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #二值化 t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY) ''' 水平投影从左向右投射,计算每一行的黑色像素总数 ''' rows,cols=binary.shape hor_list=[0]*rows for i in range(rows): for j in range(cols): #统计每一行的黑色像素总数 if binary.item(i,j)==0: hor_list[i]=hor_list[i]+1 ''' 对hor_list中的元素进行筛选,可以去除一些噪点 ''' hor_arr=np.array(hor_list) hor_arr[np.where(hor_arr<5)]=0 hor_list=hor_arr.tolist() #绘制水平投影 img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255 for i in range(rows): pt1=(cols-1,i) pt2=(cols-1-hor_list[i],i) cv2.line(img_white,pt1,pt2,(0,),1) cv2.imshow('水平投影',img_white) cv2.waitKey(0) #取出各个文字区间 vv_list=get_vvList(hor_list) for i in vv_list: img_hor=img_bgr[i[0]:i[-1],:,:] cv2.imshow('文本行',img_hor) cv2.waitKey(0)
运行上述代码,可以看到水平投影的效果。
根据投影法的特征,可以很容易就将上述文本分割成文本行,如下图所示:
到此这篇关于OpenCV(python)版实现文本分割之水平投影法的文章就介绍到这了,更多相关OpenCV水平投影 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
pyinstaller打包python3.6和PyQt5中各种错误的解决方案汇总
pyinstaller是打包python很方便的一个套件,我们可以很轻易地使用他,下面这篇文章主要给大家介绍了关于pyinstaller打包python3.6和PyQt5中各种错误解决的相关资料,需要的朋友可以参考下2022-08-08Python连接MySQL并使用fetchall()方法过滤特殊字符
这篇文章主要介绍了Python连接MySQL的方法并讲解了如何使用fetchall()方法过滤特殊字符,示例环境为Ubuntu操作系统,需要的朋友可以参考下2016-03-03
最新评论