小白学Python之实现OCR识别

 更新时间:2021年08月24日 10:46:12   作者:coderwangson  
将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR),这篇文章主要给大家介绍了关于Python实现OCR识别的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

前期准备

在这个阶段主要准备整个小程序的结构,既然要实现ocr,那么输入就是一张图片,而图片这里采用屏幕截图的方式获得,输出是文字,这里采用搜狗的ocr接口,我们把截好的图片传到搜狗ocr接口中,然后把返回的文字作为输出即可。

由于想做一个小程序,所以要为程序做GUI,这里采用tkinter编制GUI界面。

界面编写

界面主要就准备一个窗体,里面有菜单,给出OCR功能。

之后我们点击菜单,则启动一个截图功能,在截图完成后,我们就把截得的图片传入ocr接口并返回文字到主窗体中。

主面板的编写则直接使用tkinter建立菜单等

	root = Tk() 
	root.title("小新的OCR")
	# 创建一个顶级菜单
    menubar = Menu(root)
    # 创建一个下拉菜单“文件”,然后将它添加到顶级菜单中
    filemenu = Menu(menubar, tearoff=False)
    filemenu.add_command(label="OCR", command=buttonCaptureClick, accelerator='Ctrl+N')
    filemenu.add_command(label="帮助",command=helpClick)
    filemenu.add_command(label="退出", command=root.quit)
    menubar.add_cascade(label="操作", menu=filemenu)
    # 显示菜单
    root.config(menu=menubar)
    root.bind_all("<Control-d>", lambda event: buttonCaptureClick())
    #启动消息主循环
    root.mainloop()  

这样变回产生一个窗体,用户可以和这个窗体进行交互,你可以点击菜单,然后找到其子菜单中的OCR一项,点击它便会调用一个buttonCaptureClick的函数,这个函数就来产生截图,并且保存截图。

截图功能实现

截图功能我也是参考网上的内容,原理就是先把整个屏幕给捕捉到,然后监听鼠标事件,当鼠标左边按下则作为截图的左顶点,鼠标左键松下则最为截图的右底点,这样我们截图区域就出来了,然后进行保存即可。

#用来显示全屏幕截图并响应二次截图的窗口类
class MyCapture:
    def __init__(self, png):
        #变量X和Y用来记录鼠标左键按下的位置
        self.X = tkinter.IntVar(value=0)
        self.Y = tkinter.IntVar(value=0)
        #屏幕尺寸
        screenWidth = root.winfo_screenwidth()
        screenHeight = root.winfo_screenheight()
        #创建顶级组件容器
        self.top = tkinter.Toplevel(root, width=screenWidth, height=screenHeight)
        #不显示最大化、最小化按钮
        self.top.overrideredirect(True)
        self.canvas = tkinter.Canvas(self.top,bg='white', width=screenWidth, height=screenHeight)
        #显示全屏截图,在全屏截图上进行区域截图
        self.image = tkinter.PhotoImage(file=png)
        self.text =""
        self.canvas.create_image(screenWidth//2, screenHeight//2, image=self.image)
        #鼠标左键按下的位置
        def onLeftButtonDown(event):
            self.X.set(event.x)
            self.Y.set(event.y)
            #开始截图
            self.sel = True
        self.canvas.bind('<Button-1>', onLeftButtonDown)
        #鼠标左键移动,显示选取的区域
        def onLeftButtonMove(event):
            if not self.sel:
                return
            global lastDraw
            try:
                #删除刚画完的图形,要不然鼠标移动的时候是黑乎乎的一片矩形
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            lastDraw = self.canvas.create_rectangle(self.X.get(), self.Y.get(), event.x, event.y, outline='black')
        self.canvas.bind('<B1-Motion>', onLeftButtonMove)
        #获取鼠标左键抬起的位置,保存区域截图
        def onLeftButtonUp(event):
            self.sel = False
            try:
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            sleep(0.1)
            #考虑鼠标左键从右下方按下而从左上方抬起的截图
            left, right = sorted([self.X.get(), event.x])
            top, bottom = sorted([self.Y.get(), event.y])
            pic = ImageGrab.grab((left+1, top+1, right, bottom))
            fileName ="temp.jpg"
            pic.save(fileName)
            self.text = get_text(fileName)
            #关闭当前窗口
            self.top.destroy()
        self.canvas.bind('<ButtonRelease-1>', onLeftButtonUp)
#让canvas充满窗口,并随窗口自动适应大小
        self.canvas.pack(fill=tkinter.BOTH, expand=tkinter.YES)
 #开始截图
def buttonCaptureClick():
    #最小化主窗口
#     root.state('icon')
    root.withdraw()
    sleep(0.4)
    filename = 'temp.png'
    #grab()方法默认对全屏幕进行截图
    im = ImageGrab.grab()
    im.save(filename)
    im.close()
    #显示全屏幕截图
    w = MyCapture(filename)
    root.wait_window(w.top)
    #截图结束,恢复主窗口,并删除临时的全屏幕截图文件
    root.update()
    root.deiconify()
    text1.config(state = NORMAL)
    text1.delete(0.0,END)
    text1.insert('insert',w.text)
    text1.config(state = DISABLED)
    text1.pack()
    os.remove(filename)

OCR实现

因为OCR其实是采用了搜狗的接口,所以需要做的工作也不是很多,只需要把我们的图片传入即可。

def get_text(img_path):
    print("")
    img = img_path # 图片路径
    files = {"pic_path": open(img, "rb")}  # files # 类似data数据
    url = "http://pic.sogou.com/pic/upload_pic.jsp"  # post的url
    keywords = requests.post(url, files=files).text  # requests 提交图片
    url = "http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=" + keywords  # keywords就是图片url此方式为get请求
    ocrResult = requests.get(url).json()  # 直接转换为json格式
    
    contents = ocrResult['result']  # 类似字典 把result的value值取出来 是一个list然后里面很多json就是识别的文字
    text = ""
    for content in contents:  # 遍历所有结果
        text+=(content['content'].strip()+'\n')  # strip去除空格 他返回的结果自带一个换行
    return text

内容显示

内容显示是在截图结束后我们把ocr识别的内容存储起来

self.text = get_text(fileName)  

然后再显示到主窗体上

    text1.config(state = NORMAL)
    text1.delete(0.0,END)
    text1.insert('insert',w.text)
    text1.config(state = DISABLED)
    text1.pack()  

总结

虽然是一个完整的项目,但是其中的很多模块其实都是借用其他人的模块,而我做的只是把他们结合起来做成一个小项目,所以是站在巨人的肩膀上开发。

到此这篇关于Python实现OCR识别的文章就介绍到这了,更多相关Python实现OCR识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

参考:

  • https://cloud.tencent.com/developer/article/1097904
  • https://morvanzhou.github.io/tutorials/python-basic/tkinter/
  • https://www.52pojie.cn/thread-708177-1-1.html

相关文章

  • python网络编程之五子棋游戏

    python网络编程之五子棋游戏

    这篇文章主要为大家详细介绍了python网络编程之五子棋游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-05-05
  • 解决pycharm19.3.3安装pyqt5找不到designer.exe和pyuic.exe的问题

    解决pycharm19.3.3安装pyqt5找不到designer.exe和pyuic.exe的问题

    这篇文章给大家介绍了pycharm19.3.3安装pyqt5&pyqt5-tools后找不到designer.exe和pyuic.exe以及配置QTDesigner和PyUIC的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2021-04-04
  • python实现快速文件格式批量转换的方法

    python实现快速文件格式批量转换的方法

    这篇文章主要介绍了python实现快速文件格式批量转换的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-10-10
  • Python使用ChainMap实现组合数据魔法实例探究

    Python使用ChainMap实现组合数据魔法实例探究

    这篇文章主要为大家介绍了Python使用ChainMap实现组合数据魔法实例探究,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • 使用Python实现视频拼接效果

    使用Python实现视频拼接效果

    这篇文章主要为大家详细介绍了使用Python实现视频拼接效果的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-02-02
  • python opencv 二值化 计算白色像素点的实例

    python opencv 二值化 计算白色像素点的实例

    今天小编就为大家分享一篇python opencv 二值化 计算白色像素点的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python带你从浅入深探究Tuple(基础篇)

    Python带你从浅入深探究Tuple(基础篇)

    大家都知道Python中的元组容器序列(tuple)与列表容器序列(list)有很多相同之处,他们虽然都可以存储任意类型的数据,但是一个元组定义好之后就不能够再进行修改,对Python Tuple相关知识感兴趣的朋友一起看看吧
    2021-05-05
  • python排序算法的简单实现方法

    python排序算法的简单实现方法

    这篇文章主要给大家介绍了关于python排序算法的简单实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • pycharm中出现no module named xlwt的原因及解决

    pycharm中出现no module named xlwt的原因及解决

    这篇文章主要介绍了pycharm中出现no module named xlwt的原因及解决方案,具有很好的参考价值,希望对大家有所帮助。
    2023-05-05
  • python实现emoji对齐特殊字符对齐高级文本对齐

    python实现emoji对齐特殊字符对齐高级文本对齐

    这篇文章主要为大家介绍了python实现emoji对齐特殊字符对齐高级文本对齐方法实例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11

最新评论