通过C#和IronOcr实现图片文字自动识别(OCR)和提取

 更新时间:2025年11月27日 10:04:40   作者:代码掌控者  
所谓的图片文字识别,简单地说,就是识别并提取图片中的文字,英文简称为OCR,近年来,这项技术得到了广泛应用,如果有一个图片文字识别提取工具,点击一下,就能将图片上的文字直接提取出来,这该有多方便,本文就来聊聊如何使用C#实现OCR功能,需要的朋友可以参考下

前言

嗨,大家好!

你了解图片文字识别技术(OCR)吗?

所谓的图片文字识别,简单地说,就是识别并提取图片中的文字,英文简称为 OCR。

近年来,这项技术得到了广泛应用,成为了提升工作效率的利器,想像一下,你需要将某张图片上的文字录入信息库,看着图片一个字一个字的敲打录入,那有该多辛苦!

如果有一个图片文字识别提取工具,点击一下,就能将图片上的文字直接提取出来,这该有多方便!

今天,我们就来聊聊如何使用 C# 实现 OCR 功能,并分享一个详细的例子。

话不多说,我们直接开始吧!

Step By Step 详细步骤

1. 创建项目

创建一个 WinForms 应用桌面程序项目,命名为 “WinFormsOCRSample”

2. 安装 Nuget 包

在项目中添加以下 NuGet 包

<PackageReference Include="IronOcr" Version="2023.5.35" />
<PackageReference Include="IronOcr.Languages.Chinese" Version="2020.11.2" />

注意:如果不装 IronOcr.Languages.Chinese,识别中文时会变成乱码,所以一定要记得装这个包!

3. 设计窗体

接下来,在主窗体上放置两个文本框和一个按钮。

第一个文本框用于输入图片路径,第二个文本框用于显示识别结果,按钮则用于触发 OCR 操作。

如下图:

4. 编写文字自动识别代码

双击窗体上按钮,自动生成按钮单击事件并跳转到代码界面,编写如下代码,留意其中的注释

using IronOcr;
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;

namespace WinFormsOCRSample
{
    public partial class frmImgOCR : Form
    {
        public frmImgOCR()
        {
            InitializeComponent();
        }

        private void btnOcr_Click(object sender, EventArgs e)
        {
            // 初始化 OCR 引擎
            var ocr = new IronTesseract();

            // 配置不读取二维码
            ocr.Configuration.ReadBarCodes = false;

            // 设置语言为简体中文
            ocr.Language = OcrLanguage.ChineseSimplifiedBest;

            using (var ocrInput = new OcrInput())
            {
                // 加载图片
                ocrInput.AddImage(txtFilePath.Text.Trim());

                // 提高识别质量的设置(可选)
                ocrInput.Deskew();  	// 仅当图片倾斜时使用
                // ocrInput.DeNoise();  // 仅当图片包含数字噪声时使用

                // 执行 OCR 并获取结果
                var ocrResult = ocr.Read(ocrInput);
                txtResult.Text = ocrResult.Text;  // 显示识别结果
            }
        }
    }
}

5. 运行并测试

准备一个有文字的图片,如下图:

运行程序,输入图片路径,点击 “文字识别” 按钮,很快地就自动识别出图片上的文字,并输出结果,如下图:

总结

搞定!是不是比想象中简单?只需要几行代码,就让 C# 轻松实现图片文字的自动识别,而且,准确率还不错!

事实上,除了图片上文字,PDF 也可以轻松识别,你可以在 IronOcr 的官网上解锁更多姿势!

看到这里,你是不是也心动了,赶快也尝试一下吧!

以上就是通过C#和IronOcr实现图片文字自动识别(OCR)和提取的详细内容,更多关于C# IronOcr图片文字自动识别和提取的资料请关注脚本之家其它相关文章!

相关文章

  • c# 调用.bat文件的实现代码

    c# 调用.bat文件的实现代码

    c# 调用.bat文件主要利用了using System.Diagnostics;命名空间,大家可以参考下。
    2009-06-06
  • 深入浅出23种设计模式

    深入浅出23种设计模式

    本文给大家详解23种设计模式,理解设计模式有助于在程序开发过程中灵活应用,需要的朋友可以参考下
    2015-08-08
  • C#深度优先遍历实现全排列

    C#深度优先遍历实现全排列

    这篇文章主要介绍了C#深度优先遍历实现全排列,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • C#借助Free Spire.Doc for .NET实现将HTML转换为RTF富文本格式

    C#借助Free Spire.Doc for .NET实现将HTML转换为RTF富文本格式

    在办公自动化、文档导出、报表生成等场景中,HTML 与RTF格式的转换是常见需求,本文将详细讲解如何使用该免费库通过 C# 代码实现 HTML 到 RTF 的转换,感兴趣的小伙伴可以了解下
    2025-11-11
  • C#跨PC远程调用程序并显示UI界面

    C#跨PC远程调用程序并显示UI界面

    这篇文章主要为大家介绍了使用C#跨PC远程调用程序并显示UI界面,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • C#算法设计与分析详解

    C#算法设计与分析详解

    本文详细讲解了C#的算法设计与分析,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-04-04
  • c# DevExpress gridcontrol日期行的显示格式设置

    c# DevExpress gridcontrol日期行的显示格式设置

    这篇文章主要介绍了c# DevExpress gridcontrol日期行的显示格式设置,需要的朋友可以参考下
    2017-02-02
  • 轻松学习C#的属性

    轻松学习C#的属性

    轻松学习C#的属性,对C#的属性感兴趣的朋友可以参考本篇文章,帮助大家更灵活的运用C#的属性
    2015-11-11
  • C#实现单链表(线性表)完整实例

    C#实现单链表(线性表)完整实例

    这篇文章主要介绍了C#实现单链表(线性表)的方法,结合完整实例形式分析了单链表的原理、实现方法与相关注意事项,需要的朋友可以参考下
    2016-06-06
  • C# 操作Excel代码总结

    C# 操作Excel代码总结

    这篇文章主要介绍了C# 操作Excel代码总结,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01

最新评论