使用Python接入OCR文字识别API的全教程

 更新时间:2026年04月16日 09:20:58   作者:石榴树下的七彩鱼  
本文介绍了Python调用OCR API进行文字识别的全过程,包括准备工作、API请求方式、Python接入示例、识别效果示例、常见优化技巧、在线体验与多语言文档等内容,帮助读者快速实现文字识别功能,需要的朋友可以参考下

在开发过程中,我们经常需要对图片进行文字识别,例如身份证识别、发票识别、文档扫描等场景。使用 OCR(Optical Character Recognition,光学字符识别)API 可以快速实现这些功能。本文将以 Python 为例,带你完成 OCR 文字识别 API 接入全过程,并提供在线体验和实用优化建议。

一、准备工作

注册 OCR API 服务
我们以石榴智能OCR接入API为示例,注册后可获得 API KeySecret Key

安装 Python 依赖库

pip install requests pillow
  • requests:用于发送 HTTP 请求
  • Pillow:用于图片处理,可选

准备测试图片
图片可以是身份证、票据、文档扫描件等。

二、API 请求方式简介

OCR API 通常需要发送以下参数:

  • image:图片 Base64 编码或 URL
  • type:识别类型(如 id_cardinvoicegeneral
  • language:可选,多语言识别

示意请求格式:

请求URL:

POST http(s)://ocr-api.shiliuai.com/api/advanced_general_ocr/v1

请求方式:

请求头

参数类型说明
Authorizationstring'APPCODE ' + 您的AppCode
Content-Typestringapplication/json

请求体

参数是否必填类型说明
image_base64选填string图片Base64;与image_url二选一;像素[15,8192];小于20M
image_url选填string图片URL;与image_base64二选一;像素[15,8192];小于20M
is_line选填bool是否为单行文字,默认False

返回信息:

返回结构

参数名类型说明
codeint错误码
msgstring错误信息(英文)
msg_cnstring错误信息(中文)
successbool识别是否成功
image_idstring请求图片ID
request_idstring唯一请求ID
datadata具体看下面

以下是返回示例

data 成功示例:
data = {
       "content":
       [
              {
                     "text": "你好", // string, 文字内容
                     "prob": 0.995, // float, [0, 1], 文字内容置信度
                     "keypoints": [ // list, 文字区域四个角的位置,以文字的左上角为起点,按顺时针顺序排列,单行文字没有此项
                            {"x":50, "y":20},
                            {"x":150, "y":20},
                            {"x":150, "y":60},
                            {"x":50, "y":60}
                            ]
              },
              ......
       ]
}
data 失败示例:
data = {}

三、Python 接入示例

# API文档:https://market.shiliuai.com/doc/advanced-general-ocr
# -*- coding: utf-8 -*-
import requests
import base64
import json

# 请求接口
URL = "https://ocr-api.shiliuai.com/api/general_ocr/v1"

# 图片转base64
def get_base64(file_path):
    with open(file_path, 'rb') as f:
        data = f.read()
    b64 = base64.b64encode(data).decode('utf8')
    return b64


def demo(appcode, file_path):
    # 请求头
    headers = {
        'Authorization': 'APPCODE %s' % appcode,
        'Content-Type': 'application/json'
    }
    # 请求体
    b64 = get_base64(file_path)
    data = {"image_base64": b64}
    # 请求
    response = requests.post(url=URL, headers=headers, json=data)
    content = json.loads(response.content)
    print(content)

if __name__=="__main__":
    appcode = "你的APPCODE"
    file_path = "本地图片路径"
    demo(appcode, file_path)

四、识别效果示例

五、常见优化技巧

清晰图片优先
模糊、倾斜、反光的图片识别率低,建议先做简单预处理。

裁剪或分区识别
对身份证、发票等图片按区域识别,可提高精度。

批量或异步处理
对多张图片,可使用队列或多线程异步调用 API。

错误处理
网络异常、识别失败或 API 错误码都需处理,保证程序稳定。

六、在线体验与多语言文档

  • 在线体验:https://market.shiliuai.com/general-ocr
  • 文档支持 Python、Java、PHP、C# 等多语言示例
  • 提供身份证识别、发票识别、通用文字识别等多种接口

七、总结

本文介绍了 Python 调用 OCR API 的完整流程,包括:

  • 注册 API 并获取密钥
  • Python 依赖安装及图片准备
  • API 请求示例及识别结果处理
  • 图片优化和错误处理技巧
  • 在线体验与文档参考

通过 OCR API,你可以快速将文字识别能力集成到网站、桌面应用或移动端应用中,实现身份证识别、票据识别、文档扫描等多场景需求。

以上就是使用Python接入OCR文字识别API的全教程的详细内容,更多关于Python OCR文字识别API接入的资料请关注脚本之家其它相关文章!

相关文章

  • Python实现区域填充的示例代码

    Python实现区域填充的示例代码

    这篇文章主要介绍了Python实现区域填充的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python支持断点续传的多线程下载示例

    python支持断点续传的多线程下载示例

    这篇文章主要介绍了python支持断点续传的多线程下载示例,大家参考使用吧
    2014-01-01
  • Python实现的数据结构与算法之快速排序详解

    Python实现的数据结构与算法之快速排序详解

    这篇文章主要介绍了Python实现的数据结构与算法之快速排序,详细分析了快速排序的原理与Python实现技巧,需要的朋友可以参考下
    2015-04-04
  • 跟老齐学Python之Python安装

    跟老齐学Python之Python安装

    本文主要讲诉了在Linux,Windows,MacOS三大系统中如何安装Python环境,非常的实用,虽然前面絮絮叨叨的说了不少题外话,但都是作者的肺腑之言,还是仔细看看吧
    2014-09-09
  • Python安装与环境搭建的完整流程和避坑指南

    Python安装与环境搭建的完整流程和避坑指南

    Python 环境搭建是每个 Python 学习者的第一道门槛,很多初学者在这一步就被卡住了,这篇文章主要为大家介绍了Python安装与环境搭建的完整流程和避坑指南,希望对大家有所帮助
    2026-06-06
  • Python使用numpy产生正态分布随机数的向量或矩阵操作示例

    Python使用numpy产生正态分布随机数的向量或矩阵操作示例

    这篇文章主要介绍了Python使用numpy产生正态分布随机数的向量或矩阵操作,简单描述了正态分布的概念并结合实例形式分析了Python使用numpy模块结合matplotlib绘制正态分布曲线图相关操作技巧,需要的朋友可以参考下
    2018-08-08
  • 详解python中requirements.txt的一切

    详解python中requirements.txt的一切

    最近学习到了python中的requirements.txt,或许是因为太简单了,网上没有搜到比较完整的介绍,所以这篇文章主要介绍了关于python中requirements.txt的相关资料,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-03-03
  • python数据结构之图的实现方法

    python数据结构之图的实现方法

    这篇文章主要介绍了python数据结构之图的实现方法,实例分析了Python图的表示方法与常用寻路算法的实现技巧,需要的朋友可以参考下
    2015-07-07
  • 详解Python中的文本处理

    详解Python中的文本处理

    这篇文章主要介绍了Python中的文本处理,包括从最基本的string模块的基础使用和更进一步的re模块的使用,本文来自IBM官方开发者技术文档,需要的朋友可以参考下
    2015-04-04
  • Python执行Shell命令的六种方法

    Python执行Shell命令的六种方法

    在 Python 编程中,有时我们需要执行一些 shell 命令来完成特定的任务,比如文件操作、系统调用等,Python 提供了多种内建的方法来执行这些命令,每种方法都有其适用场景和特点,本文给大家介绍了Python执行Shell命令的六种方法,需要的朋友可以参考下
    2024-09-09

最新评论