Python调用百度AI实现身份证识别

 更新时间:2021年12月06日 16:23:40   作者:阿黎逸阳  
这篇文章主要介绍了Python通过调用百度AI的文字识别功能实现对身份证进行识别,代码具有一定的学习价值,感兴趣的朋友一起来看看效果吧

一、安装baidu-aip模块

按win+R打开cmd,在里面输入

pip3 install baidu-aip

若出现如下界面,即成功安装了baidu-aip模块:

如果想快速了解识别营业执照代码原理,可以跳过第二部分,先看第三部分的内容。

二、获取百度AI接口密钥

在应用python识别身份证的过程中,有三行代码使用了百度AI接口密钥,故先阐述如何获得该密钥。首先,进入如下百度AI官方网站:https://ai.baidu.com/tech/ocr

有百度账户的输入账户密码进行登录,没有的点击注册,按指示输入相关信息即可注册登录。

登录后找到文字识别中的产品列表,下方有卡证文字识别内容,点击了解详情。

  

可以发现卡证文字识别中包含了我们常见的一些证件的识别,比如身份证、银行卡、营业执照、户口本、护照等。本文阐述营业执照的识别,感兴趣的同学可以自行研究其它证件的识别。在卡证文字识别的详情中可以发现如下产品列表:

找到身份证识别,点击了解详情,即可进入如下界面:

点击立即使用,就会出现如下服务协议:

点击我已同意百度AI开放平台服务协议,就可以进入如下界面:

下滑后点击卡证OCR,就可以发现身份证别功能,点击开通按钮。

可以进入如下筛选开通付费页面:

在确认开通之前,要先进行实名验证,按指示进行操作即可完成实名验证。

接着可以勾选要开通的识别功能,具体如下:

然后点击去支付,由于每天前多少次是免费的,且采取后付费模式,故不需提前付费。若开通成功,会出现如下界面:

开通成功后,点击概览中的创建应用。

填写应用名称(自己想一个贴合自己应用场景的名字即可)、选择文字识别包名、选择应用归属、填写应用描述,点击立即创建即可。

最后,点击应用详情,即可找到我们需要的接口密钥(红框对应的值)。

三、调用百度接口识别身份证

安装好baidu-aip模块,获取了百度AI接口密钥后,即可调用百度接口识别身份证了。身份证识别每天有5百次的免费调用机会,首先来看下今天要识别的身份证。

这张身份证是在百度上下载的一张虚拟身份证,如有侵权,请联系我删除。识别该身份证的具体python代码如下:

import re
import os
import time
from aip import AipOcr

os.chdir(r'F:\公众号\27.证件识别')
#设置证件存放的路径

APP_ID = 'XXX'
API_KEY = 'XXXXXXXX'
SECRET_KEY = 'XXXXXXXXXXXX'
#百度账号和密钥,需替换成你的

picture = open('2_身份证_v3.jpg', 'rb')
img = picture.read()
#读取图片

idCardSide = 'front'  #身份证正面
#idCardSide = 'back'   #身份证反面

options = {}
options['detect_direction'] = 'true' #是否检测图像朝向,默认不检测
options['detect_risk'] = 'false'     #是否开启身份证风险类型

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
text = client.idcard(img, idCardSide, options)
#识别图片中的信息

concat_text = []
if isinstance(text, dict):
    words = text['words_result']
    for k, v in words.items():
        print(u'{k}:{v}'.format(k=k, v=v['words']))
        tt = u'{k}:{v}'.format(k=k, v=v['words'])
        concat_text.append(tt)
#把字典解析成我们熟悉的形式

注:其中os.chdir中的内容应该替换成你存储图片的地址,APP_ID、API_KEY、SECRET_KEY应该替换成第二章末尾你获取的百度密钥。

得到结果如下:

对比原始图片可以发现,出生是直接从身份证号码中截取的,住址的信息可能由于反光没有识别出来,结果为空。这里有个小插曲,我之前一直使用png格式的身份证图片进行调用识别,但一直报如下错误:

ConnectionError: ('Connection aborted.', ConnectionResetError(10054, '远程主机强迫关闭了一个现有的连接。', None, 10054, None))

后面调整为jpg图片后,就没有出现该问题了,所以建议在进行身份证识别时最好把图片的格式设置为jpg。为进一步规范输出成标准格式,通过如下代码进行规范化:

import pandas as pd

date_concat_text = pd.DataFrame(concat_text)
date_concat_text.columns =['text']
df = date_concat_text["text"].str.split(':',expand=True)
date_concat_text['label'] = df.iloc[:,0]
date_concat_text['content'] = df.iloc[:,1]
date_concat_text.to_csv("id_card_to_text.csv")

得到结果如下:

以上就是Python调用百度AI实现身份证识别的详细内容,更多关于Python识别身份证的资料请关注脚本之家其它相关文章!

相关文章

  • 7个有用的Pandas显示选项分享

    7个有用的Pandas显示选项分享

    Pandas是一个在数据科学中常用的功能强大的Python库。在某些情况下,我们可能希望更改所显示内容的格式,这就需要使用Pandas的一些定制功能来帮助我们自定义内容的显示方式。本文为大家总结了7个有用的Pandas显示选项,希望对大家有所帮助
    2022-12-12
  • 使用Python的Matplotlib绘制渐变的彩色曲线

    使用Python的Matplotlib绘制渐变的彩色曲线

    这篇文章主要介绍了使用Python的Matplotlib绘制渐变的彩色曲线,Matplotlib是Python生态圈中应用最为广泛的2D绘图库,通过扩展工具包mplot3d,也可以绘制简单的3D模型,需要的朋友可以参考下
    2023-08-08
  • Python使用PIL进行JPEG图像压缩的简易教程

    Python使用PIL进行JPEG图像压缩的简易教程

    本文介绍了如何使用Python编程语言和wxPython图形用户界面库进行JPEG图像的压缩,通过添加滑块控件,我们可以调整压缩质量,并将压缩后的照片另存为原来的名称加上后缀"压缩+质量数字"的新文件,需要的朋友可以参考下
    2023-09-09
  • python实时监控logstash日志代码

    python实时监控logstash日志代码

    这篇文章主要介绍了python实时监控logstash日志代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python打包成.exe可执行文件的详细步骤

    Python打包成.exe可执行文件的详细步骤

    在Python中,可以使用一些工具将Python代码打包成可执行文件(.exe)以便在没有安装Python解释器的环境中运行,本文通过图文结合的方式给大家详细介绍了Python打包成.exe可执行文件的步骤,需要的朋友可以参考下
    2024-04-04
  • 基于Python 装饰器装饰类中的方法实例

    基于Python 装饰器装饰类中的方法实例

    下面小编就为大家分享一篇基于Python 装饰器装饰类中的方法实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python 实现中值滤波、均值滤波的方法

    Python 实现中值滤波、均值滤波的方法

    今天小编就为大家分享一篇Python 实现中值滤波、均值滤波的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • python实现LBP方法提取图像纹理特征实现分类的步骤

    python实现LBP方法提取图像纹理特征实现分类的步骤

    这篇文章主要介绍了python实现LBP方法提取图像纹理特征实现分类的步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • 基于Python编写将文本转换为语音的简易应用

    基于Python编写将文本转换为语音的简易应用

    这篇文章主要介绍了如何使用Python编写一个简单的应用程序,将文本转换为语音,文中的示例代码讲解详细,感兴趣的小伙伴可以动手尝试一下
    2023-08-08
  • 6种Python中提高文本处理效率的技巧分享

    6种Python中提高文本处理效率的技巧分享

    这篇文章主要为大家介绍了一些Python中用得上的高级技巧,大大提高了文本处理效率,可以让大家轻松驾驭文本处理,下面就跟随小编一起来了解下吧
    2025-02-02

最新评论