Python实现将中文大写金额转数字金额

 更新时间:2025年09月23日 08:39:58   作者:幸福清风  
在日常的财务处理、票据识别或金融系统开发中,我们常常需要将中文大写的金额转换为阿拉伯数字形式,下面我们就来看看如何使用Python实现这一需求吧

在日常的财务处理、票据识别或金融系统开发中,我们常常需要将中文大写的金额转换为阿拉伯数字形式。例如:

  • “壹佰元整” → “100”
  • “壹仟贰佰叁拾肆元伍角陆分” → “1234.56”
  • “壹拾陆万元” → “160000”

这类需求在银行票据OCR识别、合同金额处理等场景中非常常见。本文将详细介绍如何使用 Python 编写一个能够准确识别并转换中文大写金额的函数,并通过对比验证其准确性。

一、中文大写金额规则简介

中文大写金额由以下部分组成:

数字部分(0~9):

零 壹 贰 叁 肆 伍 陆 柒 捌 玖

单位部分:

拾 佰 仟 万 亿

小数单位:

角 分

特殊标记:

  • “元”:整数部分结束标志
  • “整”:表示无角分
  • “零”:表示中间有空位

二、Python 实现思路解析

1. 映射关系定义

我们首先定义两个字典,分别用于映射中文数字和单位到对应的数值:

num_map = {
    '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4,
    '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9
}

unit_map = {
    '拾': 10, '佰': 100, '仟': 1000,
    '万': 10000, '亿': 100000000
}

2. 预处理输入字符串

去除多余的空格与“整”字,便于后续解析:

capital = capital.replace(' ', '').replace('整', '')

3. 分离整数与小数部分

根据“元”分割出整数部分与角分部分:

if '元' in capital:
    parts = capital.split('元')
    yuan_part = parts[0]
    jiao_fen_part = parts[1] if len(parts) > 1 else ''
else:
    yuan_part = capital

4. 解析整数部分

核心逻辑是逐字符遍历,遇到数字则记录临时值,遇到单位则进行乘法运算:

def parse_section(s):
    if not s:
        return 0
    if s == '拾':  # 特殊情况:"拾"表示10
        return 10

    result = 0
    temp = 0
    for char in s:
        if char in num_map:
            temp = num_map[char]
        elif char in unit_map:
            result += temp * unit_map[char]
            temp = 0
    result += temp
    return result

5. 处理“亿”和“万”的层级结构

递归处理“亿”和“万”的分层结构:

def parse_amount(s):
    if '亿' in s:
        parts = s.split('亿')
        yi_part = parts[0]
        rest_part = parts[1] if len(parts) > 1 else ''
        value = parse_section(yi_part) * 100000000
        if rest_part:
            value += parse_amount(rest_part)
        return value
    elif '万' in s:
        parts = s.split('万')
        wan_part = parts[0]
        rest_part = parts[1] if len(parts) > 1 else ''
        value = parse_section(wan_part) * 10000
        if rest_part:
            value += parse_section(rest_part)
        return value
    else:
        return parse_section(s)

6. 角分处理

处理角分部分,支持“角”、“分”、“角分”三种组合:

def parse_jiao_fen(jf):
    if not jf:
        return ""

    jiao = 0
    fen = 0

    if '角' in jf and '分' in jf:
        parts = jf.split('角')
        if parts[0] in num_map:
            jiao = num_map[parts[0]]
        fen_part = parts[1].replace('分', '')
        if fen_part in num_map:
            fen = num_map[fen_part]
    elif '角' in jf:
        jiao_part = jf.replace('角', '')
        if jiao_part in num_map:
            jiao = num_map[jiao_part]
    elif '分' in jf:
        fen_part = jf.replace('分', '')
        if fen_part in num_map:
            fen = num_map[fen_part]

    if jiao > 0 and fen > 0:
        return f".{jiao}{fen}"
    elif jiao > 0:
        return f".{jiao}0"
    elif fen > 0:
        return f".0{fen}"
    else:
        return ""

三、完整代码示例

def convert_capital_to_small(capital):
    num_map = {
        '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4,
        '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9
    }

    unit_map = {
        '拾': 10, '佰': 100, '仟': 1000,
        '万': 10000, '亿': 100000000
    }

    capital = capital.replace(' ', '').replace('整', '')

    if not capital or capital == '零元':
        return '0'

    yuan_part = capital
    jiao_fen_part = ''

    if '元' in capital:
        parts = capital.split('元')
        yuan_part = parts[0]
        if len(parts) > 1:
            jiao_fen_part = parts[1]
    else:
        yuan_part = capital.replace('整', '')

    def parse_section(s):
        if not s:
            return 0
        if s == '拾':
            return 10

        result = 0
        temp = 0
        for char in s:
            if char in num_map:
                temp = num_map[char]
            elif char in unit_map:
                result += temp * unit_map[char]
                temp = 0
        result += temp
        return result

    def parse_amount(s):
        if not s:
            return 0
        if len(s) == 1 and s in num_map:
            return num_map[s]

        if '亿' in s:
            parts = s.split('亿')
            yi_part = parts[0]
            rest_part = parts[1] if len(parts) > 1 else ''
            value = parse_section(yi_part) * 100000000
            if rest_part:
                value += parse_amount(rest_part)
            return value
        elif '万' in s:
            parts = s.split('万')
            wan_part = parts[0]
            rest_part = parts[1] if len(parts) > 1 else ''
            value = parse_section(wan_part) * 10000
            if rest_part:
                value += parse_section(rest_part)
            return value
        else:
            return parse_section(s)

    yuan_value = parse_amount(yuan_part)

    def parse_jiao_fen(jf):
        if not jf:
            return ""

        jiao = 0
        fen = 0

        if '角' in jf and '分' in jf:
            parts = jf.split('角')
            if parts[0] in num_map:
                jiao = num_map[parts[0]]
            fen_part = parts[1].replace('分', '')
            if fen_part in num_map:
                fen = num_map[fen_part]
        elif '角' in jf:
            jiao_part = jf.replace('角', '')
            if jiao_part in num_map:
                jiao = num_map[jiao_part]
        elif '分' in jf:
            fen_part = jf.replace('分', '')
            if fen_part in num_map:
                fen = num_map[fen_part]

        if jiao > 0 and fen > 0:
            return f".{jiao}{fen}"
        elif jiao > 0:
            return f".{jiao}0"
        elif fen > 0:
            return f".0{fen}"
        else:
            return ""

    jf_str = parse_jiao_fen(jiao_fen_part)

    if jf_str:
        return f"{int(yuan_value)}{jf_str}"
    else:
        return str(int(yuan_value))

四、测试验证

我们可以编写一个简单的对比函数来验证转换结果是否正确:

def get_dx_compare(capital_amount, small_amount):
    try:
        capital_to_small = convert_capital_to_small(capital_amount)
        small_amount_clean = small_amount.replace(',', '')
        converted_float = float(capital_to_small)
        expected_float = float(small_amount_clean)
        if converted_float == expected_float:
            print(f"✓ 金额匹配:小写金额 {small_amount}元,大写金额 {capital_amount}")
            return True
        else:
            print(f"✗ 金额不匹配:")
            print(f"  小写金额: {small_amount}")
            print(f"  大写金额: {capital_amount}")
            print(f"  转换结果: {capital_to_small}")
            return False
    except Exception as e:
        print(f"转换出错: {e}")
        return False

运行测试:

get_dx_compare('壹拾陆万元', '160000')  # ✅ 应该输出匹配
get_dx_compare('壹万元', '10000')
get_dx_compare('零元整', '0')
get_dx_compare('壹佰元整', '100')
get_dx_compare('壹仟贰佰叁拾肆元伍角陆分', '1234.56')

输出结果如下:

✓ 金额匹配:小写金额 160000元,大写金额 壹拾陆万元
✓ 金额匹配:小写金额 10000元,大写金额 壹万元
✓ 金额匹配:小写金额 0元,大写金额 零元整
✓ 金额匹配:小写金额 100元,大写金额 壹佰元整
✓ 金额匹配:小写金额 1234.56元,大写金额 壹仟贰佰叁拾肆元伍角陆分

五、总结

本文提供了一个较为完整的中文大写金额转阿拉伯数字的 Python 实现方案,涵盖以下关键点:

  • 数字与单位映射
  • 整数部分层级解析(亿、万、千、百、十)
  • 角分部分精确处理
  • 输入预处理(去空格、去“整”)
  • 结果验证机制

你可以将其用于金融系统中的金额校验、OCR识别后处理、合同文本解析等场景。

以上就是Python实现将中文大写金额转数字金额的详细内容,更多关于Python金额大写转数字的资料请关注脚本之家其它相关文章!

相关文章

  • python 上下文管理器及自定义原理解析

    python 上下文管理器及自定义原理解析

    这篇文章主要介绍了python 上下文管理器原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • python使用三角迭代计算圆周率PI的方法

    python使用三角迭代计算圆周率PI的方法

    这篇文章主要介绍了python使用三角迭代计算圆周率PI的方法,实例分析了Python迭代算法的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • Python3如何使用range函数替代xrange函数

    Python3如何使用range函数替代xrange函数

    这篇文章主要介绍了Python3如何使用range函数替代xrange函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • python3排序的实例方法

    python3排序的实例方法

    在本篇文章里小编给大家整理的是一篇关于python3排序的实例方法,有兴趣的朋友们可以学习参考下。
    2020-10-10
  • 使用python爬取抖音视频列表信息

    使用python爬取抖音视频列表信息

    这篇文章主要介绍了如何用python爬取抖音视频列表信息,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-07-07
  • django使用JWT保存用户登录信息

    django使用JWT保存用户登录信息

    这篇文章主要介绍了Django使用jwt获取用户信息的实现方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-04-04
  • Python实现重建二叉树的三种方法详解

    Python实现重建二叉树的三种方法详解

    这篇文章主要介绍了Python实现重建二叉树的三种方法,结合实例形式分析了Python重建二叉树的实现方法、操作技巧与注意事项,需要的朋友可以参考下
    2018-06-06
  • Python的ORM框架SQLAlchemy入门教程

    Python的ORM框架SQLAlchemy入门教程

    SQLAlchemy 是python 操作数据库的一个库。能够进行 orm 映射,SQLAlchemy“采用简单的Python语言,为高效和高性能的数据库访问设计,实现了完整的企业级持久模型”
    2014-04-04
  • python按照多个字符对字符串进行分割的方法

    python按照多个字符对字符串进行分割的方法

    这篇文章主要介绍了python按照多个字符对字符串进行分割的方法,涉及Python中正则表达式匹配的技巧,非常具有实用价值,需要的朋友可以参考下
    2015-03-03
  • 一文详解Python中生成器的原理与使用

    一文详解Python中生成器的原理与使用

    生成器表达式本质上就是一个迭代器,是定义迭代器的一种方式,是允许自定义逻辑的迭代器。本文将详细讲解一下Python中生成器的原理与使用,需要的可以参考一下
    2022-05-05

最新评论