Python+pypinyin实现将中文姓名拼音转换与搜索

 更新时间:2026年01月06日 08:55:26   作者:weixin_46244623  
这篇文章主要为大家详细介绍了如何基于 pypinyin 和pandas实现一个优雅且实用的中文姓名拼音转换与搜索方案,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以了解下

Python 使用 pypinyin 将中文姓名转换为拼音并支持拼音搜索

在实际业务中,我们经常会遇到这样的需求:

  • 将中文姓名转换为拼音
  • 支持通过拼音或拼音首字母搜索中文姓名
  • 结合 Pandas 对数据进行批量处理

本文将基于 pypinyin + pandas,实现一个优雅且实用的中文姓名拼音转换与搜索方案

一、环境准备

安装依赖

pip install pandas pypinyin

导入必要的库

import pandas as pd
from pypinyin import pinyin, Style

二、示例数据准备

假设我们有一列中文姓名数据:

data = {
    'name': ['张三', '李四', '王小五', '赵六']
}

df = pd.DataFrame(data)

当前 DataFrame 结构如下:

name
张三
李四
王小五
赵六

三、实现姓名拼音转换函数

我们希望实现两个拼音字段:

  • full_pinyin:姓名全拼(如 zhangsan
  • initials:姓全拼 + 名首字母(如 zhangs

核心函数实现

def get_full_pinyin_and_initials(name):
    """
    将中文姓名转换为:
    1. 全拼
    2. 姓全拼 + 名首字母
    """

    # 全拼(张三 -> zhangsan)
    full_pinyin = ''.join(
        pinyin(name, style=Style.NORMAL)[i][0]
        for i in range(len(name))
    )

    # 姓的全拼
    surname_pinyin = pinyin(name[0], style=Style.NORMAL)[0][0]

    # 名的首字母
    name_initials = pinyin(name[1:], style=Style.FIRST_LETTER)

    initials = surname_pinyin + ''.join(i[0] for i in name_initials)

    return full_pinyin, initials

四、批量生成拼音字段

使用 apply + pd.Series,将返回的元组拆分成多个列:

df[['full_pinyin', 'initials']] = (
    df['name']
    .apply(get_full_pinyin_and_initials)
    .apply(pd.Series)
)

处理后的 DataFrame:

namefull_pinyininitials
张三zhangsanzhangs
李四lisilis
王小五wangxiaowuwangxw
赵六zhaoliuzhaol

五、实现拼音搜索功能

支持以下两种搜索方式:

  • 全拼搜索
  • 拼音首字母搜索

搜索函数实现

def find_name_by_pinyin(input_pinyin):
    """
    根据拼音或拼音首字母查找姓名
    """

    matched_names = df[
        df['initials'].str.contains(input_pinyin, na=False) |
        df['full_pinyin'].str.contains(input_pinyin, na=False)
    ]

    return matched_names

六、使用示例

input_pinyin = "zhangs"
result = find_name_by_pinyin(input_pinyin)

print(result)

输出结果:

  name full_pinyin initials
0  张三    zhangsan   zhangs

七、完整代码

import pandas as pd
from pypinyin import pinyin, Style


# 假设你的 DataFrame 是这样的
data = {
    'name': ['张三', '李四', '王小五', '赵六']
}
df = pd.DataFrame(data)


# 定义获取拼音的函数
def get_full_pinyin_and_initials(name):
    # 获取全拼
    full_pinyin = ''.join(pinyin(name, style=Style.NORMAL)[i][0] for i in range(len(name)))

    # 获取姓的拼音和名的首字母
    surname_pinyin = pinyin(name[0], style=Style.NORMAL)[0][0]  # 姓的全拼
    name_initial = pinyin(name[1:], style=Style.FIRST_LETTER)  # 名的首字母
    initials = surname_pinyin + ''.join(n[0] for n in name_initial)

    return full_pinyin, initials


# 应用函数并创建新的列
df[['full_pinyin', 'initials']] = df['name'].apply(get_full_pinyin_and_initials).apply(pd.Series)


# 定义查找姓名的函数
def find_name_by_pinyin(input_pinyin):
    # 查找与输入拼音匹配的姓名
    matched_names = df[df['initials'].str.contains(input_pinyin, na=False) | 
                        df['full_pinyin'].str.contains(input_pinyin, na=False)]
    return matched_names


# 示例:查找拼音
input_pinyin = "zhangs"  # 你想要查找的拼音
result = find_name_by_pinyin(input_pinyin)


# 打印结果
print(result)

以上就是Python+pypinyin实现将中文姓名拼音转换与搜索的详细内容,更多关于Python pypinyin拼音转换与搜的资料请关注脚本之家其它相关文章!

相关文章

  • django反向解析URL和URL命名空间的方法

    django反向解析URL和URL命名空间的方法

    这篇文章主要介绍了django反向解析URL和URL命名空间,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06
  • python中getsizeof和asizeof的区别小结

    python中getsizeof和asizeof的区别小结

    本文详细的介绍了getsizeof和asizeof的区别,这两个函数都用于获取对象的内存占用大小,它们来自不同的库,下面就来详细的介绍一下两者的区别,感兴趣的可以了解一下
    2025-09-09
  • Python中调试模块pdb与ipdb操作的全面指南

    Python中调试模块pdb与ipdb操作的全面指南

    调试是编程过程中不可或缺的重要环节,Python 提供了多种调试工具,其中 pdb 和 ipdb 是最常用的两种,下面就跟随小编一起学习一下二者的具体使用吧
    2025-04-04
  • python文本处理的方案(结巴分词并去除符号)

    python文本处理的方案(结巴分词并去除符号)

    这篇文章主要介绍了python文本处理的方案(结巴分词并去除符号),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 深入解析 Python 的 argparse命令行参数的实战案例

    深入解析 Python 的 argparse命令行参数的实战案例

    argparse是开发Python命令行工具不可或缺的标准模块,它功能全面、文档丰富、学习曲线平缓,只要掌握了它,你就可以轻松将任何 Python 脚本变成一个强大、优雅、可维护的命令行工具,本文带领深入解析Python的argparse命令行参数,需要的朋友跟随小编一起看看吧
    2025-08-08
  • Python绘制组合图的示例

    Python绘制组合图的示例

    这篇文章主要介绍了Python如何绘制组合图,帮助大家更好的利用python绘制图像,进行数据可视化分析,感兴趣的朋友可以了解下
    2020-09-09
  • Python开发时报TypeError: ‘int‘ object is not iterable错误的解决方式

    Python开发时报TypeError: ‘int‘ object is not iterable错误的解决方

    Python写循环程序的时候遇到TypeError:'int'object is not iterable,所以下面这篇文章主要给大家介绍了关于Python开发时报TypeError:'int' object is not iterable错误的解决方式,需要的朋友可以参考下
    2022-06-06
  • selenium框架中driver.close()和driver.quit()关闭浏览器

    selenium框架中driver.close()和driver.quit()关闭浏览器

    这篇文章主要介绍了selenium框架中driver.close()和driver.quit()关闭浏览器,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • python matplotlib实现条形图的填充效果

    python matplotlib实现条形图的填充效果

    这篇文章主要为大家详细介绍了python matplotlib实现条形图的填充效果,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • python连接mongodb操作数据示例(mongodb数据库配置类)

    python连接mongodb操作数据示例(mongodb数据库配置类)

    这篇文章主要介绍了python连接mongodb操作数据示例,主要包括插入数据、更新数据、查询数据、删除数据等
    2013-12-12

最新评论