Python+pypinyin实现将中文姓名拼音转换与搜索

 更新时间:2026年01月06日 08:55:26   作者:weixin_46244623  
这篇文章主要为大家详细介绍了如何基于 pypinyin 和pandas实现一个优雅且实用的中文姓名拼音转换与搜索方案,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以了解下

Python 使用 pypinyin 将中文姓名转换为拼音并支持拼音搜索

在实际业务中,我们经常会遇到这样的需求:

  • 将中文姓名转换为拼音
  • 支持通过拼音或拼音首字母搜索中文姓名
  • 结合 Pandas 对数据进行批量处理

本文将基于 pypinyin + pandas,实现一个优雅且实用的中文姓名拼音转换与搜索方案

一、环境准备

安装依赖

pip install pandas pypinyin

导入必要的库

import pandas as pd
from pypinyin import pinyin, Style

二、示例数据准备

假设我们有一列中文姓名数据:

data = {
    'name': ['张三', '李四', '王小五', '赵六']
}

df = pd.DataFrame(data)

当前 DataFrame 结构如下:

name
张三
李四
王小五
赵六

三、实现姓名拼音转换函数

我们希望实现两个拼音字段:

  • full_pinyin:姓名全拼(如 zhangsan
  • initials:姓全拼 + 名首字母(如 zhangs

核心函数实现

def get_full_pinyin_and_initials(name):
    """
    将中文姓名转换为:
    1. 全拼
    2. 姓全拼 + 名首字母
    """

    # 全拼(张三 -> zhangsan)
    full_pinyin = ''.join(
        pinyin(name, style=Style.NORMAL)[i][0]
        for i in range(len(name))
    )

    # 姓的全拼
    surname_pinyin = pinyin(name[0], style=Style.NORMAL)[0][0]

    # 名的首字母
    name_initials = pinyin(name[1:], style=Style.FIRST_LETTER)

    initials = surname_pinyin + ''.join(i[0] for i in name_initials)

    return full_pinyin, initials

四、批量生成拼音字段

使用 apply + pd.Series,将返回的元组拆分成多个列:

df[['full_pinyin', 'initials']] = (
    df['name']
    .apply(get_full_pinyin_and_initials)
    .apply(pd.Series)
)

处理后的 DataFrame:

namefull_pinyininitials
张三zhangsanzhangs
李四lisilis
王小五wangxiaowuwangxw
赵六zhaoliuzhaol

五、实现拼音搜索功能

支持以下两种搜索方式:

  • 全拼搜索
  • 拼音首字母搜索

搜索函数实现

def find_name_by_pinyin(input_pinyin):
    """
    根据拼音或拼音首字母查找姓名
    """

    matched_names = df[
        df['initials'].str.contains(input_pinyin, na=False) |
        df['full_pinyin'].str.contains(input_pinyin, na=False)
    ]

    return matched_names

六、使用示例

input_pinyin = "zhangs"
result = find_name_by_pinyin(input_pinyin)

print(result)

输出结果:

  name full_pinyin initials
0  张三    zhangsan   zhangs

七、完整代码

import pandas as pd
from pypinyin import pinyin, Style


# 假设你的 DataFrame 是这样的
data = {
    'name': ['张三', '李四', '王小五', '赵六']
}
df = pd.DataFrame(data)


# 定义获取拼音的函数
def get_full_pinyin_and_initials(name):
    # 获取全拼
    full_pinyin = ''.join(pinyin(name, style=Style.NORMAL)[i][0] for i in range(len(name)))

    # 获取姓的拼音和名的首字母
    surname_pinyin = pinyin(name[0], style=Style.NORMAL)[0][0]  # 姓的全拼
    name_initial = pinyin(name[1:], style=Style.FIRST_LETTER)  # 名的首字母
    initials = surname_pinyin + ''.join(n[0] for n in name_initial)

    return full_pinyin, initials


# 应用函数并创建新的列
df[['full_pinyin', 'initials']] = df['name'].apply(get_full_pinyin_and_initials).apply(pd.Series)


# 定义查找姓名的函数
def find_name_by_pinyin(input_pinyin):
    # 查找与输入拼音匹配的姓名
    matched_names = df[df['initials'].str.contains(input_pinyin, na=False) | 
                        df['full_pinyin'].str.contains(input_pinyin, na=False)]
    return matched_names


# 示例:查找拼音
input_pinyin = "zhangs"  # 你想要查找的拼音
result = find_name_by_pinyin(input_pinyin)


# 打印结果
print(result)

以上就是Python+pypinyin实现将中文姓名拼音转换与搜索的详细内容,更多关于Python pypinyin拼音转换与搜的资料请关注脚本之家其它相关文章!

相关文章

  • 用python实现批量重命名文件的代码

    用python实现批量重命名文件的代码

    任务很简单,某个目录下面有几千个文件,某些文件没有后缀名,现在的任务就是将所有的没有后缀名的文件加上后缀名,python有现成的函数可以实现,但是在实现过程中遇到几个问题,分享一下解决方法
    2012-05-05
  • 利用Python求阴影部分的面积实例代码

    利用Python求阴影部分的面积实例代码

    这篇文章主要给大家介绍了关于利用Python求阴影部分面积的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-12-12
  • python批量读取txt文件为DataFrame的方法

    python批量读取txt文件为DataFrame的方法

    下面小编就为大家分享一篇python批量读取txt文件为DataFrame的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • 浅谈DataFrame和SparkSql取值误区

    浅谈DataFrame和SparkSql取值误区

    今天小编就为大家分享一篇浅谈DataFrame和SparkSql取值误区,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python生成8位随机字符串的方法分析

    Python生成8位随机字符串的方法分析

    这篇文章主要介绍了Python生成8位随机字符串的方法,结合实例形式对比分析了2种比较常用的随机字符串生成技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2017-12-12
  • python装饰器decorator介绍

    python装饰器decorator介绍

    这篇文章主要介绍了python装饰器decorator介绍,decorator设计模式允许动态地对现有的对象或函数包装以至于修改现有的职责和行为,简单地讲用来动态地扩展现有的功能,需要的朋友可以参考下
    2014-11-11
  • Python环境搭建之OpenCV的步骤方法

    Python环境搭建之OpenCV的步骤方法

    本篇文章主要介绍了Python环境搭建之OpenCV的步骤方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-10-10
  • 详解Ubuntu环境下部署Django+uwsgi+nginx总结

    详解Ubuntu环境下部署Django+uwsgi+nginx总结

    这篇文章主要介绍了Ubuntu环境下部署Django+uwsgi+nginx总结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • 详解Python中的函数参数传递方法*args与**kwargs

    详解Python中的函数参数传递方法*args与**kwargs

    本文将讨论Python的函数参数。我们将了解args和kwargs,/和的都是什么,虽然这个问题是一个基本的python问题,但是在我们写代码时会经常遇到,比如timm中就大量使用了这样的参数传递方式
    2023-03-03
  • python logging添加filter教程

    python logging添加filter教程

    今天小编就为大家分享一篇python logging添加filter教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12

最新评论