Python详解文字转语音的实现

 更新时间:2022年02月14日 16:31:14   作者:迢迢x  
在自然语言处理上,文字、音频互转是一个很关键的技术点。对于语音转文字,个人实现较为困难,我们可以使用语音转文字的软件或借助各API(如科大讯飞等)进行移植开发。不过文字转语音就相对而言容易实现很多了

前言:

这是一篇简单的Python文字(汉字)转语音教程,当然对于其他语言工具在实现的方法上也是一样的 。

汉字转语音实现就分为两步,第一步将汉字转为拼音,第二步通过拼音调用相匹配的音频文件。下面是具体的开发实例教程。

开发环境:Windows

Python版本:3.x

外置模块准备:pygame(可直接在cmd命令行中pip install pygame安装)

汉字转拼音

我使用的是将汉字转为Unicode码,然后通过查询一个匹配文件(我使用的是unicode_py.txt)获取该汉字的拼音,该文件中列有从4E00-9FA5标准汉字的Unicode编码所对应的拼音,外加一个落单的3007编码的“〇”。

文件如下:

在大写拼音英文后的1,2,3,4,5分别表示一,二,三,四和轻声(注意到存在有多音字)

我们将其封装成一个函数,参数为一个全是汉字的字符串,返回是一个拼音字符串。(即chinese_to_pinyin("秋水共长天一色") 返回的是"QIU1 SHUI3 GONG4 CHANG2 TIAN1 YI1 SE4 ")

源码如下:

def chinese_to_pinyin(x):
    y = ''
    dic = {}
    with open("unicode_py.txt") as f:
        for i in f.readlines():
            dic[i.split()[0]] = i.split()[1]
    for i in x:
        i = str(i.encode('unicode_escape'))[-5:-1].upper()
        try:
            y += dic[i] + ' '
        except:
            y += 'XXXX ' #非法字符我们用XXXX代替
    return y

说明:将该文件与"unicode_py.txt"文件放在同一目录下,代码比较简陋,因为主要给大家讲实现教学,所以没有对多音字进行处理(所以默认使用第一个使用频率最高的音)

拼音转语音

这一步也比较简单,我们根据拼音调用相对应的单个音的音频文件即可。单个音的音频文件可以自己录或找人录,渠道有很多哦。注意文件格式,最好是mp3或wav文件。

部分文件展示如下:

我们将其置入一个voice文件夹下。准备工作就做好了。

我们同样将汉字转语音封装成一个make_voice函数,参数为一个汉字字符串,然后调用chinese_to_pinyin函数,返回值不重要,可为空,功能实现是调用音频文件发音。

源码如下:

import pygame
def make_voice(x):
    pygame.mixer.init()
    voi = chinese_to_pinyin(x).split()
    for i in voi:
        if i == 'XXXX':  #处理'XXXX'的音,可将其忽略
            continue
        pygame.mixer.music.load("voice/" + i + ".mp3")
        pygame.mixer.music.play()
        while pygame.mixer.music.get_busy() == True:
            pass
    return None

我们展示一下这个教学版的最后完整的代码图(该文件名为"test.py"):

import pygame
 
def chinese_to_pinyin(x):
    y = ''
    dic = {}
    with open("unicode_py.txt") as f:
        for i in f.readlines():
            dic[i.split()[0]] = i.split()[1]
    for i in x:
        i = str(i.encode('unicode_escape'))[-5:-1].upper()
        try:
            y += dic[i] + ' '
        except:
            y += 'XXXX '
    return y
 
def make_voice(x):
    pygame.mixer.init()
    voi = chinese_to_pinyin(x).split()
    for i in voi:
        if i == 'XXXX':
            continue
        pygame.mixer.music.load("voice/" + i + ".mp3")
        pygame.mixer.music.play()
        while pygame.mixer.music.get_busy() == True:
            pass
    return None
 
while True:
    p = input("请输入文字:")
    make_voice(p)
 

教程文件的目录结构:

test.py
unicode_py.txt
voice----A1.mp3
         A2.mp3
         A3.mp3
         ...

实现原理就是这样,同时也可以视一些具体情况做一些拓展,例如将阿拉伯数字转汉字读法(即1234006.15读作“一百二十三万四千零六点一五”,这个实现不难),还有将多音字问题攻破也是很棒的。

当然只要想法够丰富用pygame的音频功能也能实现很多有趣的功能(如播放器制作或电子音乐简单创作等)。

结尾:

以上就是本文的全部内容了,大家喜欢的记得点点赞!

到此这篇关于Python详解文字转语音的实现的文章就介绍到这了,更多相关Python 文字转语音内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python读取TIF影像的多种方法

    Python读取TIF影像的多种方法

    Python提供了丰富的库来读取和处理TIFF文件,其中PIL库是最常用的,本文给大家介绍Python读取TIF影像的几种方法,需要的朋友可以参考下
    2023-07-07
  • Python函数参数的4种方式

    Python函数参数的4种方式

    本文主要介绍了Python函数参数的4种方式,主要包括必选参数,默认参数,可选参数,关键字参数,具有一定的参考价值,感兴趣的可以了解一下
    2024-01-01
  • Python图像处理之图片文字识别功能(OCR)

    Python图像处理之图片文字识别功能(OCR)

    Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司)。这篇文章主要介绍了Python图像处理之图片文字识别功能 OCR的相关知识,需要的朋友可以参考下
    2019-07-07
  • 关于python的缩进规则的知识点详解

    关于python的缩进规则的知识点详解

    在本篇文章里小编给大家整理了关于python的缩进规则的知识点详解,有兴趣的朋友们可以学习下。
    2020-06-06
  • python 获取文件列表(或是目录例表)

    python 获取文件列表(或是目录例表)

    在python的应用过程中,经常会用到获取文件列表的方法,常规的做法是这样的
    2009-03-03
  • Python的垃圾回收机制深入分析

    Python的垃圾回收机制深入分析

    这篇文章主要介绍了Python的垃圾回收机制,有助于深入的理解Python的内存分配与回收机制,需要的朋友可以参考下
    2014-07-07
  • Python continue继续循环用法总结

    Python continue继续循环用法总结

    本篇文章给大家总结了关于Python continue继续循环的相关知识点以及用法,有需要的朋友跟着学习下吧。
    2018-06-06
  • 最新python 字符串数组互转问题

    最新python 字符串数组互转问题

    这篇文章主要介绍了最新python 字符串数组互转问题,主要介绍了字符串转list数组问题和list数组转字符串问题,本文结合示例代码给大家介绍的非常详细,需要的朋友可以参考下
    2023-02-02
  • Python实现图片压缩的案例详解

    Python实现图片压缩的案例详解

    这篇文章主要介绍了如何用最简洁的Python代码实现图片压缩效果,还可以保证照片不失真,感兴趣的小伙伴可以跟随小编一起动手试试
    2022-01-01
  • Python实现字符串中某个字母的替代功能

    Python实现字符串中某个字母的替代功能

    小编想实现这样一个功能:将输入字符串中的字母 “i” 变成字母 “p”。想着很简单,怎么实现呢?下面小编给大家带来了Python实现字符串中某个字母的替代功能,感兴趣的朋友一起看看吧
    2019-10-10

最新评论