python语音识别whisper的使用

 更新时间:2023年02月27日 10:05:49   作者:风华浪浪  
本文主要介绍了python语音识别whisper的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

一、背景

最近想提取一些视频的字幕,语音文案,研究了一波

二、whisper语音识别

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
stable-ts在 OpenAI 的 Whisper 之上修改并添加了更大的破解代码发布,生成更准确的阶段时间切换,并在无须额外推介的情况下获得申领

安装

pip install openai-whisper 
pip install stable-ts
SizeParametersEnglish-only modelMultilingual modelRequired VRAMRelative speed
tiny39 Mtiny.entiny~1 GB~32x
base74 Mbase.enbase~1 GB~16x
small244 Msmall.ensmall~2 GB~6x
medium769 Mmedium.enmedium~5 GB~2x
large1550 MN/Alarge~10 GB1x

三、示例

模型越大,越精确,相应话费的时间越长
自带语言识别功能,language最好加上,下面歌曲识别为英语,加后为中文
stable_whisper 是 whisper 进化版

import whisper
import stable_whisper as whisper

class WhisperTranscriber(object):

    def __init__(self, model_name):
        self.model = whisper.load_model(model_name)

    def whisper_transcribe(self, audio_path):
        audio = self.model.transcribe(audio_path, fp16=False, language='Chinese')
        return audio['text']

if __name__ == '__main__':

    transcriber = WhisperTranscriber("base")
    text = transcriber.whisper_transcribe("257853511.mp3")
    print(text)

可能是伴奏声音过大,你才出来这是什么歌了吗?stable_whisper 别的用法、生成字幕

import stable_whisper
model = stable_whisper.load_model('base')
results = model.transcribe('257853511.mp3', fp16=False, language='Chinese')
stable_whisper.results_to_sentence_srt(results, 'audio')
stable_whisper.results_to_sentence_word_ass(results, 'audio.ass')

四、封装工具

buzz

如果遇到简繁转换可以石下面

pip install zhconv
  • zh-cn 大陆简体
  • zh-hant 繁體
from zhconv import convert     
convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'

到此这篇关于python语音识别whisper的使用的文章就介绍到这了,更多相关python语音识别whisper内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • django用户登录和注销的实现方法

    django用户登录和注销的实现方法

    这篇文章主要介绍了django用户登录和注销的实现方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-07-07
  • 在python3中实现更新界面

    在python3中实现更新界面

    今天小编就为大家分享一篇在python3中实现更新界面,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • selenium+超级鹰实现模拟登录12306

    selenium+超级鹰实现模拟登录12306

    这篇文章主要介绍了selenium+超级鹰实现模拟登录12306,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • python中list列表复制的几种方法(赋值、切片、copy(),deepcopy())

    python中list列表复制的几种方法(赋值、切片、copy(),deepcopy())

    本文主要介绍了python中list列表复制的几种方法(赋值、切片、copy(),deepcopy()),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • Python计算点到直线距离、直线间交点夹角

    Python计算点到直线距离、直线间交点夹角

    这篇文章主要介绍了Python计算点到直线距离、直线间交点夹角,需要的朋友可以参考下
    2021-12-12
  • 在PyCharm中实现关闭一个死循环程序的方法

    在PyCharm中实现关闭一个死循环程序的方法

    今天小编就为大家分享一篇在PyCharm中实现关闭一个死循环程序的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • Python实现针对中文排序的方法

    Python实现针对中文排序的方法

    这篇文章主要介绍了Python实现针对中文排序的方法,结合实例形式较为详细的分析了Python针对中文进行排序操作出现的问题与相关处理技巧,需要的朋友可以参考下
    2017-05-05
  • 浅谈python中常用的8种经典数据结构

    浅谈python中常用的8种经典数据结构

    这篇文章主要介绍了python中常用的8种经典数据结构,包括原生数据结构,NumPy包中的数据结构,以及Pandas包中的数据结构,需要的朋友可以参考下
    2023-03-03
  • Python如何使用Eel和HTML开发桌面应用

    Python如何使用Eel和HTML开发桌面应用

    这篇文章主要介绍了Python使用Eel和HTML开发桌面应用问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • pygame实现非图片按钮效果

    pygame实现非图片按钮效果

    这篇文章主要介绍了pygame实现非图片按钮效果,不使用图片制作,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10

最新评论