详情介绍
Constme-Whisper是一款本地离线语音转文字工具,支持 GPU、支持实时语音转换。Whisper是由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Whisper 项目则是 whisper.cpp 在 Windows 上的实现,并增加了显卡的支持,使得速度大幅提升。欢迎需要此款工具的朋友前来下载使用。
软件介绍
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器,用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
下载 Whisper 模型
而 Const-me 的这个名为 Whisper 的项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:
开发者推荐 ggml-medium.bin,因为一直在使用这个模型进行测试,1.53 GB 大小。
使用 Whisper
在 Model Path 里面选择你下载的模型,然后选择 GPU 就能进入软件了。
之后,就可以选择通过麦克风实时转换,或者使用音频文件比如 MP3 来转换为文字了:
青小蛙随便测试了一个极客湾的视频(仅下载了音频),效果如下:
准确度很高,基本上比较满意。
由于是在虚拟机中测试,显卡性能有限,所以时间不具有参考性。
不过,开发者的测试是在装有 GeForce 1080Ti GPU 的台式电脑上,中型模型,3 分 24 秒语音使用 PyTorch 和 CUDA 转录需要 45 秒,但使用这个和 DirectCompute 只需要 19 秒。而 @JoeCubber 同学测试的是 11:31 分钟的音频,耗时1分26秒完成。
当然,你需要有显卡。
实在是没想到,挖矿之后,显卡又有了用武之地。
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
注意:
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具
下载地址
人气软件
IBM ViaVoice Pro v9.1 简体中文版
iZotope RX6 Audio Editor Advanced(音频修复工具) v6.0 安装特
Adobe Audition CC 2019 12.1 中/英文正式最新版 64位
高级音频后期制作Steinberg Nuendo v12.0.70 x64 安装激活版(附
变声宝宝 V2.767 把你的声音变成男声、女声、童声的软件
MP3万能格式化工具 MDBoot
Voxengo SPAN Plus(音频频谱分析软件) v1.5 破解安装版
铃声助手 铃声编辑器 v0.21 绿色免费版
Discord4(修复损坏音频软件) v4.0 免费安装版
dvd音频提取工具 Clone2Go DVD Ripper V2.8.1 官方简体中文特别
相关文章
- 金舟AI变声器 V2.1.5 官方安装版(附详细使用教程)
金舟AI变声器专业的变声器软件,这款提供了动漫、氛围、个性、搞笑、游戏语音包等,可统一对所有音视频文件进行变声效果自然等,本站提供的是这款软件的安装版本,欢迎需要...
- 讯飞语音助手 for Linux(语音录入与翻译) v4.10.0.10 免费Linux版
讯飞语音助手Linux版是一款适用于电脑端的语音录入与翻译软件,适用语音生成.语音鉴别.语音广播和语音搜索的智能化语音服务等,欢迎下载体验...
- 音频修复iZotope RX 11 Audio Editor Advanced v11.0.0 免安装绿色便携版 64位
iZotope RX 11是一个非常稳定畅销的音频修复工具包,可使用 RX 来改善噪音、失真,或让有瑕疵的音频变成纯真的素材,RX11包括经过大修的维修助手、用于自信释放履带的新工...
- 简鹿人声分离(伴奏提取)V1.0.0 官方安装版
简鹿人声分离利用AI技术,支持将音视频人声进行分离,支持批量操作,提取效果很好的伴奏和人声等...
- iZotope RX 11 Audio Editor Advanced v11.0.1 CE 一键免费直装版 64位
iZotope RX11是一款非常稳定畅销的音频修复工具包,可使用 RX 来改善噪音、失真,或让有瑕疵的音频变成纯真的素材,RX11包括经过大修的维修助手、用于自信释放履带的新工具...
- NovaMSS(音乐源分离工具) v1.3.3社区版 中文绿色免费版(CPU/GPU)
NovaMSS 基于最新 AI 模型优化的音乐源分离工具,它能够轻松地批量提取伴奏、人声、贝斯、鼓点等音轨,并且支持 GPU 加速,以提高处理速度和效率,社区版完全免费,简单易...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的Constme-Whisper(离线语音识别转文字) v1.12 绿色免费版(含完整模型)资源来源互联网,版权归该下载资源的合法拥有者所有。