详情介绍
Constme-Whisper是一款本地离线语音转文字工具,支持 GPU、支持实时语音转换。Whisper是由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Whisper 项目则是 whisper.cpp 在 Windows 上的实现,并增加了显卡的支持,使得速度大幅提升。欢迎需要此款工具的朋友前来下载使用。
软件介绍
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器,用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
下载 Whisper 模型
而 Const-me 的这个名为 Whisper 的项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:
开发者推荐 ggml-medium.bin,因为一直在使用这个模型进行测试,1.53 GB 大小。
使用 Whisper
在 Model Path 里面选择你下载的模型,然后选择 GPU 就能进入软件了。

之后,就可以选择通过麦克风实时转换,或者使用音频文件比如 MP3 来转换为文字了:

青小蛙随便测试了一个极客湾的视频(仅下载了音频),效果如下:

准确度很高,基本上比较满意。
由于是在虚拟机中测试,显卡性能有限,所以时间不具有参考性。
不过,开发者的测试是在装有 GeForce 1080Ti GPU 的台式电脑上,中型模型,3 分 24 秒语音使用 PyTorch 和 CUDA 转录需要 45 秒,但使用这个和 DirectCompute 只需要 19 秒。而 @JoeCubber 同学测试的是 11:31 分钟的音频,耗时1分26秒完成。
当然,你需要有显卡。
实在是没想到,挖矿之后,显卡又有了用武之地。
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
注意:
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具
下载地址
人气软件

PreSonus Studio One 6 Professional V6.6.2 中文永久免费版(附
最强伴奏与人声一键分离工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One Pro 7 v7.2.1 中文完整免费版(附安装教程)
Studio One6机架效果包插件 V6.0.2 中文免费版(附使用教程)
大饼AI变声 v2.5.11 官方安装版
IBM ViaVoice Pro语音识别输入系统 v9.1 简体中文版
Adobe Audition 2024(Au2024) v24.6.0.069 中文安装免费版 64位
阿里开源语音模型CosyVoice 0721 整合包 免费版
终极伴奏人声提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
Native Instruments Kontakt 8 v8.9.0 完整安装免费版(附文件+教
相关文章
-
智能音频处理专家(格式转换/压缩/合并)v1.0.2.0 官方安装版智能音频处理专家Smart Audio Expert专业的音频处理软件,提供了音频转换、合并、压缩、调速以及bilibili转音频等...
-
优灵音频格式转换器 V3.2.5.1 官方安装版优灵音频格式转换器支持海量格式一键转换,支持多种视频格式转换,一键添加视频文件,批量提取成音频等,欢迎下载使用...
-
EZ Meta Tag Editor 音频标签编辑器 v12.3.4.1 绿色免费版EZ Meta Tag Editor是一款专业实用的音乐文件编辑软件,有的时候用户需要对音乐添加各种标签,或者编辑音乐的各个参数进行管理,直接通过该软件就可以直接进行设置,欢迎需...
-
广告配音王(配音软件) V1.0 免费安装版广告配音王是一款真正为广告行业量身打造的专业软件,它不仅简化了文字转语音的过程,还大大提高了音频文件的质量...
-
冬瓜配音 v1.4.1 官方安装版冬瓜配音提供多样的语音库,涵盖各种音色、语调,满足用户多样化的配音需求,欢迎下载使用...
-
优声音频转换大师 V1.0.1.1 官方安装版优声音频转换大师支持音频格式转换、音频合并、音频变速、音频剪切、音频变调、音频添加封面、音频音量调整等功能...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的Constme-Whisper(离线语音识别转文字) v1.12 绿色免费版(含完整模型)资源来源互联网,版权归该下载资源的合法拥有者所有。





































