详情介绍
CosyVoice是通义实验室依托大规模预训练语言模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。可以应用于:
智能设备/机器人播报的语音内容,如智能客服机器人、智能音箱、数字人、语音助手等。
音视频创作中需要将文字转为语音播报的场景,如小说阅读、新闻播报、影视解说、剧本配音等。
CosyVoice则专注自然语音生成,支持多语言、音色和情感控制,支持中英日粤韩5种语言的生成,效果显著优于传统语音生成模型。
仅需要3~10s的原始音频,CosyVoice即可生成模拟音色,甚至包括韵律、情感等细节,包括跨语种语音生成。而且CosyVoice支持以富文本或自然语言的形式,对生成语音的情感、韵律进行细粒度的控制,生音频在情感表现力上得到明显提升。
CosyVoice是一款基于语音量化编码的语音生成大模型。它对语音进行离散化编码,并依托大模型技术,实现自然流畅的语音生成体验。与传统语音生成技术相比,CosyVoice具有韵律自然、音色逼真等特点。CosyVoice支持多达5种语言,同时还支持以自然语言或富文本形式对生成语音进行情感等维度的细粒度控制。研究团队提供了基模型CosyVoice-300M、经过SFT微调后的模型CosyVoice-300M-SFT、以及支持细粒度控制的模型CosyVoice-300M-Instruct,可满足不同场景下的使用需求。
通过与原始音频以及最近大火的ChatTTS对比,可以发现CosyVoice的合成音频在内容一致性上更高,并且没有很少存在幻觉额外多字的现象。CosyVoice很好地建模了合成文本中的语义信息,达到了与人类发音人相当的水平。此外,通过对合成音频进行重打分,能够进一步降低识别的错误率,甚至在内容一致性和说话人相似度上超越人类。(文件包有预合成演示音频,可自行听取)
使用说明
1.选择推理模式
2.点击骰子按钮(可选),可以改变说话人的语调和韵律
3.按照提示步骤进行操作

稍微等待一下,程序就处理完毕了,可以在页面底部的输出音频界面播放和下载合成后的语音

注意事项
①项目安装路径不要包含中文
②推荐使用GTX1060以上显卡运行此项目
③使用过程中若不慎关闭软件后台,请重新打开,并刷新网页
更新内容:
1、新增手动选择参考音频列表

将需要克隆的参考音频拷贝到软件根目录下的 “参考音频” 文件夹,并将文件名改名为音频说话内容,如下图

点击“刷新参考音频”即可。
2、自定义音色保存

克隆音色生成后,在下方输入音色名称,保存即可。如上图。
比如我们将克隆后的“大幂幂”的音色保存下来,这里输入 大幂幂
保存后,点这里的“刷新新增音色”

即可在新增音色里找到我们刚才克隆的“大幂幂”的音色

后期需要使用这个音色生成音频,就直接在这里选择“大幂幂”即可。
下载地址
人气软件

PreSonus Studio One 6 Professional V6.6.2 中文永久免费版(附
最强伴奏与人声一键分离工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One Pro 7 v7.2.1 中文完整免费版(附安装教程)
Studio One6机架效果包插件 V6.0.2 中文免费版(附使用教程)
IBM ViaVoice Pro语音识别输入系统 v9.1 简体中文版
大饼AI变声 v2.5.8 官方安装版
Adobe Audition 2024(Au2024) v24.6.0.069 中文安装免费版 64位
阿里开源语音模型CosyVoice 0721 整合包 免费版
终极伴奏人声提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
Native Instruments Kontakt 8 v8.8.0 完整安装免费版(附文件+教
相关文章
-
EZ Meta Tag Editor 音频标签编辑器 v12.3.4.1 绿色免费版EZ Meta Tag Editor是一款专业实用的音乐文件编辑软件,有的时候用户需要对音乐添加各种标签,或者编辑音乐的各个参数进行管理,直接通过该软件就可以直接进行设置,欢迎需...
-
广告配音王(配音软件) V1.0 免费安装版广告配音王是一款真正为广告行业量身打造的专业软件,它不仅简化了文字转语音的过程,还大大提高了音频文件的质量...
-
冬瓜配音 v1.3.0 官方安装版冬瓜配音提供多样的语音库,涵盖各种音色、语调,满足用户多样化的配音需求,欢迎下载使用...
-
优声音频转换大师 V1.0.1.1 官方安装版优声音频转换大师支持音频格式转换、音频合并、音频变速、音频剪切、音频变调、音频添加封面、音频音量调整等功能...
-
全方位录音 V2.1.0.2 官方安装版全方位录音提供了麦克风录音、电脑系统录音、电脑内录、音乐平台录制等,支持的格式MP3,WMA,AC3,FLAC,WAV,M4A,OGG等,欢迎下载...
-
团子AI(伴奏提取分离)v1.0.10 linux最新版团子AI专业的人工智能工具,该软件拥有专业 NVIDIAV100 计算卡,提供批量处理工具,无人托管,一键上传,批量处理...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的阿里开源语音模型CosyVoice 0721 整合包 免费版资源来源互联网,版权归该下载资源的合法拥有者所有。






























