C#实现中文录音文件转为文本文字

 更新时间:2024年12月26日 10:29:31   作者:洱海之月  
这篇文章主要为大家详细介绍了C#如何实现把中文录音文件(.mp3 .wav)转为文本文字内容,文中的示例代码讲解详细,感兴趣的小伙伴可以参考下

我们有一个中文录音文件.mp3格式或者是.wav格式,如果我们想要提取录音文件中的文字内容,我们可以采用以下方法,不需要使用Azure Speech API 密钥注册通过离线的方式实现。

1.首先我们先在NuGet中下载两个包 NAudio 2.2.1、Whisper.net 1.7.3

2.另外我们还需要从Hugging Face网址中下载一个 ggml-medium.bin 文件

3. 代码部分,由于我们Whisper模型只支持16KHz的语音文件

所以我们要把不同音频格式的文件统一转为16000Hz的音频数据文件,如下是具体代码:

using NAudio.Wave;
using System;
 
public class AudioResampler
{
    public static void ConvertTo16kHz(string inputFile, string outputFile)
    {
        // 打开原始音频文件
        using (var reader = new WaveFileReader(inputFile))
        {
            // 创建目标音频格式 16kHz,单声道,16位
            var targetFormat = new WaveFormat(16000, 1); // 16000Hz, Mono, 16-bit
 
            // 创建转换流,使用 WaveFormatConversionStream 进行重采样
            using (var conversionStream = new WaveFormatConversionStream(targetFormat, reader))
            {
                // 将转换后的音频数据写入新文件
                WaveFileWriter.CreateWaveFile(outputFile, conversionStream);
                Console.WriteLine("文件已转换为 16kHz 格式");
            }
        }
    }
}
 
// 使用示例
class Program
{
    static void Main(string[] args)
    {
        string inputFile = @"path_to_input_file.wav";  // 输入文件路径
        string outputFile = @"path_to_output_file_16kHz.wav";  // 输出文件路径
        AudioResampler.ConvertTo16kHz(inputFile, outputFile);
    }
}

4.接下来是详细的具体代码

public async Task Analyze()
{
    //模型
    string modelFilePath = System.IO.Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "ggml-medium-q8_0.bin");
    // 初始化Whisper工厂和处理器
    var whisperFactory = WhisperFactory.FromPath(modelFilePath);
    var processor = whisperFactory.CreateBuilder()
        .WithLanguage("zh") // 设置识别的语言为中文
        .Build();
    try
    {
        string audioFileName = "path_to_output_file_16kHz.wav";
        string audioFilePath = System.IO.Path.Combine(AppDomain.CurrentDomain.BaseDirectory, audioFileName);
        // 读取音频文件
        using var audioStream = File.OpenRead(audioFilePath);
 
        // 处理音频文件并输出结果
        Console.WriteLine("Transcribing audio file...");
 
        await foreach (SegmentData result in processor.ProcessAsync(audioStream, default))
        {
            Console.WriteLine($"{result.Start}->{result.End}: {result.Text}");
        }
    }
    catch (Exception ex)
    {
        Console.WriteLine($"An error occurred: {ex.Message}");
    }
    Console.WriteLine("Press any key to exit...");
}

其中需要注意的是 ggml-medium-q8_0.bin文件的绝对路径,此文件的获取方式上述已说明。

string modelFilePath = System.IO.Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "ggml-medium-q8_0.bin");

到此这篇关于C#实现中文录音文件转为文本文字的文章就介绍到这了,更多相关C#录音转文本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#使用融合通信API发送手机短信功能

    C#使用融合通信API发送手机短信功能

    融合云通信服务平台,为企业提供全方位通信服务,发送手机短信是其一项核心功能,本文介绍了如何使用融合云通信服务平台的API通过C#实现发送手机短信的功能,感兴趣的朋友跟随小编一起看看吧
    2024-11-11
  • C# DES加密算法中向量的作用详细解析

    C# DES加密算法中向量的作用详细解析

    以下是对C#中DES加密算法中向量的作用进行了详细的介绍,需要的朋友可以过来参考下
    2013-09-09
  • c#关于JWT跨域身份验证的实现代码

    c#关于JWT跨域身份验证的实现代码

    这篇文章主要介绍了c#关于JWT跨域身份验证的实现代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • C#如何自动选择出系统中最合适的IP地址

    C#如何自动选择出系统中最合适的IP地址

    这篇文章介绍了C#如何自动选择出系统中最合适的IP地址,非常具有实用价值,需要的朋友可以参考下
    2015-08-08
  • C#数据结构与算法揭秘三 链表

    C#数据结构与算法揭秘三 链表

    这节我们讨论链表的基本操作,并且画图以证明,下届中我们将讨论双向链表,环形链表 应用举例
    2012-11-11
  • 基于C#实现的三层架构实例

    基于C#实现的三层架构实例

    这篇文章主要介绍了基于C#实现的三层架构实例,非常实用,需要的朋友可以参考下
    2014-08-08
  • C#控件编程之显示信息控件详解(Label、LinkLabel)

    C#控件编程之显示信息控件详解(Label、LinkLabel)

    这篇文章主要介绍了C#控件编程之显示信息控件详解(Label、LinkLabel),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2025-04-04
  • .NET使用C#实现将Word文档转换为HTML格式

    .NET使用C#实现将Word文档转换为HTML格式

    这篇文章主要为大家详细介绍了如何在.NET平台使用C#将Word文档转换为HTML文件,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-01-01
  • C#下载网页并在控制台输出的方法

    C#下载网页并在控制台输出的方法

    这篇文章主要介绍了C#下载网页并在控制台输出的方法,涉及C#基于http协议进行网页抓取及控制台输出显示的相关技巧,需要的朋友可以参考下
    2015-07-07
  • Unity实现红酒识别的示例代码

    Unity实现红酒识别的示例代码

    本文主要介绍了如何通过Unity实现红酒识别,可以实现识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息,感兴趣的可以学习一下
    2022-02-02

最新评论