C#实现读取txt通用的方法小结

 更新时间:2024年01月29日 15:52:59   作者:搬砖的诗人Z  
这篇文章主要为大家详细介绍了C#读取txt通用的方法,兼容所有的UTF-8、Unicode(Little Endian)、BigEndianUnicode,有需要的小伙伴可以了解下

该类主要支持判断三种编码类型:UTF-8、Unicode(Little Endian)、BigEndianUnicode。在执行判断时,会检查文件的字节序标记(BOM)以及一些特征字节,从而确定文件的编码类型。这样的判断对于读取文件时确保正确解析文本内容。

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

namespace ImageRect
{
    public class EncodingType
    {
        /// <summary>
        /// 给定文件的路径,读取文件的二进制数据,判断文件的编码类型
        /// </summary>
        /// <param name=“FILE_NAME“>文件路径</param>
        /// <returns>文件的编码类型</returns>
        public static System.Text.Encoding GetType(string FILE_NAME)
        {
            FileStream fs = new FileStream(FILE_NAME, FileMode.Open, FileAccess.Read);
            Encoding r = GetType(fs);
            fs.Close();
            return r;
        }

        /// <summary>
        /// 通过给定的文件流,判断文件的编码类型
        /// </summary>
        /// <param name=“fs“>文件流</param>
        /// <returns>文件的编码类型</returns>
        public static System.Text.Encoding GetType(FileStream fs)
        {
            byte[] Unicode = new byte[] { 0xFF, 0xFE, 0x41 };
            byte[] UnicodeBIG = new byte[] { 0xFE, 0xFF, 0x00 };
            byte[] UTF8 = new byte[] { 0xEF, 0xBB, 0xBF }; //带BOM
            Encoding reVal = Encoding.Default;

            BinaryReader r = new BinaryReader(fs, System.Text.Encoding.Default);
            int i;
            int.TryParse(fs.Length.ToString(), out i);
            byte[] ss = r.ReadBytes(i);
            if (IsUTF8Bytes(ss) || (ss[0] == 0xEF && ss[1] == 0xBB && ss[2] == 0xBF))
            {
                reVal = Encoding.UTF8;
            }
            else if (ss[0] == 0xFE && ss[1] == 0xFF && ss[2] == 0x00)
            {
                reVal = Encoding.BigEndianUnicode;
            }
            else if (ss[0] == 0xFF && ss[1] == 0xFE && ss[2] == 0x41)
            {
                reVal = Encoding.Unicode;
            }
            r.Close();
            return reVal;

        }

        /// <summary>
        /// 判断是否是不带 BOM 的 UTF8 格式
        /// </summary>
        /// <param name=“data“></param>
        /// <returns></returns>
        private static bool IsUTF8Bytes(byte[] data)
        {
            int charByteCounter = 1; //计算当前正分析的字符应还有的字节数
            byte curByte; //当前分析的字节.
            for (int i = 0; i < data.Length; i++)
            {
                curByte = data[i];
                if (charByteCounter == 1)
                {
                    if (curByte >= 0x80)
                    {
                        //判断当前
                        while (((curByte <<= 1) & 0x80) != 0)
                        {
                            charByteCounter++;
                        }
                        //标记位首位若为非0 则至少以2个1开始 如:110XXXXX...........1111110X
                        if (charByteCounter == 1 || charByteCounter > 6)
                        {
                            return false;
                        }
                    }
                }
                else
                {
                    //若是UTF-8 此时第一位必须为1
                    if ((curByte & 0xC0) != 0x80)
                    {
                        return false;
                    }
                    charByteCounter--;
                }
            }
            if (charByteCounter > 1)
            {
                throw new Exception("非预期的byte格式");
            }
            return true;
        }

    }
}

到此这篇关于C#实现读取txt通用的方法小结的文章就介绍到这了,更多相关C#读取txt内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#中ZipHelper 压缩和解压帮助类

    C#中ZipHelper 压缩和解压帮助类

    本文介绍C#实现压缩与解压缩帮助类ZipHelper,主要是通过ICSharpCode.SharpZipLib 类库实现的。
    2016-05-05
  • C#实现DataTable,List和Json转换的方法

    C#实现DataTable,List和Json转换的方法

    这篇文章主要介绍了C#实现DataTable,List和Json转换的方法,结合实例形式分析了DataTable、list、DataReader、DataSet等转换成JSON的相关实现技巧,需要的朋友可以参考下
    2016-08-08
  • C#中Kestrel和IIS服务器下的同步与异步配置

    C#中Kestrel和IIS服务器下的同步与异步配置

    本篇文章主要讲解什么是Kestrel和IIS服务器和特点,以及他们如何配置同步与异步,具有一定的参加价值,感兴趣的可以了解一下
    2023-08-08
  • C#自定义字符串补0函数实例

    C#自定义字符串补0函数实例

    这篇文章主要介绍了C#自定义字符串补0函数,通过一个自定义函数形式实例分析了C#操作字符串实现补零操作的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • 详解C++中类的大小决定因数

    详解C++中类的大小决定因数

    类的大小受多个因素影响,主要包括成员变量、对齐方式、继承关系、虚函数表等,下面就来介绍一下,具有一定的参考价值,感兴趣的可以了解一下
    2025-04-04
  • 详解C#如何控制多线程同步执行

    详解C#如何控制多线程同步执行

    使用Task类来控制多线程的同步执行,可应用于多任务分发执行后,这篇文章主要为大家详细介绍了C#如何通过Task类控制多线程同步执行,感兴趣的小伙伴可以了解下
    2023-12-12
  • sort page 排序和分页的小例子

    sort page 排序和分页的小例子

    花了一上午时间,终于写了一个进行排序并且分页的类,下面将代码贴出来,望大家指正。
    2013-05-05
  • C# 单向链表的实现方法

    C# 单向链表的实现方法

    本文介绍了C#中单向链表的基本概念、节点结构以及基本操作,包括查找、插入和删除节点的方法,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
    2025-11-11
  • C#的WebBrowser的操作与注意事项介绍

    C#的WebBrowser的操作与注意事项介绍

    C#的WebBrowser的操作与注意事项介绍,需要的朋友可以参考一下
    2013-03-03
  • C#实现跨线程操作控件方法

    C#实现跨线程操作控件方法

    这篇文章主要介绍了C#实现跨线程操作控件方法,主要采用异步访问方式实现,需要的朋友可以参考下
    2014-10-10

最新评论