JScript中使用ADODB.Stream判断文件编码的代码

 更新时间:2008年06月09日 12:08:12   作者:  
在实现TextStraem的时候,找到判断文件编码的代码是VBS的,但是在JScript中是没有ASC等函数的,也不能对二进制数据进行处理,因此需要通过一个特别的方法来获取文件开关的编码标识。
一开始使用ASCII编码来读取文本数据,模拟读取二进制数据,但是发现如果字符编码大于127时,只会得到小于128的值,相当于和128取余了,因此ASCII编码是不行的。

继续寻找,在CodeProejct.com找到一篇文章《Reading And Writing Binary Files Using JScript》,里面刚好有我需要的内容。

其实说来也简单,就是把编码换一下,使用437,这个是IBM扩展过的ASCII编码,把ASCII编码的最高位也利用起来,将字符集中的字符从128个扩展到256个,而使用这个字符集读取的字符数据就相当于原始二进制数据了。

解决了障碍后,就要开始识别文件的编码了,通过使用ADODB.Stream对象来读取文件的开始两个字节,然后根据这两个字节就可以判断文件编码是什么了。

UTF-8文件如果带BOM的话,那么头两个字节就是0xEF、0xBB,再例如Unicode文件的开始两个字节是0xFF、0xFE,这些就是判断文件编码的依据。

需要注意的是,在ADODB.Stream读取字符时,并不是一一对应的,也就是说,如果二进制数据是0xEF,读取出来的字符经过charCodeAt之后,并不是0xFE,而是另外的值,这个对应表可以在上面提到的文章里查到。

程序代码:
复制代码 代码如下:

function CheckEncoding(filename) { 
    var stream = new ActiveXObject("ADODB.Stream"); 
    stream.Mode = 3; 
    stream.Type = 2; 
    stream.Open(); 
    stream.Charset = "437"; 
    stream.LoadFromFile(filename); 
    var bom = escape(stream.ReadText(2)); 
    switch(bom) { 
        // 0xEF,0xBB => UTF-8 
        case "%u2229%u2557": 
            encoding = "UTF-8"; 
            break; 
        // 0xFF,0xFE => Unicode 
        case "%A0%u25A0": 
        // 0xFE,0xFF => Unicode big endian 
        case "%u25A0%A0": 
            encoding = "Unicode"; 
            break; 
        // 判断不出来就使用GBK,这样可以在大多数情况下正确处理中文 
        default: 
            encoding = "GBK"; 
            break; 
    } 
    stream.Close(); 
    delete stream; 
    stream = null; 
    return encoding; 


这样,在需要的时候,通过调用CheckEncoding函数就可以获取文件的编码了。
希望此文对你有所帮助。

相关文章

  • JavaScript TWaver使用中间点画折线的方法

    JavaScript TWaver使用中间点画折线的方法

    这篇文章主要介绍了JavaScript TWaver使用中间点画折线的方法,TWaver的图形组件库中提供了拓扑组件、地图组件、设备图组件,以及表格、树图、属性表、图表等丰富的通用图形界面组件
    2022-07-07
  • js日期、星座的级联显示代码

    js日期、星座的级联显示代码

    本篇文章主要是对js日期、星座的级联显示代码进行了介绍,需要的朋友可以过来参考下,希望对大家有所帮助
    2014-01-01
  • JavaScript如何借用构造函数继承

    JavaScript如何借用构造函数继承

    这篇文章主要介绍了JavaScript如何借用构造函数继承,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • 一个获取第n个元素节点的js函数

    一个获取第n个元素节点的js函数

    这篇文章主要介绍了一个获取第n个元素节点的js函数,功能还不完善 ,需要的朋友可以参考下
    2014-09-09
  • JS+CSS实现下拉刷新/上拉加载插件

    JS+CSS实现下拉刷新/上拉加载插件

    这篇文章主要介绍了JS+CSS实现下拉刷新/上拉加载插件,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2017-03-03
  • TypeScript封装一个通用的时间格式化方法

    TypeScript封装一个通用的时间格式化方法

    在日常开发中,我们经常需要将时间格式化为用户友好的形式,本文将介绍如何在 TypeScript 中封装一个通用的时间格式化方法,需要的可以了解下
    2025-02-02
  • js实现的在本地预览图片功能示例

    js实现的在本地预览图片功能示例

    这篇文章主要介绍了js实现的在本地预览图片功能,结合实例形式分析了JavaScript兼容移动web与IE浏览器的图片预览功能相关实现技巧,需要的朋友可以参考下
    2019-11-11
  • 第四章之BootStrap表单与图片

    第四章之BootStrap表单与图片

    Bootstrap,来自 Twitter,是目前最受欢迎的前端框架。本文给大家介绍Bootstrap表单与图片的相关资料,需要的朋友可以参考下
    2016-04-04
  • JavaScript获取function所有参数名的方法

    JavaScript获取function所有参数名的方法

    本文使用javascript获取function所有参数名的方法,对js获取function所有参数名感兴趣的朋友一起学习吧
    2015-10-10
  • 动态加载js、css的实例代码

    动态加载js、css的实例代码

    这篇文章主要介绍了动态加载js、css的实例代码的相关资料,非常不错具有参考借鉴价值,感兴趣的朋友一起看看吧
    2016-05-05

最新评论