用javascript实现gb2312转utf-8的脚本

 更新时间:2007年05月16日 00:00:00   作者:  
信息交换用汉字编码字符集-基本集
汉字标准交换码共分两级。第一级为常用字,有3755字,按汉语拼音字母顺序排列,第二级为次常用字,有3008字,按部首排列。GB2312的编码范围为2121H-777EH.
UNICODE 是两字节的全编码,对于ASCII字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字符,还是汉字的高字节。如果发生数据损坏, 某处内容破坏,则会引起其后汉字的混乱。UNICODE则一律使用两个字节表示一个字符,最明显的好处是它简化了汉字的处理过程。
关于编码的文章可以参考:
http://blog.iyi.cn/tech/2005/10/unicode_2.html
http://blog.iyi.cn/tech/2005/10/unicode.html

百度的页面是gb2312的,URL编码自然也是从gb转换而来,比如“一”这个字,百度转换的结果是D2%BB,而从Utf-8转换来的结果是%E4%B8%80比如google(gb是2字节编码,utf-8是3字节变长编码)
可以用javascript的encodeURI和decodeURI来得到这些结果,设置页面编码就可以看到不同结果了。
在网上找,也没找到现成的转换程序,只得自己写。还好网上不缺gb-utf的对照表,修改了一下就可以用了:gb-utf.txt
这个对照表是将gb字节编码转到utf的16进制编码,而不是字节编码。
javascript中escape和unescape是转换16进制编码用的,因此gb汉字到utf汉字的转换思路是:encodeURI("gb汉字"),到对照表中查找utf的16进制编码,unescape("16进制utf编码"),得到utf汉字。
中间那一步最关键,我的转换只用到了这一步,其他两步直接调用那两个函数就可以了。下面是转换程序: 
 
复制代码 代码如下:

function genCodeStr(){ 
    var codeRE = new RegExp("'(.*)' : '(.*)'","gi"); 
    var tempStr,codeStr = ""; 
    var myReader = new Reader(); 
    myReader.loadFile('inc/gb2312_utf.txt');//这里改成你的对照表存放的路径 
    while(!myReader.fStream.atEndofLine) { 
        tempStr = new String(myReader.fStream.readLine()); 
        codeStr += tempStr.replace(codeRE,"$1") + ":" + tempStr.replace(codeRE,"$2") + ":"; 
    } 
    Application("codeData") = codeStr; 

function getCodeStr(){ 
    var codeStr = new String(Application("codeData")); 
    if(codeStr.indexOf("%a1%a1") == -1){ 
        genCodeStr(); 
    } 
    return new String(Application("codeData")); 

function gb2utf(gbStr){ 
    var codeStr = getCodeStr(); 
    var codeRE = new RegExp("(%..%..)","gi"); 
    var replaceRE = new RegExp("(%..%..)","i"); 
    var gbCode; 
    var utfCode; 
    var gbStart; 
    while((codeRE.lastIndex < gbStr.length) && replaceRE.test(gbStr)){ 
        codeRE.exec(gbStr); 
        gbCode = new String(RegExp.$1); 
        gbStart = new Number(codeStr.indexOf(gbCode.toLowerCase())); 
        var utfStart = 0; 
        if(gbStart != -1){ 
            utfStart= gbStart + 7; 
            utfCode = codeStr.substring(utfStart,utfStart + 6); 
        }else{ 
            utfCode = "%u3000"; 
        } 
        gbStr = gbStr.replace(replaceRE,utfCode); 
    } 
    return gbStr; 

function Reader() {                        //Class        Reader() 
    this.fso;                            //Private    fso 
    this.fUri;                            //Private    fUri 
    this.fStream;                        //Private    fStream 
    try{ 
        this.fso = new ActiveXObject("Scripting.FileSystemObject"); 
    }catch(exception) { 
        throw exception; 
    } 
    this.loadFile = function(file) {        //Public        loadFile(file) 
            this.fUri = Server.mappath(file); 
            //var fStream = fso.CreateTextFile(tfolder,true,false); 
            //fStream.WriteLine('test'); 
            if(this.fso.fileExists(this.fUri)){ 
                this.fStream = this.fso.openTextFile(this.fUri); 
            }else{ 
                Response.write('file dos not exist'); 
            } 
    } 
    this.readLineN = function(num) { 
        var i = 1; 
        while(i < num && !this.fStream.atEndOfLine) { 
            this.fStream.skipLine(); 
            i++ 
        } 
        return this.fStream.readLine(); 
    } 
    this.closeFile = function() { 
        fStream.Close(); 
        fso.Close; 
    } 
}  

对照表就是gb-utf.txt了,你自己改一下读取路径即可。

还需要注意的是,上面的程序是需要在服务器端运行的,因为涉及到文件操作。
javascript客户端程序请看

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

相关文章

  • 微信小程序图片上传组件实现图片拖拽排序

    微信小程序图片上传组件实现图片拖拽排序

    最近在写小程序过程中遇到一个拖拽排序需求,上网一顿搜索未果,遂自行实现,下面这篇文章主要给大家介绍了关于微信小程序图片上传组件实现图片拖拽排序的相关资料,需要的朋友可以参考下
    2022-03-03
  • 分享一些不常见却很实用的JS技巧

    分享一些不常见却很实用的JS技巧

    有些代码,需要的时候能写的出来,但是也需要时间,如果有的东西长时间不接触,再次看的时候也会感觉很陌生,这篇文章主要给大家介绍了一些不常见却很实用的JS技巧,既可以作为一个知识的积累,又可以作为闲暇时打发时间写写代码的记录,需要的朋友可以参考下
    2021-11-11
  • JS在浏览器中存储用户名和密码的操作方法

    JS在浏览器中存储用户名和密码的操作方法

    当用户进行登录页后,直接从localStorage中把用户名和密码取出来,填充到表单里,对用户体验来说十分不错,今天通过本文给大家分享JS在浏览器中对用户名和密码进行存储,需要的朋友可以参考下
    2023-06-06
  • 在JavaScript中监听IME键盘输入事件

    在JavaScript中监听IME键盘输入事件

    在 JavaScript 中监听用户的键盘输入是很容易的事情,但用户一旦使用了输入法,问题就变得复杂了。
    2011-05-05
  • 旺旺在线客服代码 旺旺客服代码生成器

    旺旺在线客服代码 旺旺客服代码生成器

    很多朋友想在网站上插入自己的阿里旺旺在线联系图片,就像是和QQ一样,小编为大家详细讲解了旺旺在线客服代码以及旺旺客服代码生成器,希望能够帮助到大家。
    2018-01-01
  • JavaScript 事件代理需要注意的地方

    JavaScript 事件代理需要注意的地方

    这篇文章主要介绍了JavaScript 事件代理需要注意的地方,帮助大家更好的理解和学习JavaScript,感兴趣的朋友可以了解下
    2020-09-09
  • 多个jquery.datatable共存,checkbox全选异常的快速解决方法

    多个jquery.datatable共存,checkbox全选异常的快速解决方法

    这篇文章主要介绍了多个jquery.datatable共存,checkbox全选异常的快速解决方法。需要的朋友可以过来参考下,希望对大家有所帮助
    2013-12-12
  • 前端JavaScript经典之Promise详解

    前端JavaScript经典之Promise详解

    Promise是为了解决回调地狱问题而诞生的,它提供了优雅的异步回调解决方案,这篇文章主要介绍了前端JavaScript经典之Promise的相关资料,需要的朋友可以参考下
    2024-09-09
  • uniapp中获取dom元素的方法及更改dom元素颜色踩坑记录

    uniapp中获取dom元素的方法及更改dom元素颜色踩坑记录

    最近学到了一个比较好用的框架uni-app,可以做六端适配,学习一下,下面这篇文章主要给大家介绍了关于uniapp中获取dom元素的方法及更改dom元素颜色踩坑记录的相关资料,需要的朋友可以参考下
    2023-03-03
  • 基于JSONP原理解析(推荐)

    基于JSONP原理解析(推荐)

    下面小编就为大家推荐一篇基于JSONP原理解析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2017-12-12

最新评论