在任意字符集下正常显示网页的方法一

 更新时间:2007年04月01日 00:00:00   作者:  
转:coolcode.cn
通常情况下,我们的网页要指定一个编码字符集,如 GB2312、UTF-8、ISO-8859-1 等,这样我们就可以在网页上显示我们指定编码的文字了。但是我们很可能会遇到这种情况,那就是我们可能希望在 ISO-8859-1 编码的网页上显示汉字,或者在 GB2312 编码的网页上显示韩文等。当然一种解决办法就是我们不用 ISO-8859-1 或者 GB2312 编码,而统统都采用 UTF-8 编码,这样我们只要在这种编码下,就可以混合显示各国文字了,这是现在很多网站采用的方法。

而我这里所说的并非上面这种方法,因为上面这种方法必须要指定字符集为 UTF-8 才可以,一旦用户手工指定为其他字符集,或者可能因为某些原因,那个字符集设置没起作用,而浏览器又没有正确自动识别的话,我们看到的网页还是乱码,尤其是在某些用框架作的网页中,某个框架中的页面如果字符集设置没起作用,在 firefox 中显示乱码而且还没法改变(我是说在不装RightEncode插件的情况下)。

而我这里介绍的方法即使是把网页指定为 ISO-8859-1 字符集,也能够正确显示汉字、日文等。原理很简单,就是把除了 ISO-8859-1 编码中前128个字符以外的所有其他的编码都用 NCR(Numeric character reference) 来表示。比如“汉字”这两个字,如果我们写成“汉字”这种形式,那么它在任意字符集下都可以正确显示。根据这个原理,我写了下面这个程序,它可以把现有的网页转化为在任意字符集下都能显示的网页。你只需要指定源网页的字符集和源网页,点提交按钮,就可以得到目标网页了。你也可以只转化某些文字,只需要把文字填写到文本框中,并指定这些文字原来的字符集,点提交按钮,就会在页面上面显示编码后的文字了。另外我还编写了 WordPress 的插件,现在我的 Blog 已经可以在任意字符集下都能正确显示了。
转化程序地址:http://jb51.net/dxy/nochaoscode/
复制代码 代码如下:

<?php
function nochaoscode($encode, $str, $isemail = false) {
    $str = iconv($encode, "UTF-16", $str); 
    for ($i = 0; $i < strlen($str); $i++,$i++) {
        $code = ord($str{$i}) * 256 + ord($str{$i + 1});
        if ($code < 128 and !$isemail) {
            $output .= chr($code);
        } else if ($code != 65279) {
            $output .= "&#".$code.";";
        }
    }
    return $output;
}
$encode = $_POST['encode'];
if ($encode == '') $encode = 'UTF-8';
if ($_FILES['file']['size'] > 0) {
    $data = nochaoscode($encode, file_get_contents($_FILES['file']['tmp_name']));
    header ("Content-type: application/octet-stream;"); 
    header ("Content-length: ".strlen($data)); 
    header ("Content-Disposition: attachment; filename=".$_FILES['file']['name']);
    echo $data;
} else {
    header ("Content-type: text/html; charset=UTF-8"); 
    if ($_POST['email']) {
        echo htmlentities(nochaoscode($encode, $_POST['email'], true));
    }
    else {
        echo htmlentities(nochaoscode($encode, $_POST['content']));
    }
?>
<form enctype="multipart/form-data" method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
file: <input type="file" name="file" /><br />
<input type="submit" />
</form>
<form method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
content: <textarea name="content"></textarea><br />
<input type="submit" />
</form>
<form method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
email: <input name="email" /><br />
<input type="submit" />
</form>
<?php
}
?>

相关文章

  • 详解PHP数组赋值方法

    详解PHP数组赋值方法

    这篇文章主要介绍了详解PHP数组赋值方法,文章就怎样创建数组、怎样给PHP数组赋值,文章都做了详细的介绍和讲解,希望对大家有帮助。
    2015-11-11
  • php smtp实现发送邮件功能

    php smtp实现发送邮件功能

    这篇文章主要为大家详细介绍了php smtp实现发送邮件功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-06-06
  • Laravel中间件的使用详解

    Laravel中间件的使用详解

    Laravel 中间件提供了一种方便的机制来过滤进入应用的 HTTP 请求。这篇文章主要和大家介绍一下Laravel中间件的创建和使用,需要的可以参考一下
    2023-02-02
  • 利用php递归实现无限分类 格式化数组的详解

    利用php递归实现无限分类 格式化数组的详解

    本篇文章是对使用php递归实现无限分类 格式化数组进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • 使用Codeigniter重写insert的方法(推荐)

    使用Codeigniter重写insert的方法(推荐)

    下面小编就为大家带来一篇使用Codeigniter重写insert的方法(推荐)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-03-03
  • 解析php curl_setopt 函数的相关应用及介绍

    解析php curl_setopt 函数的相关应用及介绍

    本篇文章是对php中的curl_setopt函数进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • PHP中empty,isset,is_null用法和区别

    PHP中empty,isset,is_null用法和区别

    最近在阅读项目的源码,发现源码中就对empty、isset和is_null函数(语言特性)乱用,有的地方很明显的就挖坑了。不能正确的去理解这些东西,就很可能给后续的开发挖坑了。
    2017-02-02
  • php使用fputcsv()函数csv文件读写数据的方法

    php使用fputcsv()函数csv文件读写数据的方法

    这篇文章主要介绍了php使用fputcsv()函数csv文件读写数据的方法,分析了fputcsv()函数针对csv文件的读写操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-01-01
  • PHP单例模式模拟Java Bean实现方法示例

    PHP单例模式模拟Java Bean实现方法示例

    这篇文章主要介绍了PHP单例模式模拟Java Bean实现方法,涉及php面向对象程序设计相关操作技巧,需要的朋友可以参考下
    2018-12-12
  • PHP基于回溯算法解决n皇后问题的方法示例

    PHP基于回溯算法解决n皇后问题的方法示例

    这篇文章主要介绍了PHP基于回溯算法解决n皇后问题的方法,结合实例形式分析了PHP基于回溯算法解决N皇后问题的原理与具体实现技巧,需要的朋友可以参考下
    2017-11-11

最新评论