php自动识别文字编码并转换为目标编码的方法

转载  更新时间:2015年08月08日 14:52:27   作者:Minho   我要评论

这篇文章主要介绍了php自动识别文字编码并转换为目标编码的方法,涉及php针对当前编码的判断与对应的编码转换实现技巧,需要的朋友可以参考下

本文实例讲述了php自动识别文字编码并转换为目标编码的方法。分享给大家供大家参考。具体如下:

在PHP处理页面的时候,我们对于字符集的转换都是采用了iconv或者mb_convert等函数,但,这其实是有一个前提的。即我们事先得知道in和out是什么样的编码,我们才能进行正确的转换。

虽然大多数转换都是在gbk和utf-8之间转,但如果不知道转换对象的编码怎么办呢?谷歌出来这么一个函数safeEncoding,可以简单的识别UTF8和GBK的编码。这个函数在一定程度上识别的很准确,但是在一些比较复杂的环境中就不是那么的好用了. 下面我结合了GBK和UTF-8编码的不同点,使用正则表达式来判断UTF-8编码并使用mb_convert_encoding函数来进行转换. 在国内,基本上比较流行的编码就是GBK和UTF-8, 所以这个函数是针对这两个编码进行自动转换的.

/**
* @ string 需要转换的文字
* @ encoding 目标编码
**/
function detect_encoding($string,$encoding = 'gbk'){
 $is_utf8 = preg_match('%^(?:[\x09\x0A\x0D\x20-\x7E]| [\xC2-\xDF][\x80-\xBF]| \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}  | \xED[\x80-\x9F][\x80-\xBF] | \xF0[\x90-\xBF][\x80-\xBF]{2} | [\xF1-\xF3][\x80-\xBF]{3} | \xF4[\x80-\x8F][\x80-\xBF]{2} )*$%xs', $string);
 if($is_utf8 && $encoding == 'utf8'){
  return $string;
 }elseif($is_utf8){
  return mb_convert_encoding($string, $encoding, "UTF-8");
 }else{
  return mb_convert_encoding($string, $encoding, 'gbk,gb2312,big5');
 }
} 

希望本文所述对大家的php程序设计有所帮助。

相关文章

  • php 调试利器debug_print_backtrace()

    php 调试利器debug_print_backtrace()

    debug_print_backtrace() 是一个很低调的函数,很少有人注意过它. 不过当我对着一个对象调用另一个对象再调用其它的对象和文件中的一个函数出错时,它正在一边笑呢
    2012-07-07
  • PHP屏蔽过滤指定关键字的方法

    PHP屏蔽过滤指定关键字的方法

    这篇文章主要介绍了PHP屏蔽过滤指定关键字的方法,包含了字符串的过滤处理与数组的遍历等技巧,非常具有实用价值,需要的朋友可以参考下
    2014-11-11
  • php+ajax实时刷新简单实例

    php+ajax实时刷新简单实例

    这篇文章主要介绍了php+ajax实时刷新简单实现方法,实例分析了Ajax的实现原理以及对应的php处理文件基本原理与操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-02-02
  • 解析php中array_merge与array+array的区别

    解析php中array_merge与array+array的区别

    本篇文章是对php中array_merge与array+array的区别进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • PHP与MySQL开发中页面乱码的产生与解决

    PHP与MySQL开发中页面乱码的产生与解决

    一般来说,乱码的出现有2种原因,首先是由于编码(charset)设置错误,导致浏览器以错误的编码来解析,从而出现了满屏乱七八糟的“天书”,其次是文件被以错误的编码打开,然后保存,比如一个文本文件原先是GB2312编码的,却以UTF-8编码打开再保存。要解决上述乱码问题,首先需要知道开发中哪些环节涉及到了编码:
    2008-03-03
  • smarty 缓存控制前的页面静态化原理

    smarty 缓存控制前的页面静态化原理

    在配置文件中我们应设置了缓存的目录,但是缓存的只有一个文件,怎么让一个模版有多个缓存文件呢
    2013-03-03
  • php中flush()、ob_flush()、ob_end_flush()的区别介绍

    php中flush()、ob_flush()、ob_end_flush()的区别介绍

    php中flush()、ob_flush()、ob_end_flush()的区别介绍,需要的朋友可以参考下
    2013-02-02
  • PHP迭代器和迭代的实现与使用方法分析

    PHP迭代器和迭代的实现与使用方法分析

    这篇文章主要介绍了PHP迭代器和迭代的实现与使用方法,结合实例形式分析了PHP迭代器的概念、原理、定义与使用方法,需要的朋友可以参考下
    2018-04-04
  • php设计模式 Interpreter(解释器模式)

    php设计模式 Interpreter(解释器模式)

    php设计模式 Interpreter(解释器模式),需要的朋友可以参考下。
    2011-06-06
  • php根据某字段对多维数组进行排序的方法

    php根据某字段对多维数组进行排序的方法

    这篇文章主要介绍了php根据某字段对多维数组进行排序的方法,实例分析了php操作数组及排序的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03

最新评论