PHP字符串的编码问题的详细介绍

 更新时间:2013年04月27日 15:52:45   作者:  
本篇文章介绍了,在PHP中字符串的编码问题的详细分析,需要的朋友参考下
 
    大家都知道,不同字符编码,其在内存占用的字节数不一样。如ASCII编码字符占用1个字节,UTF-8编码的中文字符是3字节,GBK为2个字节。
 

    PHP 也自带几种字符串截取函数,其中常用到的就是 substr 和 mb_substr。

    使用substr截取中文字符时会出现乱码,这是因为substr是按字节来截取的。即UTF-8编码的中文,使用substr截取,只会截取1/3个中文,当然出现乱码了。

    mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )  中的参数$encoding可以指定编码,如果省略,则使用内部字符编码。

  

     如果不清楚字符串的编码格式的话,可以用mb_detect_encoding检查:

    $encoding  = mb_detect_encoding($string, array("ASCII",'UTF-8′,"GB2312′,"GBK",'BIG5′)); 

     然后:

     mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )

    如果自己实现mb_substr,效率并不是很好。

编码相关的php函数使用

ord(substr($str, $i, 1)) > 0xa0)

ord($string)返回字符串第一个字符的ASC码,通过这个来判断截取的字符串第一个字符是不是汉字,因为例如gb2312编码的一个文字是2字节,utf8为三个字节。即  编码大于256的就是汉字。


正则字符:

匹配汉字 :   preg_match_all('/[\x80-\xff]?./', $string, $match);  

匹配英文: preg_match_all("/[/x01-/x7f]+/", $string, $match);  


编码转换

iconv ( string $in_charset , string $out_charset , string $str )

 如GB2312  转UTF-8:  iconv("GB2312","UTF-8",$text)

url 编码urlencode

编码后返回的字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。

不过应该注意的是,在编码时应该只对部分URL编码,否则URL中的冒号和反斜杠也会被转义。

URLEncode的方式一般有两种,一种是传统的基于GB2312的Encode,另一种是基于UTF-8的Encode。 如:
复制代码 代码如下:

$url = '中国'; 
echo urlencode($url ); 
//UTF-8: %E4%B8%AD%E5%9B%BD 
//GB2312:%D6%D0%B9%FA 

例如我们使用浏览器打开百度,搜索 “中国”.    在地址栏看到:
http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD&rsv_bp=0&ch=&tn=baidu&bar=&rsv_spt=3&ie=utf-8&rsv_sug3=16&rsv_sug=0&rsv_sug4=302&rsv_sug1=11&inputT=22928

即我们看到“中国”被浏览器自动转换为:%E4%B8%AD%E5%9B%BD。


urlencode和rawurlencode的区别:urlencode将空格编码为加号“+”,rawurlencode将空格编码为加号“%20”。 

url解码urldecode 和 rawurldecode
1、在解码时,可以使用相应的 urldecode() 和 rawurldecode(),相应地,rawurldecode() 不会把加号('+')解码为空格,而 urldecode() 可以。
2、urldecode() 和 rawurldecode() 解码出的字符串是 UTF-8格式的编码,如果URL中含有非UTF-8 编码的中文,则要把解码出的字符串进行转换。
如下,先把php文件设置为gb2312编码。你会看到一部分是乱码,一部分是正常的。
$url = '中国';
echo $a = urldecode(urlencode($url)) ,' ';
echo iconv('gb2312', 'utf-8', $a);
�й� 中国

相关文章

  • smarty半小时快速上手入门教程

    smarty半小时快速上手入门教程

    这篇文章主要介绍了smarty半小时快速上手入门教程,以实例的形式分析了smarty在实际使用过程中的属性、方法及具体用法,需要的朋友可以参考下
    2014-10-10
  • PHP设计模式之观察者模式入门与应用案例详解

    PHP设计模式之观察者模式入门与应用案例详解

    这篇文章主要介绍了PHP设计模式之观察者模式入门与应用,结合具体案例形式详细分析了PHP观察者模式的相关概念、原理、使用方法及操作注意事项,需要的朋友可以参考下
    2019-12-12
  • 使用Entrust扩展包在laravel 中实现RBAC的功能

    使用Entrust扩展包在laravel 中实现RBAC的功能

    这篇文章主要介绍了使用Entrust扩展包在laravel 中实现RBAC的功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • php设计模式之策略模式实例分析【星际争霸游戏案例】

    php设计模式之策略模式实例分析【星际争霸游戏案例】

    这篇文章主要介绍了php设计模式之策略模式,结合星际争霸游戏案例形式分析了php策略模式相关原理、用法及操作注意事项,需要的朋友可以参考下
    2020-03-03
  • PHP学习之预定义变量(实例讲解)

    PHP学习之预定义变量(实例讲解)

    下面小编就为大家分享一篇PHP学习之预定义变量(实例讲解),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-01-01
  • Yii框架中memcache用法实例

    Yii框架中memcache用法实例

    这篇文章主要介绍了Yii框架中memcache用法,以实例形式分析了在Yii框架中加入memcache的具体操作方法,是非常实用的技巧,需要的朋友可以参考下
    2014-12-12
  • php 三元运算符实例详细介绍

    php 三元运算符实例详细介绍

    php中三元运算符又被叫做三目运算符了,其实我常把它叫作问号运行符其实都可以这样做,三元运算符可以实现简单的条件判断功能,下在我来给各位介绍一些三元运算符的例子
    2016-12-12
  • php二维数组排序详解

    php二维数组排序详解

    二维数组排序排序在php中也提供了一个函数array_multisort就可以直接排序了,下面我来介绍除了全使用array_multisort 对数组进行排序我们还写了一些自定二维数组排序方法
    2013-11-11
  • ThinkPHP后台首页index使用frameset时的注意事项分析

    ThinkPHP后台首页index使用frameset时的注意事项分析

    这篇文章主要介绍了ThinkPHP后台首页index使用frameset时的注意事项,需要的朋友可以参考下
    2014-08-08
  • PHP读书笔记整理_结构语句详解

    PHP读书笔记整理_结构语句详解

    下面小编就为大家带来一篇PHP读书笔记整理_结构语句详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-07-07

最新评论