PHP用mb_string函数库处理与windows相关中文字符及Win环境下开启PHP Mb_String方法

 更新时间:2015年11月11日 11:09:25   投稿:mrr  
昨天想批处理以前下载的一堆文件,把文件里的关键内容用正则匹配出来,集中处理。在操作文件时遇到一个问题,就是windows操作系统中的编码问题.

PHP用mb_string函数库处理与windows相关中文字符

昨天想批处理以前下载的一堆文件,把文件里的关键内容用正则匹配出来,集中处理。在操作文件时遇到一个问题,就是windows操作系统中的编码问题。

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,

只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

string iconv ( string $in_charset , string $out_charset , string $str )
Performs a character set conversion on the string str from in_charset to out_charset. 

我们常使用:

$out_charset='utf-8';
$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;

如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。

如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。
但是,我在用这个函数处理时,结果却是这样:

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
Converts the character encoding of string str to to_encoding from optionally from_encoding. 

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫Multibyte String,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

当然,它还有更多有特色的地方~

下面给大家介绍Windows环境下开启PHP Mb_String方法

前几天跑一个Php程序,需要转字符编码,可是一探服务器,居然说不支持Mb_String扩展。我查了Php的扩展库里是有php_mbstring.dll这个文件的。

下面将打开的方法告诉大家

1.确保你的Windows/system32下有php_mbstring.dll这个文件,没有就从你Php安装目录extensions里拷入Windows/system32里面。

2.在windows目录下找到php.ini打开编辑,搜索mbstring.dll,找到
;extension=php_mbstring.dll

然后将前面的;号去掉,打开对组件的支持

3.重启PHP服务(如果不会你可重新启一下计算机)

4.完成

相关文章

  • Laravel5.1 框架模型软删除操作实例分析

    Laravel5.1 框架模型软删除操作实例分析

    这篇文章主要介绍了Laravel5.1 框架模型软删除操作,结合实例形式分析了laravel5.1框架软删除的原理及普通删除与软删除的相关操作技巧,需要的朋友可以参考下
    2020-01-01
  • php在windows环境下获得cpu内存实时使用率(推荐)

    php在windows环境下获得cpu内存实时使用率(推荐)

    这篇文章主要介绍了php在windows环境下获得 cpu 内存实时使用率的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2018-02-02
  • 深入浅出php socket编程

    深入浅出php socket编程

    这篇文章主要介绍了深入浅出php socket编程,本文详细的讲解了socket的相关知识、PHP socket的编程实例行装内容,需要的朋友可以参考下
    2015-05-05
  • Yii基于CActiveForm的Ajax数据验证用法示例

    Yii基于CActiveForm的Ajax数据验证用法示例

    这篇文章主要介绍了Yii基于CActiveForm的Ajax数据验证用法,结合实例形式分析了Yii视图自定义Form表单的ajax提交及控制器处理实现方法,需要的朋友可以参考下
    2016-07-07
  • PHP 实例化类的一点摘记

    PHP 实例化类的一点摘记

    最近在编写 Grace PHP5 Framework 中,我得到很多类的实例化的心得。Grace PHP5 Framework 是一个完全基于 MVC 架构的框架,具有良好的扩展性。它对于类的调用可以说非常的灵活。
    2008-03-03
  • laravel框架数据库操作、查询构建器、Eloquent ORM操作实例分析

    laravel框架数据库操作、查询构建器、Eloquent ORM操作实例分析

    这篇文章主要介绍了laravel框架数据库操作、查询构建器、Eloquent ORM操作,结合实例形式分析了laravel数据库连接、增删改查、排序及Eloquent ORM数据库操作等相关使用技巧,需要的朋友可以参考下
    2019-12-12
  • 使用PHP+AJAX让WordPress动态加载文章的教程

    使用PHP+AJAX让WordPress动态加载文章的教程

    这篇文章主要介绍了使用PHP+AJAX让WordPress动态加载文章的教程,即不用手动刷新浏览器页面即可让加载好的文章显示,需要的朋友可以参考下
    2015-12-12
  • 最新版本PHP 7 vs HHVM 多角度比较

    最新版本PHP 7 vs HHVM 多角度比较

    PHP 7 是 PHP 社区对 HHVM 的回应。PHP 7 发布的预览版本号称比之前的 PHP 5 的性能要提升100%。不过,PHP 还有一个竞争对手 HHVM (HipHop Virtual Machine) 一个运行 PHP 代码的虚拟工具。二者直接的比较正在升温,那么让我们来看一下他们直接的性能对比吧
    2016-02-02
  • 用PHP提取中英文词语以及数字的首字母的方法介绍

    用PHP提取中英文词语以及数字的首字母的方法介绍

    本篇我在小编为大家介绍,用PHP提取中英文词语以及数字的首字母的方法。需要的朋友参考下
    2013-04-04
  • PHP房贷计算器实例代码,等额本息,等额本金

    PHP房贷计算器实例代码,等额本息,等额本金

    下面小编就为大家带来一篇PHP房贷计算器实例代码,等额本息,等额本金。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-04-04

最新评论