PHP实现UTF-8文件BOM自动检测与移除实例

 更新时间:2014年11月05日 16:41:01   投稿:shichen2014  
这篇文章主要介绍了PHP实现UTF-8文件BOM自动检测与移除的方法,实例讲述了UTF-8文件BOM信息的原理与PHP对此的检测与删除方法,是非常实用的技巧,需要的朋友可以参考下

本文实例讲述了PHP实现UTF-8文件BOM自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下:

BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。

比如用UTF-8格式保存的生成图片的PHP文件,因为文件头隐藏的BOM信息也被下发,导致生成的 图片数据不对,浏览器无法识别。

要检测一个UTF-8文件是否含有BOM信息,就是检测文件开头的字三个符,是否为0xEF, 0xBB, 0xBF。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了BOM。

复制代码 代码如下:
<?php
//此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除
//By Bob Shen

$basedir="."; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的BOM信息。1为是,0为否。

//以 下不用改动

if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
}
closedir($dh);
}

function checkBOM ($filename) {
global $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1);
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($contents, 2, 1);
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3);
rewrite ($filename, $rest);
return ("<font color=red>BOM found, automatically removed.</font>");
} else {
return ("<font color=red>BOM found.</font>");
}
}
else return ("BOM Not Found.");
}

function rewrite ($filename, $data) {
$filenum=fopen($filename,"w");
flock($filenum,LOCK_EX);
fwrite($filenum,$data);
fclose($filenum);
}


将以上代码另存为del_bom.php,修改需要检测的目录后运行。这样可能有助于检测是哪个文件带有了BOM信息导致所有页面开头都有 那么一段空白。

把下面 代码保存为 bom.php  记得保存为 utf8 格式

复制代码 代码如下:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<h3><?echo $_POST["dir"];?>目录下的检测结果</h3>
<?php
//此文件用于快速测试UTF8编码的文件是 不是加了BOM,并可自动移除
//By bob 老大
//风吟修改
$目录= str_replace(" ", "|", $_POST["dir"]);//接受提交的路径数据
$basedir="$目录"; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的BOM信息。1为是,0为否。
//以下不用改动
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
}
closedir($dh);
}
function checkBOM ($filename) {
global $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1);
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($contents, 2, 1);
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3);
rewrite ($filename, $rest);
return ("<font color=red>--Bom 已经清除完毕。</font>");
} else {
return ("<font color=red>--Bom found.</font>");
}
}
else return ("--没有检查到Bom.");
}
function rewrite ($filename, $data) {
$filenum=fopen($filename,"w");
flock($filenum,LOCK_EX);
fwrite($filenum,$data);
fclose($filenum);
}
?>

<form action="" method="POST">
目录: <input type="text" name="dir" />
<input type="submit" value="检测目录" >
</form>
请 输入文件夹名比如 plugin/fanfou 后面不需要加/。如果要检测根目录输入“ . ”  . 是小数点 提交既可
</br>

希望本文所述对大家的PHP程序设计有所帮助。

相关文章

  • 浅谈PHP错误类型及屏蔽方法

    浅谈PHP错误类型及屏蔽方法

    下面小编就为大家带来一篇浅谈PHP错误类型及屏蔽方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • php连接oracle数据库及查询数据的方法

    php连接oracle数据库及查询数据的方法

    这篇文章主要介绍了php连接oracle数据库及查询数据的方法,以实例形式较为详细的分析了php操作oracle数据库的使用技巧,具有一定的参考借鉴价值,需要的朋友可以参考下
    2014-12-12
  • PHP中new static()与new self()的区别异同分析

    PHP中new static()与new self()的区别异同分析

    这篇文章主要介绍了PHP中new static()与new self()的区别异同分析,是很实用的技巧,需要的朋友可以参考下
    2014-08-08
  • phpMyAdmin链接MySql错误 个人解决方案

    phpMyAdmin链接MySql错误 个人解决方案

    phpMyAdmin 试图连接到 MySQL 服务器,但服务器拒绝连接。您应该检查 config.inc.php 中的主机、用户名和密码,并且确定这些信息与 MySQL 服务器的管理员所给出的信息一致。
    2009-12-12
  • PHP中的use关键字及文件的加载详解

    PHP中的use关键字及文件的加载详解

    最近有个朋友问我,php中的use关键字是不是会进行文件的自动引入?其实use关键字与文件加载没有一点关系,use关键字的作用就是声明要使用的类所处那个命名空间之下。下面通过这篇文章跟着小编一起学习下PHP中的use关键字及文件的加载。
    2016-11-11
  • php快速url重写 更新版[需php 5.30以上]

    php快速url重写 更新版[需php 5.30以上]

    本代码是在apache上的LoadModule rewrite_module modules/mod_rewrite.so运行成功后的操作,利用php代码对网站url重定向为更复杂的逻辑结构
    2010-04-04
  • PHP中ini_set与ini_get用法实例

    PHP中ini_set与ini_get用法实例

    这篇文章主要介绍了PHP中ini_set与ini_get用法,以实例形式讲述了ini_set与ini_get函数的具体功能与适用情况,具有一定的参考借鉴价值,需要的朋友可以参考下
    2014-11-11
  • PHP字符编码问题之GB2312 VS UTF-8解决方法

    PHP字符编码问题之GB2312 VS UTF-8解决方法

    今天照着书随便写了段代码,代码意图是将字符串使用str_split()函数进行分割成数组,英文好说,但分割中文(两个中文一个数组单元)时就出问题了
    2011-06-06
  • PHP递归返回值时出现的问题解决办法

    PHP递归返回值时出现的问题解决办法

    我们在使用PHP递归时,会遇到各种各样的问题,其中比较令人苦恼的是有关PHP递归返回值时出现的问题
    2013-02-02
  • php IP及IP段进行访问限制的代码

    php IP及IP段进行访问限制的代码

    本来是写了几个函数,IP黑名单是记到库里的,为了方便理解,改成了一个class把IP黑名单写了出来。
    2008-12-12

最新评论