php删除文本文件中重复行的方法
更新时间:2015年04月28日 09:28:38 作者:企鹅不笨
这篇文章主要介绍了php删除文本文件中重复行的方法,涉及php操作文本文件的相关技巧,非常具有实用价值,需要的朋友可以参考下
本文实例讲述了php删除文本文件中重复行的方法。分享给大家供大家参考。具体分析如下:
这个php函数用来删除文件中的重复行,还可以指定是否忽略大小写,和指定换行符
/**
* RemoveDuplicatedLines
* This function removes all duplicated lines of the given text file.
*
* @param string
* @param bool
* @return string
*/
function RemoveDuplicatedLines($Filepath, $IgnoreCase=false, $NewLine="\n"){
if (!file_exists($Filepath)){
$ErrorMsg = 'RemoveDuplicatedLines error: ';
$ErrorMsg .= 'The given file ' . $Filepath . ' does not exist!';
die($ErrorMsg);
}
$Content = file_get_contents($Filepath);
$Content = RemoveDuplicatedLinesByString($Content, $IgnoreCase, $NewLine);
// Is the file writeable?
if (!is_writeable($Filepath)){
$ErrorMsg = 'RemoveDuplicatedLines error: ';
$ErrorMsg .= 'The given file ' . $Filepath . ' is not writeable!';
die($ErrorMsg);
}
// Write the new file
$FileResource = fopen($Filepath, 'w+');
fwrite($FileResource, $Content);
fclose($FileResource);
}
/**
* RemoveDuplicatedLinesByString
* This function removes all duplicated lines of the given string.
*
* @param string
* @param bool
* @return string
*/
function RemoveDuplicatedLinesByString($Lines, $IgnoreCase=false, $NewLine="\n"){
if (is_array($Lines))
$Lines = implode($NewLine, $Lines);
$Lines = explode($NewLine, $Lines);
$LineArray = array();
$Duplicates = 0;
// Go trough all lines of the given file
for ($Line=0; $Line < count($Lines); $Line++){
// Trim whitespace for the current line
$CurrentLine = trim($Lines[$Line]);
// Skip empty lines
if ($CurrentLine == '')
continue;
// Use the line contents as array key
$LineKey = $CurrentLine;
if ($IgnoreCase)
$LineKey = strtolower($LineKey);
// Check if the array key already exists,
// if not add it otherwise increase the counter
if (!isset($LineArray[$LineKey]))
$LineArray[$LineKey] = $CurrentLine;
else
$Duplicates++;
}
// Sort the array
asort($LineArray);
// Return how many lines got removed
return implode($NewLine, array_values($LineArray));
}
使用范例:
// Example 1
// Removes all duplicated lines of the file definied in the first parameter.
$RemovedLinesCount = RemoveDuplicatedLines('test.txt');
print "Removed $RemovedLinesCount duplicate lines from the test.txt file.";
// Example 2 (Ignore case)
// Same as above, just ignores the line case.
RemoveDuplicatedLines('test.txt', true);
// Example 3 (Custom new line character)
// By using the 3rd parameter you can define which character
// should be used as new line indicator. In this case
// the example file looks like 'foo;bar;foo;foo' and will
// be replaced with 'foo;bar'
RemoveDuplicatedLines('test.txt', false, ';');
希望本文所述对大家的php程序设计有所帮助。
相关文章
解析关于java,php以及html的所有文件编码与乱码的处理方法汇总
本篇文章是对关于java,php以及html的所有文件编码与乱码的处理方法进行了详细的总结与介绍,需要的朋友参考下2013-06-06
Laravel框架中队列和工作(Queues、Jobs)操作实例详解
这篇文章主要介绍了Laravel框架中队列和工作(Queues、Jobs)操作实例详解,需要的朋友可以参考下2020-04-04
php中get_magic_quotes_gpc()函数说明
get_magic_quotes_gpc函数是一个用来判断是否为用户提供的数据增加斜线了,这个在php.ini配置文件中哦,本文将介绍一下get_magic_quotes_gpc()函数说明。下面跟着小编一起来看下吧2017-02-02


最新评论