-
php删除文本文件中重复行的方法
本文实例讲述了php删除文本文件中重复行的方法,分享给大家供大家参考,具体分析如下:
这个php函数用来删除文件中的重复行,还可以指定是否忽略大小写,和指定换行符:
- /**
- * RemoveDuplicatedLines
- * This function removes all duplicated lines of the given text file.
- *
- * @param string
- * @param bool
- * @return string
- */
- function RemoveDuplicatedLines($Filepath, $IgnoreCase=false, $NewLine="\n"){
- if (!file_exists($Filepath)){
- $ErrorMsg = 'RemoveDuplicatedLines error: ';
- $ErrorMsg .= 'The given file ' . $Filepath . ' does not exist!';
- die($ErrorMsg);
- }
- $Content = file_get_contents($Filepath);
- $Content = RemoveDuplicatedLinesByString($Content, $IgnoreCase, $NewLine);
- // Is the file writeable?
- if (!is_writeable($Filepath)){
- $ErrorMsg = 'RemoveDuplicatedLines error: ';
- $ErrorMsg .= 'The given file ' . $Filepath . ' is not writeable!';
- die($ErrorMsg);
- }
- // Write the new file
- $FileResource = fopen($Filepath, 'w+');
- fwrite($FileResource, $Content);
- fclose($FileResource);
- }
- /**
- * RemoveDuplicatedLinesByString
- * This function removes all duplicated lines of the given string.
- *
- * @param string
- * @param bool
- * @return string
- */
- function RemoveDuplicatedLinesByString($Lines, $IgnoreCase=false, $NewLine="\n"){
- if (is_array($Lines))
- $Lines = implode($NewLine, $Lines);
- $Lines = explode($NewLine, $Lines);
- $LineArray = array();
- $Duplicates = 0;
- // Go trough all lines of the given file
- for ($Line=0; $Line < count($Lines); $Line++){
- // Trim whitespace for the current line
- $CurrentLine = trim($Lines[$Line]);
- // Skip empty lines
- if ($CurrentLine == '')
- continue;
- // Use the line contents as array key
- $LineKey = $CurrentLine;
- if ($IgnoreCase)
- $LineKey = strtolower($LineKey);
- // Check if the array key already exists,
- // if not add it otherwise increase the counter
- if (!isset($LineArray[$LineKey]))
- $LineArray[$LineKey] = $CurrentLine;
- else
- $Duplicates++;
- }
- // Sort the array
- asort($LineArray);
- // Return how many lines got removed
- return implode($NewLine, array_values($LineArray));
- }
使用范例:
- // Example 1
- // Removes all duplicated lines of the file definied in the first parameter.
- $RemovedLinesCount = RemoveDuplicatedLines('test.txt');
- print "Removed $RemovedLinesCount duplicate lines from the test.txt file.";
- // Example 2 (Ignore case)
- // Same as above, just ignores the line case.
- RemoveDuplicatedLines('test.txt', true);
- // Example 3 (Custom new line character)
- // By using the 3rd parameter you can define which character
- // should be used as new line indicator. In this case
- // the example file looks like 'foo;bar;foo;foo' and will
- // be replaced with 'foo;bar'
- RemoveDuplicatedLines('test.txt', false, ';');
出处:http://www.phpfensi.com/php/20210525/15794.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式