-
PHP移除字符串超链接文本的正则表达式
由于N久之前做了一些非常不好的动作导致网站内容页面有一些垃圾数据,今天早上整了一个移除字符串超链接文本方法,下面我结合正则来处理。
下面实例的功能是过滤所有的html标签,并替换h1-h5之前的所有文字,代码如下:
- for( $i=1;$i<=5;$i++ )
- {
- $sql ="SELECT * FROM `表名` WHERE `字段` like '<h".$i.">%</h".$i.">%' ";
- $query = mysql_query( $sql ) or die(mysql_error());
- if( mysql_num_rows( $query ) )
- {
- while ( $rs = mysql_fetch_array( $query ) )
- {
- //print_r($rs);
- $t = stripslashes($rs['字段']);
- $str = nl2br(strip_tags(addslashes(removelink($t))));
- $sql ="update 表名 set 字段='$str' where id=".$rs['id'];
- if( mysql_query($sql))
- {
- echo $rs['id'].'成功<br />';
- }
- else
- {
- echo mysql_error();
- }
- }
- }
- else
- {
- echo '己更新过没有记录了'.$sql.'<br />';
- }
- }
- function removelink($t)
- {
- //$str = preg_replace("/<a[^>]*href=[^>]*>|</[^a]*a[^>]*>/i","",$t);
- $str = preg_replace("/(?is)(?<=<h1>).*?(?=</h1>)/i","",$t);
- $str = preg_replace("/(?is)(?<=<h2>).*?(?=</h2>)/i","",$str);
- $str = preg_replace("/(?is)(?<=<h3>).*?(?=</h3>)/i","",$str);
- $str = preg_replace("/(?is)(?<=<h4>).*?(?=</h4>)/i","",$str);
- $str = preg_replace("/(?is)(?<=<h5>).*?(?=</h5>)/i","",$str);
- return re_h($str);
- }
- function re_h($str)
- {
- $str = str_replace('<h1>','',$str);
- $str = str_replace('<h2>','',$str);
- $str = str_replace('<h3>','',$str);
- $str = str_replace('<h4>','',$str);
- $str = str_replace('<h5>','',$str);
- $str = str_replace('</h1>','',$str);
- $str = str_replace('</h2>','',$str);
- $str = str_replace('</h3>','',$str);
- $str = str_replace('</h4>','',$str);
- $str = str_replace('</h5>','',$str);
- return $str;
- }
上面用到了下面的正则表达式,代码如下:
preg_replace("/(?is)(?<=<h1>).*?(?=</h1>)/i","",$t);
这就是核心代码了,比如需要将文本中的超链接内容去除,这个时候就需要用到正则表达式了,比如你可以用$str = preg_replace("/<a[^>]*href=[^>]*>|</[^a]*a[^>]*>/i","",$strhtml); 这段来实现需求,如果想要更多解决方法,可以参看以下的。
1、删除内容中的超链接,代码如下:
- ereg_replace('<a([^>]*)>([^<]*)</a>','<font color="red">\2</font>',$content);
- ereg_replace("<a [^>]*>|</a>","",$content);
2、消除包含特定词的超链接,代码如下:
- $find="this string is my find";
- $string='<font color="red">替换掉了</font>';//将超链接替换成的内容
- echo ereg_replace('<a([^>]*)>([^<]*'.$find.'[^>]*)</a>','<font color="red">\2</font>',$content);
出处:http://www.phpfensi.com/php/20140110/1211.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式