-
php正则表达式获取内容所有链接
这篇文章主要介绍了php正则表达式获取内容所有链接的相关资料,需要的朋友可以参考下
方法一:
- function get_all_url($code){
- preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);
- return array('name'=>$arr[2],'url'=>$arr[1]);
- }
方法二:
- /**
- * date 2015-07-24
- **/
- $site=substr($url,0,strpos($url,"/",8));//站点
- $base=substr($url,0,strrpos($url,"/")+1);//文件所在目录
- $fp = fopen($url, "r" );//打开url
- while(!feof($fp))$contents.=fread($fp,1024);//
- $pattern="|href=['"]?([^ '"]+)['" ]|u";
- preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href=
- for($i=0;$i<count($regarr);$i++){//遍历所有匹配
- if(!eregi("://",$regarr[$i][1]))//是否是相对路径,即是否还有://
- if(substr($regarr[$i][1],0,1)=="/")//是否是站点的根目录
- echo "link".($i+1).":".$site.$regarr[$i][1]."<br/>";//根目录
- else
- echo "link".($i+1).":".$base.$regarr[$i][1]."<br/>";//当前目录
- else
- echo "link".($i+1).":".$regarr[$i][1]."<br/>";//相对路径
- }
- fclose($fp);
以上所述就是本文的全部内容了,希望大家能够喜欢。
出处:http://www.phpfensi.com/php/20210613/16279.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式