-
php正则匹配html中带class的div并选取其中内容的方法
这篇文章主要介绍了php正则匹配html中带class的div并选取其中内容的方法,涉及curl的使用及正则匹配的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
本文实例讲述了php正则匹配html中带class的div并选取其中内容的方法。分享给大家供大家参考。具体分析如下:
先看一段html代码:
- <div class="chartInfo">
- <div class="line"></div>
- <div class="tideTable">
- <strong>潮汐表</strong>数据仅供参考
- <table width="500" border="0" cellspacing="0" cellpadding="0">
- <tbody><tr>
- <td width="100"><p><span>潮时 (Hrs)</span></p></td>
- <td width="100"><p>00:58</p></td>
- <td width="100"><p>05:20</p></td>
- <td width="100"><p>13:28</p></td>
- <td width="100"><p>21:15</p></td>
- </tr>
- <tr>
- <td><p><span>潮高 (cm)</span></p></td>
- <td width="100"><p>161</p></td>
- <td width="100"><p>75</p></td>
- <td width="100"><p>288</p></td>
- <td width="100"><p>127</p></td>
- </tr>
- </tbody></table>
- <h2>时区:-1000 (东10区) 潮高基准面:在平均海平面下174CM</h2>
- </div>
- <div class="chart">
- </div>
- </div>
这是源程序里边的一部分,为了容易看懂,删减了一大部分,只取<div class="tideTable"> div块中的内容,首页先用file_get_content或curl获取内容部分,我用的是curl,代码如下:
- $ch = curl_init();
- curl_setopt($ch, CURLOPT_URL, $url);
- curl_setopt($ch, CURLOPT_POST, 1);
- curl_setopt( $ch, CURLOPT_HEADER, 0 );
- curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 1 );
- curl_setopt( $ch, CURLOPT_POSTFIELDS, $data );
- $return = curl_exec( $ch );
- curl_close( $ch );
- $regex4="/<div class=\"tideTable\".*?>.*?<\/div>/ism";
- if(preg_match_all($regex4, $return, $matches)){
- print_r($matches);
- }else{
- echo '0';
- }
这样就可以了,不多解释,懂PHP的看代码,打印看一下效果。
出处:http://www.phpfensi.com/php/20210508/15040.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式