-
php中使用gd库实现下载网页中所有图片
在前期的php教程就讲了php gd库可以实现远程图片的下载,但是那只是下载了一张图片,原理是一样的,要想下载一个网页的所有图片只要使用正则表达式进行判断,找出所有的图片url就可以进行循环下载了,我特地参照网络资源编写了gd库图片下载类!
php代码如下:
- <?php
- header("Content-type:text/html ; charset=utf-8");
- if (!emptyempty($_POST['submit'])){
- $url = $_POST['url'];
- //为了获取相对路径的图片所做的操作
- $url_fields = parse_url($url);
- $main_url = $url_fields['host'];
- $base_url = substr($url,0,strrpos($url, '/')+1);
- //获取网页内容
- //设置代理服务器
- $opts = array('http'=>array('request_fulluri'=>true));
- $context = stream_context_create($opts);
- $content = file_get_contents($url,false,$context);
- //匹配img标签,将所有匹配字符串保存到数组$matches
- $reg = "/<img.*?src=\"(.*?)\".*?>/i";
- preg_match_all($reg, $content, $matches);
- $count = count($matches[0]);
- for ($i=0; $i<$count; $i++){
- /*将所有图片的url转换为小写
- *$matches[1][$i] = strtolower($matches[1][$i]);
- */
- //如果图片为相对路径就转化为全路径
- if (!strpos('a'.$matches[1][$i], 'http')){
- //因为'/'是第0个位置
- if (strpos('a'.$matches[1][$i], '/')){
- $matches[1][$i] = 'http://'.$main_url.$matches[1][$i];
- }else{
- $matches[1][$i] = $base_url.$matches[1][$i];
- }
- }
- }
- //过滤重复的图片
- $img_arr = array_unique($matches[1]);
- //实例化图片下载类
- $getImg = new DownImage();
- $url_count = count($img_arr);
- for ($i=0; $i<$url_count; $i++){
- $getImg->source = $img_arr[$i];
- $getImg->save_address = './pic/';
- $file = $getImg->download();
- }
- echo "下载完成!哈哈,简单吧!";
- }
- class DownImage{
- public $source;//远程图片URL
- public $save_address;//保存本地地址
- public $set_extension; //设置图片扩展名
- public $quality; //图片的质量(0~100,100最佳,默认75左右)
- //下载方法(选用GD库图片下载)
- public function download(){
- //获取远程图片信息
- $info = @getimagesize($this->source);
- //获取图片扩展名
- $mime = $info['mime'];
- $type = substr(strrchr($mime, '/'), 1);
- //不同的图片类型选择不同的图片生成和保存函数
- switch($type){
- case 'jpeg':
- $img_create_func = 'imagecreatefromjpeg';
- $img_save_func = 'imagejpeg';
- $new_img_ext = 'jpg';
- $image_quality = isset($this->quality) ? $this->quality : 100;
- break;
- case 'png':
- $img_create_func = 'imagecreatefrompng';
- $img_save_func = 'imagepng';
- $new_img_ext = 'png';
- break;
- case 'bmp':
- $img_create_func = 'imagecreatefrombmp';
- $img_save_func = 'imagebmp';
- $new_img_ext = 'bmp';
- break;
- case 'gif':
- $img_create_func = 'imagecreatefromgif';
- $img_save_func = 'imagegif';
- $new_img_ext = 'gif';
- break;
- case 'vnd.wap.wbmp':
- $img_create_func = 'imagecreatefromwbmp';
- $img_save_func = 'imagewbmp';
- $new_img_ext = 'bmp';
- break;
- case 'xbm':
- $img_create_func = 'imagecreatefromxbm';
- $img_save_func = 'imagexbm';
- $new_img_ext = 'xbm';
- break;
- default:
- $img_create_func = 'imagecreatefromjpeg';
- $img_save_func = 'imagejpeg';
- $new_img_ext = 'jpg';
- }
- //根据是否设置扩展名来合成本地文件名
- if (isset($this->set_extension)){
- $ext = strrchr($this->source,".");
- $strlen = strlen($ext);
- $newname = basename(substr($this->source,0,-$strlen)).'.'.$new_img_ext;
- }else{
- $newname = basename($this->source);
- }
- //生成本地文件路径
- $save_address = $this->save_address.$newname;
- $img = @$img_create_func($this->source);
- if (isset($image_quality)){
- $save_img = @$img_save_func($img,$save_address,$image_quality);
- }else{
- $save_img = @$img_save_func($img,$save_address);
- }
- return $save_img;
- }
- }
- ?>
- <form method="POST" action="">
- 远程url地址:<input type="text" name="url" size=30 />
- <input type="submit" name="submit" value="下载该页面所有图片" />
- </form>
原文链接:http://www.phpfensi.com/php/20210526/15844.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式