-
php HTTP_REFERER函数的使用用法
利用php的http_referer函数来判断用户的来路,这是简单了,实例代码如下:
- <?php
- if (isset($_SERVER['HTTP_REFERER'])) {
- print "The page you were on previously was {$_SERVER['HTTP_REFERER']}<br />";
- } else {
- print "You didn't click any links to get here<br />";
- }
- ?>
- <a href="refer.php">Click me!</a>
下面我们让用户不知道我们的来路处理,实例代码如下:
- <?php
- $host = "www.phpfensi.com";
- $referer = "http://".$host;
- $fp = fsockopen ($host, 80, $errno, $errstr, 30);
- if (!$fp){
- echo "$errstr ($errno)<br>;n";
- }else{
- $request = "
- GET / HTTP/1.1
- Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-powerpoint, application/vnd.ms-excel, application/msword, */"."*
- Referer: http://$host
- Accept-Language: zh-cn
- Accept-Encoding: gzip, deflate
- User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)
- Host: $host
- Connection: Close"
- ."rnrn";
- fputs ($fp, "$request");
- while (!feof($fp))
- {
- $res[] = fgets($fp,1024);
- }
- $html = join("",$res);
- fclose ($fp);
- $fp = file_put_contents("123cha.html",$html);
- echo "done";//开源代码phpfensi.com
- }
这不就行了?
不过很奇怪的是,www.phpfensi.com 的页面抓下来是乱码(除了http头),这是为什么?难道是因为用了gzip之类压缩?
- <?php
- $host = "www.phpfensi.com";
- $html = file_get_contents("http://".$host);
- $fp = file_put_contents("hao123.html",$html);
- echo "done";
- ?>;
但这样抓的就没问题,再来分析开始抓的http头:
HTTP/1.1 200 OK Date: Wed, 31 Aug 2005 00:59:36 GMT Server: Apache/1.3.27 Cache-Control: max-age=1296000 Expires: Thu, 15 Sep 2005 00:59:36 GMT Last-Modified: Mon, 29 Aug 2005 13:56:00 GMT Accept-Ranges: bytes Connection: close Content-Type: text/html Content-Encoding: gzip Content-Length: 14567
果然有这句,Content-Encoding:gzip ,原来压缩了的,长度14567字节了,用第二种方法抓,原来没压缩的html是71143字节,原来file_get_contents还可以自动解压缩.
php实例二,代码如下:
- <?php
- $host = '127.0.0.1';
- $target = '/2.php';
- $referer = 'http://www.phpfensi.com'; //伪造HTTP_REFERER地址
- $fp = fsockopen($host, 80, $errno, $errstr, 30);
- if (!$fp){
- echo "$errstr($errno)<br />n";
- }
- else{
- $out = "
- GET $target HTTP/1.1
- Host: $host
- Referer: $referer
- Connection: Closernrn";
- fwrite($fp, $out);
- while (!feof($fp)){
- echo fgets($fp, 1024);
- }
- fclose($fp);
- }
- ?>
另一个2.php文件很简单,只是写上一行读取当前的HTTP_REFERER服务器值的代码即可,如下:
- <?php
- echo "<hr />";
- echo $_SERVER["HTTP_REFERER"];
- ?>
出处:http://www.phpfensi.com/php/20140918/5624.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式