-
php mb_detect_encoding判断字符串编码方法
在php中利用mb_detect_encoding可以判断给我们的字符是那个类型的编码了,从而我们就可以利用inconv进行字符转换了,下面给大家介绍几个例子.
例子,利用mb_detect_encoding()判断字符是否为uft-8编码,代码如下:
- $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8'));
- echo $encode."<br/>";
- if($encode=="GB2312")
- {
- $q = iconv("GBK","UTF-8",$q);
- }
- else if($encode=="GBK")
- {
- $q = iconv("GBK","UTF-8",$q);
- }
- else if($encode=="EUC-CN")
- {
- $q = iconv("GBK","UTF-8",$q);
- }
- else//CP936
- {
- //$q = iconv("GB2312","UTF-8",$q);
- }
可是 mb_detect_encoding 存在一个硬伤,经常出现判断不准确的情况,或许这样就可以解决,代码如下:
- // 使用 iconv 转换并判断是否等值,效率不高
- function is_utf8 ($str) {
- if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) {
- return 'UTF-8';
- }
- }
- // 多种编码的情况
- function detect_encoding ($str) {
- foreach (array('GBK', 'UTF-8') as $v) {
- if ($str === iconv($v, $v . '//IGNORE', $str)) {
- return $v;
- }
- }
- }
通过以上方式得到字符串编码信息后,就可以利用 iconv 或 mb_convert_encoding 来转换编码了.
问题:可是当 $keytitle = '%D0%BE%C6%AC'; 时,检测结果却是UTF-8,这其实不算是bug,我们不应当过于依赖mb_detect_encoding,当字符串较短时,检测结果产生偏差的可能性很大.
解决方法,代码如下:
$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK’,'UTF-8');
出处:http://www.phpfensi.com/php/20140616/3364.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式