-
php 读取 和 生成 unicode csv 文件的例子
下文给各位整理了一篇关于php 读取 和 生成 unicode csv 文件的例子,希望这个例子可以给各位带来帮助的哦.
先介绍下BOM:
- Bytes Encoding Form
- EF BB BF UTF-8
- FF FE UTF-16 aka UCS-2, little endian
- FE FF UTF-16 aka UCS-2, big endian
- 00 00 FF FE UTF-32 aka UCS-4, little endian.
- 00 00 FE FF UTF-32 aka UCS-4, big-endian.
读取 unicode csv 文件,代码如下:
- function fopen_utf8($filename){
- $encoding='';
- $handle = fopen($filename, 'r');
- $bom = fread($handle, 2);
- // fclose($handle);
- rewind($handle);
- if($bom === chr(0xff).chr(0xfe) || $bom === chr(0xfe).chr(0xff)){
- // UTF16 Byte Order Mark present
- $encoding = 'UTF-16';
- } else {
- $file_sample = fread($handle, 1000) + 'e'; //read first 1000 bytes
- // + e is a workaround for mb_string bug
- rewind($handle);
- $encoding = mb_detect_encoding()($file_sample , 'UTF-8, UTF-7, ASCII, EUC-JP,SJIS, eucJP-win, SJIS-win, JIS, ISO-2022-JP');
- } //开源软件:phpfensi.com
- if ($encoding){
- stream_filter_append($handle, 'convert.iconv.'.$encoding.'/UTF-8');
- }
- return ($handle);
- }
生成 unicode csv,此php文件一定要是无BOM的UTF-8编码文件.
- $content=iconv("UTF-8","UTF-16LE",$content);
- $content = "\xFF\xFE".$content; //添加BOM
- header("Content-type: text/csv;charset=UTF-16LE") ;
- header("Content-Disposition: attachment; filename=test.csv");
再介绍一个 操作 ANSI 编码 以 "," 隔开的 操作类,代码如下:
- <?php
- // Unicode BOM is U+FEFF, but after encoded, it will look like this.
- define ('UTF32_BIG_ENDIAN_BOM' , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));
- define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));
- define ('UTF16_BIG_ENDIAN_BOM' , chr(0xFE) . chr(0xFF));
- define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE));
- define ('UTF8_BOM' , chr(0xEF) . chr(0xBB) . chr(0xBF));
- function detect_utf_encoding($filename) {
- $text = file_get_contents($filename);
- $first2 = substr($text, 0, 2);
- $first3 = substr($text, 0, 3);
- $first4 = substr($text, 0, 3);
- if ($first3 == UTF8_BOM) return 'UTF-8';
- elseif ($first4 == UTF32_BIG_ENDIAN_BOM) return 'UTF-32BE';
- elseif ($first4 == UTF32_LITTLE_ENDIAN_BOM) return 'UTF-32LE';
- elseif ($first2 == UTF16_BIG_ENDIAN_BOM) return 'UTF-16BE';
- elseif ($first2 == UTF16_LITTLE_ENDIAN_BOM) return 'UTF-16LE';
- }
- ?>
出处:http://www.phpfensi.com/php/20150408/9043.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式