-
PHP正确解析UTF-8字符串
- $str = '今天非常Happy,所有决定去KFC吃可乐鸡翅!!!';
- /*
- $str 是待截取的字符串
- $len 是截取的字符数
- */
- function utf8sub($str,$len) {
- if($len <= 0){
- return '';
- }
- $offset = 0; // 截取高位字节时的偏移量
- $chars = 0; // 截取到的字符数
- $res = ''; // 存放截取的结果字符串
- while($chars < $len){
- // 先取字符串的第一个字节
- // 将它转为十进制
- // 再转为二进制
- $high = ord(substr($str,$offset,1));
- // echo '$high='. $high .'<br />';
- if($high == null ){ // 如果取出高位为null,证明已经取到末尾,直接break
- break;
- }
- if(($high>>2) === 0x3F){ // 将高位右移2位,和二进制111111比较,相同则取6个字节
- // 截取2个字节
- $count = 6;
- }else if(($high>>3) === 0x1F){ // 将高位右移2位,和二进制11111比较,相同则取5个字节
- // 截取3个字节
- $count = 5;
- }else if(($high>>4) === 0xF){ // 将高位右移2位,和二进制1111比较,相同则取4个字节
- // 截取4个字节
- $count = 4;
- }else if(($high>>5) === 0x7){ // 将高位右移2位,和二进制111比较,相同则取3个字节
- // 截取5个字节
- $count = 3;
- }else if(($high>>6) === 0x3){ // 将高位右移2位,和二进制11比较,相同则取2个字节
- // 截取6个字节
- $count = 2;
- }else if(($high>>7) === 0x0){ // 将高位右移2位,和二进制0比较,相同则取1个字节
- $count = 1;
- }
- // echo '$count='.$count.'<br />';
- $res .= substr($str,$offset,$count); // 取出一个字符与$res字符串连接
- $chars += 1; // 截取到的字符数+1
- $offset += $count; // 截取高位偏移量向后移$count字节
- }
- return $res;
- }
- echo utf8sub($str,100);
出处:http://www.phpfensi.com/php/20131203/702.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式