首页 > temp > python入门教程 >
-
数据中有emoji,导致插入不了数据库
前言
前两天负责的系统,因为需要获取用户的昵称并进行入库,但是有个别用户的昵称中存在emoji表情,导致入库时报错。
报错内容:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94‘ for column
问题原因
Q:为什么我们设置表的的字符类型为utf8却不能存放emoji呢?
A:因为我们UTF-8编码可能是2或3或4个字节,但mysql中的utf8是3个字节,存放一个emoji是需要4个字节的,自然不够。
Mysql数据库在5.5.3之后开始支持utf8mb4字符集,所以mysql版本是5.5.3+的都可以设置让数据库存储Emoji表情
所以如果你的应用有移动端的,最好一开始设计数据库的时候就使用utf8mb4字符集
解决方案:
方案一: 过滤字符串中的emoji
方案二: 转译emoji后入库。获取时反转译成emoji使用
//转译emoji
URLEncoder.encode(含有emoji的数据, "UTF-8");
//反转译成emoji<br/>
URLDecoder.decode(经过转义的数据, "UTF-8");
另外再推荐一款emoji转义工具
注意点:emoji转译后可以入库。但当用户就是输入的内容本身就是【转译后的内容】
此时从库中反转译时就变成了emoji。这就造成跟用户输入不一致的情况
方案三: 修改数据库配置,实现可存储emoji
目前网上给的解决方案普遍都是:修改该字段或者该张表的编码方式为utf8mb4
但仅这么处理是并不起作用。
还需要执行SET NAMES utf8mb4;
将整个库的 character_set_client、character_set_connection、character_set_results等值修改为utf8mb4才会起作用
修改已经建立表的字符集alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;
注意点:新建数据库时可以进行初始化设置,但是已有的线上生产库进行此操作有风险,因此建议使用相关类库转义后进行存储和显示
使用下列SQL语句可以查看MySQL中character_set相关变量:
SHOW VARIABLES LIKE '%char%';
原文:https://www.cnblogs.com/mlwy/p/15582776.html