找的了好久找到的解決方法
一般Mysql表設計時,都是用UTF8字符集的。把帶有emoji的昵稱字段往里面insert一下就沒了,整個字段變成了空字符串。這是怎么回事呢?
原來是因為Mysql的utf8字符集是3字節的,而emoji是4字節,這樣整個昵稱就無法存儲了。這要怎么辦呢?我來介紹幾種方法
- 去除emoji表情包
這段代碼親測可用
// 過濾掉emoji表情
function filterEmoji($str)
{
$str = preg_replace_callback(
'/./u',
function (array $match) {
return strlen($match[0]) >= 4 ? '' : $match[0];
},
$str);
return $str;
}
數據庫使用utf8mb4編碼
如果你的mysql版本>=5.5.3,你大可直接將utf8直接升級為utf8mb4字符集
這種4字節的utf8編碼可完美兼容舊的3字節utf8字符集,并且可以直接存儲emoji表情,是最好的解決方案
至于字節增大帶來的性能損耗,我看過一些評測,幾乎是可以忽略不計的```使用Base64編碼
如果你因為某些原因無法使用utf8mb4的話,你還可以使用base64來曲線救國
使用例如base64_encode之類的函數編碼過后的emoji可以直接存儲在utf8字節集的數據表中,取出時decode一下即可
其他的方法歡迎大家補充哈!!
原文地址