Python3 Unicode文本轉中文文本

解決的問題

'\u4e0e\u4e0d'這樣的文本變成'與不'這樣的文本

文本中的數據長下面這樣

\u4e0e\u4e0d

使用python.decode()無法把他變成中文字符。

解決過程

通過查閱資料,以下是解決方法

Linux

s = '\u4e0e\u4e0d'
a = s.encode('utf-8').decode('unicode_escape')
print(s)    # '\u4e0e\u4e0d'
print(a)    # '與不'

注意:此方法用在Windows下會亂碼

Windows

s = '\u4e0e\u4e0d'
a = s.encode('unicode_escape').decode('unicode_escape')
print(s)    # '\u4e0e\u4e0d'
print(a)    # '與不'

注意:此方法在Linux下解碼會沒有效果,還是和原來一樣,并不會亂碼

參考網站:
《python3 把\u開頭的unicode轉中文,把str形態的unicode轉中文》

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容