NLS_LANG數據庫字符集中文亂碼問題分析和解決

前言

已經有3年多沒再關心或者遇到編碼格式的問題了,一是離Oracle數據庫操作遠了,二是現在的Terminal,IDE和操作系統語言環境配置都很標準,比如清一色的UTF-8編碼和UNIX(LF),我自己的組合是以下形式,Xmanager + Visual Studio Code/Notepad2 + 增加中文語言包顯示的操作系統,Oracle zhs16gbk,MySQL utf8,Python 2/3 utf-8。本來應該是非常統一而和諧的開發環境因為sqlplus spool導出中文內容而又變更混沌,索性再徹底分析以下中文亂碼的源頭和解決方案。

保持操作系統,終端登錄,數據庫3者編碼格式一致性很重要

更新記錄

2017年09月06日 - 初稿

閱讀原文 - https://wsgzao.github.io/post/lang/

Locale

下面2個地址對Locale語言字符集的介紹已經很清晰了,我只強調2點

  1. 大多數UNIX操作系統建議默認顯示語言為英語,但是一定要添加中文語言支持包
  2. 顯示中文亂碼多數原因是操作系統LANG環境變量或者類似Xshell編碼不統一造成的

Locale - http://wiki.ubuntu.org.cn/Locale
Localization - https://wiki.gentoo.org/wiki/Localization/Guide

NLS_LANG

本次遇到的問題主要是由于使用sqlplus spool從Oracle數據庫導出中文數據引發連鎖問題,雖然和數據庫相關但是解決中文亂碼的思路基本上是一致的,方便各位以后可以借鑒和參考。


# 源主機:CentOS 6.8 已安裝中文語言包,保持LANG和NLS_LANG默認環境變量,Oracle Instant Client 12.2.0.1.0,已安裝sqlplus
echo $LANG
en_US.UTF-8

echo $NLS_LANG
空

# 數據庫服務器:Oracle Database 11.2.0.3.0,NLS_CHARACTERSET ZHS16GBK
sqlplus system/oracle@orabiz

SQL> select * from v$nls_parameters;

PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_LANGUAGE
AMERICAN

NLS_TERRITORY
AMERICA

NLS_CURRENCY
$


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_ISO_CURRENCY
AMERICA

NLS_NUMERIC_CHARACTERS
.,

NLS_CALENDAR
GREGORIAN


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_DATE_FORMAT
DD-MON-RR

NLS_DATE_LANGUAGE
AMERICAN

NLS_CHARACTERSET
ZHS16GBK


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_SORT
BINARY

NLS_TIME_FORMAT
HH.MI.SSXFF AM

NLS_TIMESTAMP_FORMAT
DD-MON-RR HH.MI.SSXFF AM


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_TIME_TZ_FORMAT
HH.MI.SSXFF AM TZR

NLS_TIMESTAMP_TZ_FORMAT
DD-MON-RR HH.MI.SSXFF AM TZR

NLS_DUAL_CURRENCY
$


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_NCHAR_CHARACTERSET
AL16UTF16

NLS_COMP
BINARY

NLS_LENGTH_SEMANTICS
BYTE


PARAMETER
----------------------------------------------------------------
VALUE
----------------------------------------------------------------
NLS_NCHAR_CONV_EXCP
FALSE


19 rows selected.

問題1:ORA-12705

ERROR:
ORA-12705: Cannot access NLS data files or invalid environment specified

12705, 00000, "Cannot access NLS data files or invalid environment specified"
// *Cause: Either an attempt was made to issue an ALTER SESSION command
//         with an invalid NLS parameter or value; or the environment
//         variable(s) NLS_LANG, ORA_NLSxx, or ORACLE_HOME was incorrectly
//         specified, therefore the NLS data files cannot be located.
// *Action: Check the syntax of the ALTER SESSION command and the NLS
//          parameter, correct the syntax and retry the statement, or
//          specify the correct directory path/values in the environment
//          variables.

根據以上Oracle官方提示,合理的解決思路大致是這樣

  1. 檢查數據庫服務器的NLS parameter
  2. 在客戶端中配置與服務端匹配的NLS_LANG

比如我的環境就需要配置

export NLS_LANG="american_america.zhs16gbk"

它的格式如下:NLS_LANG=language_territory.charset
它有三個組成部分(語言、地域和字符集),每個成分控制了NLS子集的特性。
Language:指定服務器消息的語言, 影響提示信息是中文還是英文
Territory:指定服務器的日期和數字格式,
Charset:指定字符集。
如:AMERICAN_AMERICA.ZHS16GBK, SIMPLIFIED CHINESE_CHINA.ZHS16GBK

export NLS_LANG="SIMPLIFIED CHINESE_CHINA.ZHS16GBK"

從NLS_LANG的組成我們可以看出,真正影響數據庫字符集的其實是第三部分。
所以兩個數據庫之間的字符集只要第三部分一樣就可以相互導入導出數據,前面影響的只是提示信息是中文還是英文。

問題2:VI打開文件中文亂碼

其實這個問題就是由第一個問題引申出來的,主要和LANG環境變量有關

Locale 是軟件在運行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。
一個locale的書寫格式為: 語言[_地域[.字符集]].

zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。
我說中文,身處中國大陸,使用國標2312字符集來表達字符。

zh_TW.BIG5=中文_臺灣.大五碼字符集
我說中文,身處臺灣地區,使用Big5字符集來表達字符。

根據以上信息合理的解決思路大致是這樣

  1. 檢查操作系統是否已添加中文語言包
  2. 檢查SecureCRT/Xshell等終端編碼是否為默認編碼或UTF-8
  3. 檢查LANG環境變量是否合適

比如我的環境就需要配置,為什么不加zh_CN.UTF-8,你猜呢

export LANG=zh_CN
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,923評論 6 535
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,740評論 3 420
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,856評論 0 380
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,175評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,931評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,321評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,383評論 3 443
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,533評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,082評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,891評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,067評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,618評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,319評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,732評論 0 27
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,987評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,794評論 3 394
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,076評論 2 375

推薦閱讀更多精彩內容

  • Java編碼中的中文問題是一個老生常談的問題了,每次遇到中文亂碼LZ要么是按照以前的經驗修改,要么則是baidu....
    皓云觀閱讀 773評論 2 3
  • 1、引言 數據庫設計過程中表、字段等的命名規范也算是設計規范的一部分,不過設計規范更多的是為了確保數據庫設計的合理...
    SnowflakeCloud閱讀 41,058評論 0 48
  • 好多好多年,步履急促,走在所謂人生的道路上。一路的風塵遮蓋了本該年輕的面貌,等真正停下來的時候才發現,原...
    頑塵閱讀 282評論 0 4
  • 我是一片海 比海寬廣的是天空 我尋找天空 生生世世不眠不休 我累我安寧 孤風易疏雨 我哭我咆哮 滄海亦桑田 ~ 海...
    小野貓secret閱讀 198評論 0 0
  • “節目安排人什么情況啊,能不能換個人來演我男盆友,這樣我都不想演了。換個顏值高的來,這樣入戲快!” 隔著屏幕看著群...
    進擊的M先生丶閱讀 367評論 0 0