編碼學(xué)習(xí)小記

ASCII 8bit

  • 格式: <0> 0000000 - <0> 1111110
  • 區(qū)間: 0 ~ 126
  • 特點(diǎn):第一位始終為0

Unicode

  • 格式:嚴(yán) -> 4E25 -> 100111000100101
  • 特點(diǎn):符號集合(一個(gè)符號唯一對應(yīng)一個(gè)數(shù)值大小) <一張通用數(shù)據(jù)表>

UTF-8 變 長編碼 -> Unicode的內(nèi)存實(shí)現(xiàn)方式'之一'

  • 格式:<0xxxxxxxx> <110xxxxx 10xxxxxx> <1110xxxx 10xxxxxx 10xxxxxx> <11110xxx 10xxxxxx 10xxxxxx 10xxxxxx>
  • 區(qū)間 0 ~ 126 5x + 6x 4x + 6x + 6x 3x + 6x + 6x + 6x 可以理解他們不包含,而是組成連續(xù), 對應(yīng)Unicode的字符表
  • 特點(diǎn):特定的表示格式,能在存儲和網(wǎng)絡(luò)傳輸中正確區(qū)分字符,表示內(nèi)容

轉(zhuǎn)換

Unicode -> UTF-8

  • 嚴(yán) -> 4E25 -> 100111000100101 (數(shù)值大小) <15個(gè)x>
  • 大于11x,小于16x,三個(gè)字節(jié):1110xxxx 10xxxxxx 10xxxxxx
  • 從后面將Unicode bit填入 UTF-8 1110x100 10111000 10100101 (x = 0)

ASCII -> UTF-8

  • ! -> 21(16進(jìn)制,33十進(jìn)制) -> 00100001
  • 小于等于7x,一個(gè)字節(jié):0xxxxxxx
    填入bit 0x100001 (x = 0)

補(bǔ)充:

  • HTTP協(xié)議是以ASCII 碼傳輸<這個(gè)先記錄>(UTF-8的每一個(gè)字節(jié)就是一個(gè)ASCII)
  • ?? JSON(Dic) -> Data -> [ASCII] (字節(jié)為單位)
  • Unicode規(guī)范定義:Little endian 和 Big endian,如果一個(gè)文本文件的頭兩個(gè)字節(jié)是FE FF,就表示該文件采用大頭方式;如果頭兩個(gè)字節(jié)是FF FE,就表示該文件采用小頭方式,如果它出現(xiàn)在字節(jié)流的中間,則表達(dá)零寬度非換行空格的意義,用戶看起來就是一個(gè)空格
  • UTF-8則沒有字節(jié)順序的議題
  • UTF-16 UTF32卻有字節(jié)順序
  • 如圖:
    維基百科-字節(jié)順序標(biāo)記.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,936評論 6 535
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,744評論 3 421
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,879評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,181評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,935評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,325評論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,384評論 3 443
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,534評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,084評論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,892評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,067評論 1 371
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,623評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,322評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,735評論 0 27
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,990評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,800評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,084評論 2 375

推薦閱讀更多精彩內(nèi)容

  • 摘自:阮一峰《字符編碼筆記:ASCII,Unicode和UTF-8》 ASCII碼我們知道,在計(jì)算機(jī)內(nèi)部,所有的信...
    maple1eaf閱讀 322評論 2 2
  • 1. ASCII碼 我們知道,在計(jì)算機(jī)內(nèi)部,所有的信息最終都表示為一個(gè)二進(jìn)制的字符串。每一個(gè)二進(jìn)制位(bit)有0...
    穿越的辣椒閱讀 210評論 0 0
  • 1. ASCII碼 我們知道,在計(jì)算機(jī)內(nèi)部,所有的信息最終都表示為一個(gè)二進(jìn)制的字符串。每一個(gè)二進(jìn)制位(bit)有0...
    rogerwu1228閱讀 256評論 0 0
  • 目錄 上一章:長椅相伴 帕特抱著一盆蝴蝶蘭站在貝克街16號的門前,他長長的呼吸了幾口氣,騰出一手搖了搖門上的鈴鐺。...
    景泰藍(lán)呦閱讀 300評論 0 0
  • 坐在自習(xí)教室的電腦前,好開心呀!
    js92閱讀 188評論 0 0