字符編碼

1 ASCII:American Standard Code for Information Interchange

  • 0~32:用作控制字符
  • 00000000-01111111:其他字符

2 GB2312標準

  • 00000000 00000000:大概能存儲7000左右漢字

2.1 GBK:GB2312的拓展

  • 擴展大概多出20000左右字符,包含繁體字、假名、羅馬字符

2.2 GB18030:包含很多少數(shù)名族字符


3 ISO:國際標準化組織

UCS:Universal Multi-Octet Coded Character Set
UCS俗稱Unicode


4 UTF:Unicode Transfer Format

  • UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位傳輸
  • UTF8表示一個字符用多少個字節(jié)不固定
  • 舉例:
    • 如果一個字符只占一個字節(jié),表示0xxxxxxx
    • 如果一個字符占兩個字節(jié),表示110xxxxx 10xxxxxx
    • 如果一個字符占三個字節(jié),表示1110xxxx 10xxxxxx 10xxxxxx
    • 如果一個字符占四個字節(jié),表示11111xxx 10xxxxxx 10xxxxxx 10xxxxxx

--

5 正確的寫入寫出方式

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 0 前言 在平時的開發(fā)過程中大部分人應(yīng)該都遇到過中文亂碼問題,瀏覽網(wǎng)頁時也會遇到內(nèi)容顯示亂碼的情況,一般遇到這種情...
    小豬啊嗚閱讀 2,650評論 1 10
  • 開始記錄我的 2019-Read-Record 記錄一些有意思的知識點和疑難雜癥。 1 整理字符工作 有這么一幫人...
    NinthDay閱讀 2,514評論 2 13
  • ANSI、UTF-8、Unicode為字符代碼的三種編碼格式,一個字符可以被編碼成ANSI、UTF-8或Unico...
    小熊猜猜我有幾顆糖閱讀 33,453評論 1 8
  • 聚會松山綠水中,四十未見已霜容。 曾經(jīng)學(xué)校多勤奮,頑少童年戲鳥蟲。 故土難回千萬里。他鄉(xiāng)把盞不能同。 興安嶺秀依舊...
    云杉_2e22閱讀 448評論 2 5
  • 第二章 第一節(jié) 第四段 “謝謝您,雖然我也很想得到幫助,只不過現(xiàn)在我的腦子很亂……” “不管是名字還是作者...
    雨象閱讀 235評論 0 0