1 ASCII:American Standard Code for Information Interchange
-
0~32
:用作控制字符 -
00000000-01111111
:其他字符
2 GB2312標準
-
00000000 00000000
:大概能存儲7000左右漢字
2.1 GBK:GB2312的拓展
- 擴展大概多出20000左右字符,包含繁體字、假名、羅馬字符
2.2 GB18030:包含很多少數(shù)名族字符
3 ISO:國際標準化組織
UCS:Universal Multi-Octet Coded Character Set
UCS俗稱Unicode
4 UTF:Unicode Transfer Format
- UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位傳輸
- UTF8表示一個字符用多少個字節(jié)不固定
- 舉例:
- 如果一個字符只占一個字節(jié),表示
0xxxxxxx
- 如果一個字符占兩個字節(jié),表示
110xxxxx 10xxxxxx
- 如果一個字符占三個字節(jié),表示
1110xxxx 10xxxxxx 10xxxxxx
- 如果一個字符占四個字節(jié),表示
11111xxx 10xxxxxx 10xxxxxx 10xxxxxx
- 如果一個字符只占一個字節(jié),表示
--
5 正確的寫入寫出方式
image.png