續:第(5)節
本文所有引用均來自廖雪峰老師的網站。轉載請說明出處。
3.字符編碼
·字符編碼
發展歷史:
ASCII
碼
只有127個字符可以表示。也就是一個字節(8bits)來表示一個字符。Unicode
通常用兩個字節編碼。
Unicode把所有語言都統一到一套編碼里,避免了亂碼問題。
然鵝, 雖然Unicode避免了多國語言的亂碼問題,但是它使得需要的計算機存儲空間比ASCII
碼 多了一倍。so——
- UTF-8
可變長編碼。
UTF-8編碼把一個Unicode字符根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1個字節,漢字通常是3個字節,只有很生僻的字符才會被編碼成4-6個字節。如果你要傳輸的文本包含大量英文字符,用UTF-8編碼就能節省空間
在計算機內存中,統一使用Unicode編碼,當需要保存到硬盤或者需要傳輸的時候,就轉換為UTF-8編碼。
4.Python中的字符串
- ord('A') 獲取字符的整數表示
- chr(66) 把編碼轉化成對應字符
- len('ABC') 計算包含多少字符
- 格式化
使用%
運算符來格式化字符串。
%s
:字符串
%d
:整數
%?
:
%f
:浮點數
%x
:十六進制整數
其中,格式化整數和浮點數還可以指定是否補0和整數與小數的位數
例子
萬能的%s
:如果你不知道應該用什么字符類型,可以用%s
,它會把任何數據類型轉化為字符串。
- 若要輸出'%',需要進行轉義:%%
(未完待續……)