“回車”(CR,Carriage Return)和“換行”(LF,Line Feed)
在文本處理中, CR, LF, CR/LF 是不同操作系統上使用的換行符:
- Dos 和 windows 采用“回車+換行,CR/LF”表示下一行;
- UNIX/Linux 采用“換行符,LF”表示下一行;
- 蘋果機(MAC OS 系統)則采用“回車符,CR”表示下一行。
CR 用符號'\r'表示, 十進制ASCII代碼是 13, 十六進制代碼為 0x0D;
LF 使用'\n'符號表示,ASCII代碼是 10, 十六制為 0x0A。
所以 Windows 平臺上換行在文本文件中是使用 0d 0a 兩個字節表示,而 UNIX 和蘋果平臺上換行則是使用 0a 或 0d 一個字節表示。
一般操作系統上的運行庫會自動決定文本文件的換行格式,如一個程序在 windows 上運行就生成 CR/LF 換行格式的文本文件,而在 Linux 上運行就生成 LF 格式換行的文本文件。
在一個平臺上使用另一種換行符的文件文件可能會帶來意想不到的問題,特別是在編輯程序代碼時,有時候代碼在編輯器中顯示正常, 但在編輯時卻會因為換行符問題而出錯。
很多文本/代碼編輯器帶有換行符轉換功能,,使用這個功能可以將文本文件中的換行符在不同格式單互換。
在不同平臺間使用 FTP 軟件傳送文件時,在 ASCII 文本模式傳輸模式下, 一些 FTP 客戶端程序會自動對換行格式進行轉換,經過這種傳輸的文件字節數可能會發生變化,如果你不想 FTP 修改原文件,可以使用 bin 模式(二進制模式)傳輸文本。
在計算機還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33,Linux/Unix下的tty概念也來自于此)的玩意,每秒鐘可以打 10 個字符。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字符。要是在這 0.2 秒里面,又有新的字符傳過來,那么這個字符將丟失。
于是,研制人員想了個辦法解決這個問題,就是在每行后面加兩個表示結束的字符。一個叫做“回車”,告訴打字機把打印頭定位在左邊界;另一個叫做“換行”,告訴打字機把紙向下移一行。這就是“換行”和“回車”的來歷,從它們的英語名字上也可以看出一二。
后來,計算機發明了,這兩個概念也就被搬到了計算機上。那時,存儲器很貴,一些科學家認為在每行結尾加兩個字符太浪費了,加一個就可以。于是,就出現了分歧。
Unix系統里,每行結尾只有“<換行>”,即"\n";
Mac系統里,每行結尾是“<回車>”,即"\r";
Windows系統里面,每行結尾是“<換行><回車 >”,即“\n\r”。
一個直接后果是,Unix/Mac系統下的文件在 Windows里打開的話,所有文字會變成一行;而Windows里的文件在Unix/Mac下打開的話,在每行的結尾可能會多出一個^M符號。
原文鏈接:
http://www.cppblog.com/prayer/archive/2009/08/19/93854.html