之前學了計算機網絡,但半年后就忘的差不多了,感覺TCP/IP協議的這個知識點很重要,整理一篇文章來鞏固一下。文章分為TCP的概念,TCP/UDP區別總結,三次握手四次揮手的過程,為什么要這么做的原因等四大部分來講解。
一 、 TCP協議的概念
TCP(transmission control protocal,傳輸控制協議),是面向連接的并具備順序控制、重發控制等機制的。所以它可以為應用提供可靠傳輸。工作在網絡OSI的七層模型的第四層——傳輸層。ip在第三層——網絡層。我們要知道數據從應用層發下來,會在每一層加上響應的頭部信息,進行封裝然后再發送到數據的接收端。每一層的作用和對應的協議如下:
接下來介紹TCP協議的數據格式和頭部格式每個字段的含義:
- Source Port和Destination Port:分別占用16位,表示源端口號和目的端口號;用于區別主機中的不同進程,而IP地址是用來區分不同的主機的,源端口號和目的端口號配合上IP首部中的源IP地址和目的IP地址就能唯一的確定一個TCP連接。
- Sequence Number:用來標識從TCP發端向TCP收端發送的數據字節流,它表示在這個報文段中的的第一個數據字節在數據流中的序號;主要用來解決網絡報亂序的問題。
- Acknowledgment Number:32位確認序列號包含發送確認的一端所期望收到的下一個序號,因此,確認序號應當是上次已成功收到數據字節序號加1。不過,只有當標志位中的
ACK
標志(下面介紹)為1時該確認序列號的字段才有效。主要用來解決不丟包的問題。 - Offset:給出首部中32 bit字的數目,需要這個值是因為任選字段的長度是可變的。這個字段占4bit(最多能表示15個32bit的的字,即4*15=60個字節的首部長度),因此TCP最多有60字節的首部。然而,沒有任選字段,正常的長度是20字節。
- TCP Flags:TCP首部中有6個標志比特,它們中的多個可同時被設置為1,主要是用于操控TCP的狀態機的,依次為
URG
,ACK
,PSH
,RST
,SYN
,FIN
。每個標志位的意思如下:
* URG:此標志表示TCP包的緊急指針域(后面馬上就要說到)有效,用來保證TCP連接不被中斷,并且督促中間層設備要盡快處理這些數據
* ACK:此標志表示應答域有效,就是說前面所說的TCP應答號將會包含在TCP數據包中;有兩個取值:0和1,為1的時候表示應答域有效,反之為0
* PSH:這個標志位表示Push操作。所謂Push操作就是指在數據包到達接收端以后,立即傳送給應用程序,而不是在緩沖區中排隊
* RST:這個標志表示連接復位請求。用來復位那些產生錯誤的連接,也被用來拒絕錯誤和非法的數據包
* SYN:表示同步序號,用來建立連接。SYN標志位和ACK標志位搭配使用,當連接請求的時候,SYN=1,ACK=0;連接被響應的時候,SYN=1,ACK=1;這個標志的數據包經常被用來進行端口掃描。掃描者發送一個只有SYN的數據包,如果對方主機響應了一個數據包回來 ,就表明這臺主機存在這個端口;但是由于這種掃描方式只是進行TCP三次握手的第一次握手,因此這種掃描的成功表示被掃描的機器不很安全,一臺安全的主機將會強制要求一個連接嚴格的進行TCP的三次握手
* FIN: 表示發送端已經達到數據末尾,也就是說雙方的數據傳送完成,沒有數據可以傳送了,發送FIN標志位的TCP數據包后,連接將被斷開。這個標志的數據包也經常被用于進行端口掃描 - Window:窗口大小,也就是有名的滑動窗口,用來進行流量控制。
二、 TCP/UDP區別總結
TCP(Transmission Control Protocol)
UDP(User Datagram Protocol)
- TCP面向連接(如打電話要先撥號建立連接),UDP是無連接的,即發送數據之前不需要建立連接。
- TCP提供可靠的服務,邏輯通信信道是全雙工的可靠信道,也就是說通過TCP連接傳送的數據,無差錯,不丟失,不重復,且按序到達。UDP是不可靠信道盡最大努力交付,即不保證可靠交付。
- TCP面向字節流,實際上是TCP把數據看成一連串無結構的字節流。UDP是面向報文的UDP沒有擁塞控制,因此網絡出現擁塞不會使源主機的發送速率降低(對實時應用很有用,如IP電話,實時視頻會議等)。
- 每一條TCP連接只能是點到點的,UDP支持一對一,一對多,多對一和多對多的交互通信。
- TCP首部開銷20字節,UDP的首部開銷小,只有8個字節。
三 、 三次握手四次揮手的過程
TCP是面向連接的,無論哪一方向另一方發送數據之前,都必須先在雙方之間建立一條連接。
- 第一次握手:建立連接。客戶端發送連接請求報文段,將
SYN
位置為1,Sequence Number
為x;然后,客戶端進入SYN_SEND
狀態,等待服務器的確認。 - 第二次握手:服務器收到SYN報文段。服務器收到客戶端的SYN報文段,需要對這個SYN報文段進行確認,設置
Acknowledgment Number
為x+1(Sequence Number+1);同時,自己自己還要發送SYN請求信息,將SYN位置為1,Sequence Number
為y;服務器端將上述所有信息放到一個報文段(即SYN+ACK報文段)中,一并發送給客戶端,此時服務器進入SYN_RECV
狀態 - 第三次握手:客戶端收到服務器的SYN+ACK報文段。然后將
Acknowledgment Number
設置為y+1,向服務器發送ACK
報文段,這個報文段發送完畢以后,客戶端和服務器端都進入ESTABLISHED
狀態,完成TCP三次握手。
完成了三次握手,客戶端和服務器端就可以開始傳送數據。
當客戶端和服務器通過三次握手建立了TCP連接以后,當數據傳送完畢,要斷開TCP連接.對于TCP的斷開連接,這里就有了神秘的“四次分手”。
- 第一次分手:主機1(可以使客戶端,也可以是服務器端),設置
Sequence Number
和Acknowledgment Number
,向主機2發送一個FIN報文段;此時,主機1進入FIN_WAIT_1
狀態;這表示主機1沒有數據要發送給主機2了。 - 第二次分手:主機2收到了主機1發送的FIN報文段,向主機1回一個
ACK
報文段,Acknowledgment Number
為Sequence Number
加1;主機1進入FIN_WAIT_2
狀態;主機2告訴主機1,我“同意”你的關閉請求。 - 第三次分手:主機2向主機1發送
FIN
報文段,請求關閉連接,同時主機2進入LAST_ACK
狀態。 - 第四次分手:主機1收到主機2發送的
FIN
報文段,向主機2發送ACK
報文段,然后主機1進入TIME_WAIT
狀態;主機2收到主機1的ACK
報文段以后,就關閉連接;此時,主機1等待2MSL
后依然沒有收到回復,則證明Server端已正常關閉,主機1也可以關閉連接了。
四、 相關問題
- 1 為什么要三次握手?
感覺兩次就能完成連接,為什么非要三次呢?引用謝希仁的《計算機網絡》中的解釋
為了防止已失效的連接請求報文段突然又傳送到了服務器端,因而產生錯誤。
就是防止服務器端的一直等待而浪費了資源。
- 2 為什么要四次分手?
TCP協議是一種面向連接的、可靠的、基于字節流的運輸層通信協議。TCP是全雙工模式,這就意味著,當主機1發出FIN報文段時,只是表示主機1已經沒有數據要發送了,主機1告訴主機2,它的數據已經全部發送完畢了;但是,這個時候主機1還是可以接受來自主機2的數據;當主機2返回ACK
報文段時,表示它已經知道主機1沒有數據發送了,但是主機2還是可以發送數據到主機1的;當主機2也發送了FIN報文段時,這個時候就表示主機2也沒有數據要發送了,就會告訴主機1,我也沒有數據要發送了,之后彼此就會愉快的中斷這次TCP連接。 - 3 為什么
TIME_WAIT
狀態還需要等2MSL
后才能返回到CLOSED
狀態? - 什么是
2MSL
?MSL即Maximum Segment Lifetime,也就是報文最大生存時間,引用《TCP/IP詳解》中的話:“它(MSL)是任何報文段被丟棄前在網絡內的最長時間。”那么,2MSL也就是這個時間的2倍。其實我覺得沒必要把這個MSL的確切含義搞明白,你所需要明白的是,當TCP連接完成四個報文段的交換時,主動關閉的一方將繼續等待一定時間(2-4分鐘),即使兩端的應用程序結束。 - 從以上TCP連接關閉的狀態轉換圖可以看出,主動關閉的一方在發送完對對方FIN報文的確認(ACK)報文后,會進入
TIME_WAIT
狀態。TIME_WAIT
狀態也稱為2MSL狀態。 - 為什么需要2MSL?根據《TCP/IP詳解》和《The TCP/IP Guide》中的說法,有兩個原因:
其一,保證發送的ACK會成功發送到對方,如何保證?我覺得可能是通過超時計時器發送。這個就很難用代碼演示了。
其二,報文可能會被混淆,意思是說,其他時候的連接可能會被當作本次的連接。直接引用《The TCP/IP Guide》的說法:The second is to provide a “buffering period” between the end of this connection and any subsequent ones. If not for this period, it is possible that packets from different connections could be mixed, creating confusion.
- 4 常見的應用中有哪些是應用TCP協議的,哪些又是應用UDP協議的,為什么它們被如此設計?
- 多播的信息一定要用UDP實現,因為TCP只支持一對一通信。
- 如果一個應用場景重性能甚于重完整性和安全性,那么適合于UDP,比如多媒體應用,缺一兩幀不影響用戶體驗,但是需要流媒體到達的速度快,因此比較適合用UDP。
- 以qq為例的一個說明
- 登陸采用TCP協議和HTTP協議,你和好友之間發送消息,主要采用UDP協議,內網傳文件采用了P2P技術。
- 和好友發消息,客戶端client采用UDP協議,但是需要通過服務器轉發。騰訊為了確保傳輸消息的可靠,采用上層協議來保證可靠傳輸。如果消息發送失敗,客戶端會提示消息發送失敗,并可重新發送。
- 如果是在內網里面的兩個客戶端傳文件,QQ采用的是P2P技術,不需要服務器中轉。
參考文獻
http://blog.csdn.net/yipiankongbai/article/details/24435977
http://www.jellythink.com/archives/705
http://www.zhihu.com/question/20292749
謝希仁《計算機網絡》《圖解tcp/ip》《tcp/ip詳解》