網絡編程懶人入門(十三)：一泡尿的時間，快速搞懂TCP和UDP的區別

Posted on 2021-12-29 15:01 Jack Jiang 閱讀(153) 評論(0) 編輯收藏

本文引用了作者Fundebug的“一文搞懂TCP與UDP的區別”一文的內容，感謝無私分享。

1、引言

網絡協議是每個搞網絡通信應用開發（比如IM、推送、網關等等）的程序員都必須要掌握的基礎知識，TCP/IP協議簇中有兩個最具有代表性的傳輸層協議——分別是 TCP 和 UDP。

有過網絡通信開發經驗的同學們都知道，TCP和UDP協議是平時用的最多的兩種協議，而對于很多人來說，什么時候以及什么場景下該用TCP還是UDP？這是個經久不息的討論話題。

不同于其它長篇大論，本文盡量以簡潔精煉的文字，幫你總結歸納TCP和UDP協議的主要區別，方便那些想掌握這方面知識又不愿意耗費太多時間去系統地學習網絡理論基礎的同學快速理解！

推薦閱讀：為了加深理解，本系列的另一篇《網絡編程懶人入門(四)：快速理解TCP和UDP的差異》也可以一并閱讀。

學習交流：

- 移動端IM開發入門文章：《新手入門一篇就夠：從零開發移動端IM》
- 開源IM框架源碼：https://github.com/JackJiang2011/MobileIMSDK

（本文已同步發布于：http://www.52im.net/thread-3793-1-1.html ）

2、快速理解TCP/IP協議簇

計算機與網絡設備要相互通信，雙方就必須基于相同的方法。比如：如何探測到通信目標、由哪一邊先發起通信、使用哪種語言進行通信、怎樣結束通信等規則都需要事先確定。不同的硬件、操作系統之間的通信，所有的這一切都需要一種規則。而我們就把這種規則稱為協議（protocol）。

TCP/IP 是互聯網相關的各類協議族的總稱，比如：TCP，UDP，IP，FTP，HTTP，ICMP，SMTP 等都屬于 TCP/IP 族內的協議。

TCP/IP模型是互聯網的基礎，它是一系列網絡協議的總稱。這些協議可以劃分為四層，分別為鏈路層、網絡層、傳輸層和應用層。

具體是：

1）鏈路層：負責封裝和解封裝IP報文，發送和接受ARP/RARP報文等；
2）網絡層：負責路由以及把分組報文發送給目標網絡或主機；
3）傳輸層：負責對報文進行分組和重組，并以TCP或UDP協議格式封裝報文；
4）應用層：負責向用戶提供應用程序，比如HTTP、FTP、Telnet、DNS、SMTP等。

下面這張表格進行了了歸納：

下面這張圖，更生動的反映了TCP/IP協議族的關系情況（高清圖從這里下載）：

在網絡體系結構中，網絡通信的建立必須是在通信雙方的對等層進行，不能交錯。

在整個數據傳輸過程中，數據在發送端時經過各層時都要附加上相應層的協議頭和協議尾（僅數據鏈路層需要封裝協議尾）部分，也就是要對數據進行協議封裝，以標識對應層所用的通信協議。

有關TCP/IP協議簇的知識，幾本書都寫不完，這里我就不再贅述了，有興趣可以讀一讀《TCP/IP詳解卷1：協議（在線閱讀）》。

另外，學習知識，我特別喜歡了解技術之外的一些知識，比如下面兩篇：

《技術往事：改變世界的TCP/IP協議（珍貴多圖、手機慎點）》
《5G時代已經到來，TCP/IP老矣，尚能飯否？》

接下來，我們將回到正題，學習TCP/IP 中有兩個具有代表性的傳輸層協議——TCP 和 UDP。

3、快速理解UDP協議

3.1 基本介紹

UDP協議：全稱是用戶數據報協議，在網絡中它與TCP協議一樣用于處理數據包，是一種無連接的協議。

在OSI模型中，處在第四層——傳輸層，處于IP協議的上一層（見下圖）。

▲ 上圖引用自《計算機網絡通訊協議關系圖》

UDP有不提供數據包分組、組裝和不能對數據包進行排序的缺點，也就是說，當報文發送之后，是無法得知其是否安全完整到達的。

UDP協議的幾個主要特別，我進行歸納，下面的下節將逐一說明。

3.2 面向無連接

首先 UDP 是不需要和 TCP一樣在發送數據前進行三次握手建立連接的，想發數據就可以開始發送了。并且也只是數據報文的搬運工，不會對數據報文進行任何拆分和拼接操作。

具體來說就是：

1）在發送端：應用層將數據傳遞給傳輸層的 UDP 協議，UDP 只會給數據增加一個 UDP 頭標識下是 UDP 協議，然后就傳遞給網絡層了；
2）在接收端：網絡層將數據傳遞給傳輸層，UDP 只去除 IP 報文頭就傳遞給應用層，不會任何拼接操作。

3.3 支持單播、多播、廣播

UDP 不止支持一對一的傳輸方式，同樣支持一對多，多對多，多對一的方式，也就是說 UDP 提供了單播、多播、廣播的功能。

3.4 面向報文

UDP協議是面向報文的。

發送方的UDP對應用程序交下來的報文，在添加首部后就向下交付IP層。UDP對應用層交下來的報文，既不合并，也不拆分，而是保留這些報文的邊界。

因此，應用程序必須選擇合適大小的報文（見《UDP中一個包的大小最大能多大？》）。

3.5 不可靠性

UDP的不可靠性首先體現在無連接上，通信的雙方不需要建立連接，想發就發，這樣的情況肯定不可靠。

并且收到什么數據就傳遞什么數據，并且也不會備份數據，發送數據也不會關心對方是否已經正確接收到數據了。

再者網絡環境時好時壞，但是 UDP 因為沒有擁塞控制，一直會以恒定的速度發送數據（即使網絡條件不好，也不會對發送速率進行調整）。

這樣實現的弊端就是在網絡條件不好的情況下可能會導致丟包，但是優點也很明顯，在某些實時性要求高的場景（比如電話會議）就需要使用 UDP 而不是 TCP（見《網絡編程懶人入門(五)：快速理解為什么說UDP有時比TCP更有優勢》）。

下面這個動圖可以很好的說明UDP的不可靠性：

從上面的動圖可以得知，UDP只會把想發的數據報文一股腦的丟給對方，并不在意數據有無安全完整到達。

3.6 頭部開銷小

UDP協議頭部開銷小（如下圖所示），傳輸數據報文時是很高效的。

▲ 上圖引用自《TCP/IP詳解 - 第11章·UDP協議》

UDP 頭部包含了以下幾個數據：

1）兩個十六位的端口號，分別為源端口（可選字段）和目標端口；
2）整個數據報文的長度；
3）整個數據報文的檢驗和（IPv4 可選字段），該字段用于發現頭部信息和數據中的錯誤。

因此 UDP 的頭部開銷小，只有8字節，相比 TCP 的至少20字節要少得多，在傳輸數據報文時是很高效的。

作為對比，下圖是TCP協議的頭部開銷：

▲ 上圖引用自《TCP/IP詳解 - 第17章·TCP協議》

3.7 更全面地學習UDP協議

UDP協議相對來說比較簡單易學，如果覺得理論上有所欠缺，可以通過網絡經典書籍《TCP/IP詳解 - 第11章·UDP：用戶數據報協議》中的章節來補充。

其實生產應用時，UDP協議也有它復雜的一面，下面這幾篇值得學習一下：

《不為人知的網絡編程(五)：UDP的連接性和負載均衡》
《不為人知的網絡編程(六)：深入地理解UDP協議并用好它》
《不為人知的網絡編程(七)：如何讓不可靠的UDP變的可靠？》

另外，隨著近年來Google等互聯網大廠大力推廣Quic協議，UDP協議在新時代移動互聯網環境下或許能找到更多的應用場景，有興趣的讀者可以學習一下QUIC協議：《網絡編程懶人入門(十)：一泡尿的時間，快速讀懂QUIC協議》、《技術掃盲：新一代基于UDP的低延時網絡傳輸層協議——QUIC詳解》、《讓互聯網更快：新一代QUIC協議在騰訊的技術實踐分享》。

4、快速理解TCP協議

4.1 基本介紹

當一臺計算機想要與另一臺計算機通訊時，兩臺計算機之間的通信需要暢通且可靠，這樣才能保證正確收發數據。

例如：當你想查看網頁或查看電子郵件時，希望完整且按順序查看網頁，而不丟失任何內容。當你下載文件時，希望獲得的是完整的文件，而不僅僅是文件的一部分，因為如果數據丟失或亂序，都不是你希望得到的結果，于是就用到了TCP。

TCP協議：全稱是傳輸控制協議是一種面向連接的、可靠的、基于字節流的傳輸層通信協議，由 IETF 的RFC 793定義。

TCP 是面向連接的、可靠的流協議。流就是指不間斷的數據結構，你可以把它想象成排水管中的水流。

有關TCP協議的理論可以繼續閱讀《TCP/IP詳解 - 第17章·TCP：傳輸控制協議》，限于篇幅這里就展開了。

接下來我們逐個介紹TCP最主要的幾個特點。

4.2 TCP連接過程（3次握手）

如下圖所示，這是建立一個TCP連接的過程（俗稱“3次握手”）:

1）第一次握手：客戶端向服務端發送連接請求報文段。該報文段中包含自身的數據通訊初始序號。請求發送后，客戶端便進入 SYN-SENT 狀態。

2）第二次握手：服務端收到連接請求報文段后，如果同意連接，則會發送一個應答，該應答中也會包含自身的數據通訊初始序號，發送完成后便進入 SYN-RECEIVED 狀態。

3）第三次握手：當客戶端收到連接同意的應答后，還要向服務端發送一個確認報文。客戶端發完這個報文段后便進入 ESTABLISHED 狀態，服務端收到這個應答后也進入 ESTABLISHED 狀態，此時連接建立成功。

這里可能大家會有個疑惑：為什么 TCP 建立連接需要三次握手，而不是兩次？這是因為這是為了防止出現失效的連接請求報文段被服務端接收的情況，從而產生錯誤。

下面的動畫演示了3次握手過程，可能更好懂一些：

▲ 動圖引用自《跟著動畫來學TCP三次握手和四次揮手》

4.3 TCP斷開鏈接（4次揮手）

TCP 是全雙工的，如上圖所示，在斷開連接時兩端都需要發送 FIN 和 ACK。

1）第一次揮手：若客戶端 A 認為數據發送完成，則它需要向服務端 B 發送連接釋放請求。

2）第二次揮手：B 收到連接釋放請求后，會告訴應用層要釋放 TCP 鏈接。然后會發送 ACK 包，并進入 CLOSE_WAIT 狀態，此時表明 A 到 B 的連接已經釋放，不再接收 A 發的數據了。但是因為 TCP 連接是雙向的，所以 B 仍舊可以發送數據給 A。

3）第三次揮手：B 如果此時還有沒發完的數據會繼續發送，完畢后會向 A 發送連接釋放請求，然后 B 便進入 LAST-ACK 狀態。

4）第四次揮手：A 收到釋放請求后，向 B 發送確認應答，此時 A 進入 TIME-WAIT 狀態。該狀態會持續 2MSL（最大段生存期，指報文段在網絡中生存的時間，超時會被拋棄）時間，若該時間段內沒有 B 的重發請求的話，就進入 CLOSED 狀態。當 B 收到確認應答后，也便進入 CLOSED 狀態。

關于TCP的4次揮手，下面的動畫或許更生動一些：