本文引用了作者Fundebug的“一文搞懂TCP與UDP的區別”一文的內容,感謝無私分享。
1、引言
網絡協議是每個搞網絡通信應用開發(比如IM、推送、網關等等)的程序員都必須要掌握的基礎知識,TCP/IP協議簇中有兩個最具有代表性的傳輸層協議——分別是 TCP 和 UDP。
有過網絡通信開發經驗的同學們都知道,TCP和UDP協議是平時用的最多的兩種協議,而對于很多人來說,什么時候以及什么場景下該用TCP還是UDP?這是個經久不息的討論話題。
不同于其它長篇大論,本文盡量以簡潔精煉的文字,幫你總結歸納TCP和UDP協議的主要區別,方便那些想掌握這方面知識又不愿意耗費太多時間去系統地學習網絡理論基礎的同學快速理解!
(本文已同步發布于:http://www.52im.net/thread-3793-1-1.html )
2、快速理解TCP/IP協議簇
計算機與網絡設備要相互通信,雙方就必須基于相同的方法。比如:如何探測到通信目標、由哪一邊先發起通信、使用哪種語言進行通信、怎樣結束通信等規則都需要事先確定。不同的硬件、操作系統之間的通信,所有的這一切都需要一種規則。而我們就把這種規則稱為協議(protocol)。
TCP/IP 是互聯網相關的各類協議族的總稱,比如:TCP,UDP,IP,FTP,HTTP,ICMP,SMTP 等都屬于 TCP/IP 族內的協議。
TCP/IP模型是互聯網的基礎,它是一系列網絡協議的總稱。這些協議可以劃分為四層,分別為鏈路層、網絡層、傳輸層和應用層。
具體是:
- 1)鏈路層:負責封裝和解封裝IP報文,發送和接受ARP/RARP報文等;
- 2)網絡層:負責路由以及把分組報文發送給目標網絡或主機;
- 3)傳輸層:負責對報文進行分組和重組,并以TCP或UDP協議格式封裝報文;
- 4)應用層:負責向用戶提供應用程序,比如HTTP、FTP、Telnet、DNS、SMTP等。
下面這張表格進行了了歸納:

在網絡體系結構中,網絡通信的建立必須是在通信雙方的對等層進行,不能交錯。
在整個數據傳輸過程中,數據在發送端時經過各層時都要附加上相應層的協議頭和協議尾(僅數據鏈路層需要封裝協議尾)部分,也就是要對數據進行協議封裝,以標識對應層所用的通信協議。
有關TCP/IP協議簇的知識,幾本書都寫不完,這里我就不再贅述了,有興趣可以讀一讀《TCP/IP詳解 卷1:協議(在線閱讀)》。
另外,學習知識,我特別喜歡了解技術之外的一些知識,比如下面兩篇:
- 《技術往事:改變世界的TCP/IP協議(珍貴多圖、手機慎點)》
- 《5G時代已經到來,TCP/IP老矣,尚能飯否?》
接下來,我們將回到正題,學習TCP/IP 中有兩個具有代表性的傳輸層協議——TCP 和 UDP。
3、快速理解UDP協議
3.1 基本介紹
UDP協議:全稱是用戶數據報協議,在網絡中它與TCP協議一樣用于處理數據包,是一種無連接的協議。
在OSI模型中,處在第四層——傳輸層,處于IP協議的上一層(見下圖)。
UDP有不提供數據包分組、組裝和不能對數據包進行排序的缺點,也就是說,當報文發送之后,是無法得知其是否安全完整到達的。
UDP協議的幾個主要特別,我進行歸納,下面的下節將逐一說明。
3.2 面向無連接
首先 UDP 是不需要和 TCP一樣在發送數據前進行三次握手建立連接的,想發數據就可以開始發送了。并且也只是數據報文的搬運工,不會對數據報文進行任何拆分和拼接操作。
具體來說就是:
- 1)在發送端:應用層將數據傳遞給傳輸層的 UDP 協議,UDP 只會給數據增加一個 UDP 頭標識下是 UDP 協議,然后就傳遞給網絡層了;
- 2)在接收端:網絡層將數據傳遞給傳輸層,UDP 只去除 IP 報文頭就傳遞給應用層,不會任何拼接操作。
3.3 支持單播、多播、廣播
UDP 不止支持一對一的傳輸方式,同樣支持一對多,多對多,多對一的方式,也就是說 UDP 提供了單播、多播、廣播的功能。
3.4 面向報文
UDP協議是面向報文的。
發送方的UDP對應用程序交下來的報文,在添加首部后就向下交付IP層。UDP對應用層交下來的報文,既不合并,也不拆分,而是保留這些報文的邊界。
因此,應用程序必須選擇合適大小的報文(見《UDP中一個包的大小最大能多大?》)。
3.5 不可靠性
UDP的不可靠性首先體現在無連接上,通信的雙方不需要建立連接,想發就發,這樣的情況肯定不可靠。
并且收到什么數據就傳遞什么數據,并且也不會備份數據,發送數據也不會關心對方是否已經正確接收到數據了。
再者網絡環境時好時壞,但是 UDP 因為沒有擁塞控制,一直會以恒定的速度發送數據(即使網絡條件不好,也不會對發送速率進行調整)。
這樣實現的弊端就是在網絡條件不好的情況下可能會導致丟包,但是優點也很明顯,在某些實時性要求高的場景(比如電話會議)就需要使用 UDP 而不是 TCP(見《網絡編程懶人入門(五):快速理解為什么說UDP有時比TCP更有優勢》)。
下面這個動圖可以很好的說明UDP的不可靠性:

從上面的動圖可以得知,UDP只會把想發的數據報文一股腦的丟給對方,并不在意數據有無安全完整到達。
3.6 頭部開銷小
UDP協議頭部開銷小(如下圖所示),傳輸數據報文時是很高效的。
UDP 頭部包含了以下幾個數據:
- 1)兩個十六位的端口號,分別為源端口(可選字段)和目標端口;
- 2)整個數據報文的長度;
- 3)整個數據報文的檢驗和(IPv4 可選 字段),該字段用于發現頭部信息和數據中的錯誤。
因此 UDP 的頭部開銷小,只有8字節,相比 TCP 的至少20字節要少得多,在傳輸數據報文時是很高效的。
作為對比,下圖是TCP協議的頭部開銷:
3.7 更全面地學習UDP協議
UDP協議相對來說比較簡單易學,如果覺得理論上有所欠缺,可以通過網絡經典書籍《TCP/IP詳解 - 第11章·UDP:用戶數據報協議》中的章節來補充。
其實生產應用時,UDP協議也有它復雜的一面,下面這幾篇值得學習一下:
- 《不為人知的網絡編程(五):UDP的連接性和負載均衡》
- 《不為人知的網絡編程(六):深入地理解UDP協議并用好它》
- 《不為人知的網絡編程(七):如何讓不可靠的UDP變的可靠?》
另外,隨著近年來Google等互聯網大廠大力推廣Quic協議,UDP協議在新時代移動互聯網環境下或許能找到更多的應用場景,有興趣的讀者可以學習一下QUIC協議:《網絡編程懶人入門(十):一泡尿的時間,快速讀懂QUIC協議》、《技術掃盲:新一代基于UDP的低延時網絡傳輸層協議——QUIC詳解》、《讓互聯網更快:新一代QUIC協議在騰訊的技術實踐分享》。
4、快速理解TCP協議
4.1 基本介紹
當一臺計算機想要與另一臺計算機通訊時,兩臺計算機之間的通信需要暢通且可靠,這樣才能保證正確收發數據。
例如:當你想查看網頁或查看電子郵件時,希望完整且按順序查看網頁,而不丟失任何內容。當你下載文件時,希望獲得的是完整的文件,而不僅僅是文件的一部分,因為如果數據丟失或亂序,都不是你希望得到的結果,于是就用到了TCP。
TCP協議:全稱是傳輸控制協議是一種面向連接的、可靠的、基于字節流的傳輸層通信協議,由 IETF 的RFC 793定義。
TCP 是面向連接的、可靠的流協議。流就是指不間斷的數據結構,你可以把它想象成排水管中的水流。
有關TCP協議的理論可以繼續閱讀《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》,限于篇幅這里就展開了。
接下來我們逐個介紹TCP最主要的幾個特點。
4.2 TCP連接過程(3次握手)
如下圖所示,這是建立一個TCP連接的過程(俗稱“3次握手”):

1)第一次握手:客戶端向服務端發送連接請求報文段。該報文段中包含自身的數據通訊初始序號。請求發送后,客戶端便進入 SYN-SENT 狀態。
2)第二次握手:服務端收到連接請求報文段后,如果同意連接,則會發送一個應答,該應答中也會包含自身的數據通訊初始序號,發送完成后便進入 SYN-RECEIVED 狀態。
3)第三次握手:當客戶端收到連接同意的應答后,還要向服務端發送一個確認報文。客戶端發完這個報文段后便進入 ESTABLISHED 狀態,服務端收到這個應答后也進入 ESTABLISHED 狀態,此時連接建立成功。
這里可能大家會有個疑惑:為什么 TCP 建立連接需要三次握手,而不是兩次?這是因為這是為了防止出現失效的連接請求報文段被服務端接收的情況,從而產生錯誤。
下面的動畫演示了3次握手過程,可能更好懂一些:
4.3 TCP斷開鏈接(4次揮手)
TCP 是全雙工的,如上圖所示,在斷開連接時兩端都需要發送 FIN 和 ACK。
1)第一次揮手:若客戶端 A 認為數據發送完成,則它需要向服務端 B 發送連接釋放請求。
2)第二次揮手:B 收到連接釋放請求后,會告訴應用層要釋放 TCP 鏈接。然后會發送 ACK 包,并進入 CLOSE_WAIT 狀態,此時表明 A 到 B 的連接已經釋放,不再接收 A 發的數據了。但是因為 TCP 連接是雙向的,所以 B 仍舊可以發送數據給 A。
3)第三次揮手:B 如果此時還有沒發完的數據會繼續發送,完畢后會向 A 發送連接釋放請求,然后 B 便進入 LAST-ACK 狀態。
4)第四次揮手:A 收到釋放請求后,向 B 發送確認應答,此時 A 進入 TIME-WAIT 狀態。該狀態會持續 2MSL(最大段生存期,指報文段在網絡中生存的時間,超時會被拋棄) 時間,若該時間段內沒有 B 的重發請求的話,就進入 CLOSED 狀態。當 B 收到確認應答后,也便進入 CLOSED 狀態。
關于TCP的4次揮手,下面的動畫或許更生動一些:
正確理解TCP 3次握手和4次揮手過程,是非常重要的,限于篇幅,本文沒辦法進一步深入展開,有興趣的同事可以進一步深入閱讀以幾篇專題文章:
- 《腦殘式網絡編程入門(一):跟著動畫來學TCP三次握手和四次揮手》
- 《理論經典:TCP協議的3次握手與4次揮手過程詳解》
- 《理論聯系實際:Wireshark抓包分析TCP 3次握手、4次揮手過程》
4.4 TCP協議要點歸納
1)面向連接:
面向連接,是指發送數據之前必須在兩端建立連接。
建立連接的方法是“三次握手”,這樣能建立可靠的連接。建立連接,是為數據的可靠傳輸打下了基礎。
2)僅支持單播傳輸:
每條TCP傳輸連接只能有兩個端點,只能進行點對點的數據傳輸,不支持多播和廣播傳輸方式。
3)面向字節流:
TCP不像UDP一樣那樣一個個報文獨立地傳輸,而是在不保留報文邊界的情況下以字節流方式進行傳輸。
4)可靠傳輸:
對于可靠傳輸、判斷丟包、誤碼,靠的是TCP的段編號以及確認號。
TCP為了保證報文傳輸的可靠,就給每個包一個序號,同時序號也保證了傳送到接收端實體的包的按序接收。
然后接收端實體對已成功收到的字節發回一個相應的確認(ACK):如果發送端實體在合理的往返時延(RTT)內未收到確認,那么對應的數據(假設丟失了)將會被重傳。
關于可靠傳輸的理論,可以深入學習《TCP/IP詳解 - 第21章·TCP的超時與重傳》,這里就不深入展開了。
5)提供擁塞控制:
當網絡出現擁塞的時候,TCP能夠減小向網絡注入數據的速率和數量,緩解擁塞。
TCP中有關擁塞控制的文章通都比較枯燥,這篇《通俗易懂-深入理解TCP協議(下):RTT、滑動窗口、擁塞處理》相對來說講的比較易懂,有興趣可以深入讀讀。
6)TCP提供全雙工通信:
TCP允許通信雙方的應用程序在任何時候都能發送數據,因為TCP連接的兩端都設有緩存,用來臨時存放雙向通信的數據。
當然,TCP可以立即發送一個數據段,也可以緩存一段時間以便一次發送更多的數據段(最大的數據段大小取決于MSS)。
4.5 更全面地學習TCP協議
TCP協議涉及的內容比較豐富,真要方方面面展來講,三天三夜也講不完。不過,對于網絡應用的開發者來說,根據自已應用所涉及技術的深度按需學習就可以了。
初學者建議先把理論夯實,比如從《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》這本經典書籍開始。
如果覺得理論太過乏味,下面這幾篇生動有趣的入門文章推薦一定要讀一讀:
- 《網絡編程懶人入門(一):快速理解網絡通信協議(上篇)》
- 《網絡編程懶人入門(二):快速理解網絡通信協議(下篇)》
- 《網絡編程懶人入門(三):快速理解TCP協議一篇就夠》
- 《網絡編程懶人入門(六):史上最通俗的集線器、交換機、路由器功能原理入門》
- 《腦殘式網絡編程入門(一):跟著動畫來學TCP三次握手和四次揮手》
- 《網絡編程入門從未如此簡單(一):假如你來設計網絡,會怎么做?》
- 《網絡編程入門從未如此簡單(二):假如你來設計TCP協議,會怎么做?》
另外,在學習TCP或者網絡編程實踐的過程中,其它的一些網絡知識也有必要了解,下面這幾篇可以讓你輕松的學習,不要錯過:
- 《腦殘式網絡編程入門(五):每天都在用的Ping命令,它到底是什么?》
- 《腦殘式網絡編程入門(六):什么是公網IP和內網IP?NAT轉換又是什么鬼?》
- 《腦殘式網絡編程入門(七):面視必備,史上最通俗計算機網絡分層詳解》
- 《腦殘式網絡編程入門(八):你真的了解127.0.0.1和0.0.0.0的區別?》
- 《腦殘式網絡編程入門(九):面試必考,史上最通俗大小端字節序詳解》
在生產應用中,必須要涉及到網絡的高性能、高并發問題,下面這幾篇值得學習:
- 《高性能網絡編程(一):單臺服務器并發TCP連接數到底可以有多少》
- 《高性能網絡編程(二):上一個10年,著名的C10K并發連接問題》
- 《高性能網絡編程(三):下一個10年,是時候考慮C10M并發問題了》
- 《高性能網絡編程(四):從C10K到C10M高性能網絡應用的理論探索》
- 《從根上理解高性能、高并發(一):深入計算機底層,理解線程與線程池》
- 《從根上理解高性能、高并發(二):深入操作系統,理解I/O與零拷貝技術》
- 《從根上理解高性能、高并發(三):深入操作系統,徹底理解I/O多路復用》
- 《從根上理解高性能、高并發(四):深入操作系統,徹底理解同步與異步》
- 《從根上理解高性能、高并發(五):深入操作系統,理解高并發中的協程》
- 《從根上理解高性能、高并發(六):通俗易懂,高性能服務器到底是如何實現的》
- 《從根上理解高性能、高并發(七):深入操作系統,一文讀懂進程、線程、協程》
隨著TCP協議應用的深度不斷拓展,一定會遇到各種疑難雜癥:
- 《不為人知的網絡編程(一):淺析TCP協議中的疑難雜癥(上篇)》
- 《不為人知的網絡編程(二):淺析TCP協議中的疑難雜癥(下篇)》
- 《不為人知的網絡編程(三):關閉TCP連接時為什么會TIME_WAIT、CLOSE_WAIT》
- 《不為人知的網絡編程(四):深入研究分析TCP的異常關閉》
對于TCP協議來說,知道的越多越覺無知,下面這幾篇或許可以徹底為你解開一些疑惑,不可多得:
- 《不為人知的網絡編程(十):深入操作系統,從內核理解網絡包的接收過程(Linux篇)》
- 《不為人知的網絡編程(十一):從底層入手,深度分析TCP連接耗時的秘密》
- 《不為人知的網絡編程(十二):徹底搞懂TCP協議層的KeepAlive保活機制》
- 《不為人知的網絡編程(十三):深入操作系統,徹底搞懂127.0.0.1本機網絡通信》
5、總結一下
TCP和UDP的區別可以歸納為下面這張表格:

簡單來說,TCP和UDP的區別就是:
- 1)TCP向上層提供面向連接的可靠服務 ,UDP向上層提供無連接不可靠服務;
- 2)雖然 UDP 并沒有 TCP 傳輸來的準確,但是也能在很多實時性要求高的地方有所作為;
- 3)對數據準確性要求高,速度可以相對較慢的,可以選用TCP。
最后,想用一張圖來生動地概括一下TCP與UDP的區別:

正如上圖所示:TCP就像左邊的妹子——喝起水來有條不紊、滴水不漏,UDP就像右邊的妹子——甭管能喝到多少、倒就完了。。。
6、系列文章
本文是系列文章中的第13篇,本系列文章的大綱如下:
[1] 網絡編程懶人入門(一):快速理解網絡通信協議(上篇)
[2] 網絡編程懶人入門(二):快速理解網絡通信協議(下篇)
[3] 網絡編程懶人入門(三):快速理解TCP協議一篇就夠
[4] 網絡編程懶人入門(四):快速理解TCP和UDP的差異
[5] 網絡編程懶人入門(五):快速理解為什么說UDP有時比TCP更有優勢
[6] 網絡編程懶人入門(六):史上最通俗的集線器、交換機、路由器功能原理入門
[7] 網絡編程懶人入門(七):深入淺出,全面理解HTTP協議
[8] 網絡編程懶人入門(八):手把手教你寫基于TCP的Socket長連接
[9] 網絡編程懶人入門(九):通俗講解,有了IP地址,為何還要用MAC地址?
[11] 網絡編程懶人入門(十):一泡尿的時間,快速讀懂QUIC協議
[12] 網絡編程懶人入門(十一):一文讀懂什么是IPv6
[13] 網絡編程懶人入門(十二):快速讀懂Http/3協議,一篇就夠!
[14] 網絡編程懶人入門(十三):一泡尿的時間,快速搞懂TCP和UDP的區別(* 本文)
(本文已同步發布于:http://www.52im.net/thread-3793-1-1.html )