Socket,又稱為套接字,Socket是計算機網絡通信的基本的技術之一。如今大多數基於網絡的軟體,如瀏覽器,即時通訊工具甚至是P2P下載都是基於Socket實現的。本文會介紹一下基於TCP/IP的Socket編程,並且如何寫一個客戶端/伺服器程序。
餐前甜點Unix的輸入輸出(IO)系統遵循Open-Read-Write-Close這樣的操作範本。當一個用戶進程進行IO操作之前,它需要調用Open來指定並獲取待操作文件或設備讀取或寫入的權限。一旦IO操作對象被打開,那麼這個用戶進程可以對這個對象進行一次或多次的讀取或寫入操作。Read操作用來從IO操作對象讀取數據,並將數據傳遞給用戶進程。Write操作用來將用戶進程中的數據傳遞(寫入)到IO操作對象。當所有的Read和Write操作結束之後,用戶進程需要調用Close來通知系統其完成對IO對象的使用。
在Unix開始支持進程間通信(InterProcess Communication,簡稱IPC)時,IPC的接口就設計得類似文件IO操作接口。在Unix中,一個進程會有一套可以進行讀取寫入的IO描述符。IO描述符可以是文件,設備或者是通信通道(socket套接字)。一個文件描述符由三部分組成:創建(打開socket),讀取寫入數據(接受和發送到socket)還有銷毀(關閉socket)。
在Unix系統中,類BSD版本的IPC接口是作為TCP和UDP協議之上的一層進行實現的。消息的目的地使用socket地址來表示。一個socket地址是由網絡地址和埠號組成的通信標識符。
進程間通信操作需要一對兒socket。進程間通信通過在一個進程中的一個socket與另一個進程中得另一個socket進行數據傳輸來完成。當一個消息執行發出後,這個消息在發送端的socket中處於排隊狀態,直到下層的網絡協議將這些消息發送出去。當消息到達接收端的socket後,其也會處於排隊狀態,直到接收端的進程對這條消息進行了接收處理。
TCP和UDP通信關於socket編程我們有兩種通信協議可以進行選擇。一種是數據報通信,另一種就是流通信。
數據報通信數據報通信協議,就是我們常說的UDP(User Data Protocol 用戶數據報協議)。UDP是一種無連接的協議,這就意味著我們每次發送數據報時,需要同時發送本機的socket描述符和接收端的socket描述符。因此,我們在每次通信時都需要發送額外的數據。
流通信流通信協議,也叫做TCP(Transfer Control Protocol,傳輸控制協議)。和UDP不同,TCP是一種基於連接的協議。在使用流通信之前,我們必須在通信的一對兒socket之間建立連接。其中一個socket作為伺服器進行監聽連接請求。另一個則作為客戶端進行連接請求。一旦兩個socket建立好了連接,他們可以單向或雙向進行數據傳輸。
讀到這裡,我們多少有這樣的疑問,我們進行socket編程使用UDP還是TCP呢。選擇基於何種協議的socket編程取決於你的具體的客戶端-伺服器端程序的應用場景。下面我們簡單分析一下TCP和UDP協議的區別,或許可以幫助你更好地選擇使用哪種。
在UDP中,每次發送數據報時,需要附帶上本機的socket描述符和接收端的socket描述符。而由於TCP是基於連接的協議,在通信的socket對之間需要在通信之前建立連接,因此會有建立連接這一耗時存在於TCP協議的socket編程。
在UDP中,數據報數據在大小上有64KB的限制。而TCP中也不存在這樣的限制。一旦TCP通信的socket對建立了連接,他們之間的通信就類似IO流,所有的數據會按照接受時的順序讀取。
UDP是一種不可靠的協議,發送的數據報不一定會按照其發送順序被接收端的socket接受。然後TCP是一種可靠的協議。接收端收到的包的順序和包在發送端的順序是一致的。
簡而言之,TCP適合於諸如遠程登錄(rlogin,telnet)和文件傳輸(FTP)這類的網絡服務。因為這些需要傳輸的數據的大小不確定。而UDP相比TCP更加簡單輕量一些。UDP用來實現實時性較高或者丟包不重要的一些服務。在區域網中UDP的丟包率都相對比較低。
Java中的socket編程下面的部分我將通過一些示例講解一下如何使用socket編寫客戶端和伺服器端的程序。
注意:在接下來的示例中,我將使用基於TCP/IP協議的socket編程,因為這個協議遠遠比UDP/IP使用的要廣泛。並且所有的socket相關的類都位於java.net包下,所以在我們進行socket編程時需要引入這個包。
客戶端編寫開啟Socket
如果在客戶端,你需要寫下如下的代碼就可以打開一個socket。
上面代碼中,host即客戶端需要連接的機器,port就是伺服器端用來監聽請求的埠。在選擇埠時,需要注意一點,就是0~1023這些埠都已經被系統預留了。這些埠為一些常用的服務所使用,比如郵件,FTP和HTTP。當你在編寫伺服器端的代碼,選擇埠時,請選擇一個大於1023的埠。
寫入數據
接下來就是寫入請求數據,我們從客戶端的socket對象中得到OutputStream對象,然後寫入數據後。很類似文件IO的處理代碼。
關閉IO對象
類似文件IO,在讀寫數據完成後,我們需要對IO對象進行關閉,以確保資源的正確釋放。
伺服器端編寫打開伺服器端的socket
上面的代碼創建了一個伺服器端的socket,然後調用accept方法監聽並獲取客戶端的請求socket。accept方法是一個阻塞方法,在伺服器端與客戶端之間建立聯繫之前會一直等待阻塞。
讀取數據
通過上面得到的socket對象獲取InputStream對象,然後安裝文件IO一樣讀取數據即可。這裡我們將內容列印出來。
關閉IO對象
還是不能忘記的,最後需要正確地關閉IO對象,以確保資源的正確釋放。
附註一個例子這裡我們增加一個例子,使用socket實現一個回聲伺服器,就是伺服器會將客戶端發送過來的數據傳回給客戶端。代碼很簡單。
編譯運行上面的代碼,進行如下請求,就可以看到客戶端請求攜帶的數據的內容。
進行客戶端-伺服器端編程還是比較有趣的,同時在Java中進行socket編程要比其他語言(如C)要簡單快速編寫。
java.net這個包裡面包含了很多強大靈活的類供開發者進行網絡編程,在進行網絡編程中,建議使用這個包下面的API。同時Sun.*這個包也包含了很多的網絡編程相關的類,但是不建議使用這個包下面的API,因為這個包可能會改變,另外這個包不能保證在所有的平臺都有包含。
原文:Sockets programming in Java: A tutorial 翻譯:droidyue