Java對IPv6的支持詳解：支持情況、相關API、演示代碼等

Posted on 2020-12-07 19:31 Jack Jiang 閱讀(538) 評論(0) 編輯收藏

本文由朱益盛、楊暉、傅嘯分享，來自IBM Developer社區，原題“使用 Java 開發兼容 IPv6 的網絡應用程序”，本次收錄時有改動。

1、引言

前幾天，有個群友跟我討論用 MobileIMSDK 寫的IM服務端想支持IPv6的問題。因為眾所周之的原因，IPv4早就不夠用，現在國內從國家層面都在大力推廣IPv6的普及，所以包括事業單位、國企在內，現在搞信息化建議，都要考慮IPv6的支持。

我忽然感覺這個問題很難回答，因為對于普通的網絡通信程序開發者來說，目前真正的IPv6的開發和測試環境并不容易得到，所以想要真正說清楚Java對于IPv6地支持情況，只能借助零碎的資料和網貼，可能并不完整和準備。

理論上，Java對IPv6的支持對于程序員來說都是透明的，幾乎不需要代碼層面的處理。但它到底是怎么支持的？支持到什么程度？對JDK版本有什么要求？對操作系統有什么要求？等等，我認為還是有必要詳細研究了解一下。

本文將用通俗易懂的文字，來講解Java對IPv6的支持現狀，包括關的技術原理、可以使用的API、以及一些可以運行的演示代碼片段等，希望能讓你更直觀的了解Java對于IPv6的支持情況。

閱讀提示：限于篇幅，本文假設你已了解IPv6技術是什么，如您對它一無所知，建議先閱讀白話式入門文章：《一文讀懂什么是IPv6》。

（本文同步發布于：http://www.52im.net/thread-3236-1-1.html）

2、推薦資料

《IPv6技術詳解：基本概念、應用現狀、技術實踐（上篇）》
《IPv6技術詳解：基本概念、應用現狀、技術實踐（下篇）》

3、技術背景

目前我們使用的是第二代互聯網 IPv4 技術，它的最大問題是網絡地址資源有限，從理論上講，可以編址 1600 萬個網絡、40 億臺主機。但采用 A、B、C 三類編址方式后，可用的網絡地址和主機地址的數目大打折扣，以至目前的 IP 地址近乎枯竭。網絡地址不足，嚴重地制約了全球互聯網的應用和發展。

▲ 本圖引用自《網絡編程懶人入門(十一)：一文讀懂什么是IPv6》

一方面是地址資源數量的限制，另一方面是隨著電子技術及網絡技術的發展，計算機網絡將進入人們的日常生活，可能身邊的每一樣東西都需要連入全球因特網。在這種網絡空間匱乏的環境下，IPv6 應運而生。它的產生不但解決了網絡地址資源數量的問題，同時也為除電腦外的設備連入互聯網在數量限制上掃清了障礙。

如果說 IPv4 實現的只是人機對話，那么 IPv6 則擴展到任意事物之間的對話，它不僅可以為人類服務，還將服務于眾多硬件設備，如家用電器、傳感器、遠程照相機、汽車等，它將是無時不在，無處不在的深入社會每個角落的真正的寬帶網，它所帶來的經濟效益也將非常巨大。

當然，IPv6 并非十全十美、一勞永逸，不可能解決所有問題。IPv6 只能在發展中不斷完善，也不可能在一夜之間發生，過渡需要時間和成本，但從長遠看，IPv6 有利于互聯網的持續和長久發展。目前，國際互聯網組織已經決定成立兩個專門工作組，制定相應的國際標準。

4、Java 對 IPv6 的支持

隨著 IPv6 越來越受到業界的重視，Java 從 1.4 版開始支持 Linux 和 Solaris 平臺上的 IPv6。1.5 版起又加入了 Windows 平臺上的支持。

相對于 C++，Java 很好得封裝了 IPv4 和 IPv6 的變化部分，遺留代碼都可以原生支持 IPv6，而不用隨底層具體實現的變化而變化。

那么 Java 是如何來支持 IPv6 的呢？

Java 網絡棧會優先檢查底層系統是否支持 IPv6，以及采用的何種 IP 棧系統。如果是雙棧系統，那它直接創建一個 IPv6 套接字（如圖 1）。

圖 1 - 雙棧結構：

對于分隔棧系統，Java 則創建 IPv4/v6 兩個套接字（如圖 2）：

1）如果是 TCP 客戶端程序：一旦其中某個套接字連接成功，另一個套接字就會被關閉，這個套接字連接使用的 IP 協議類型也就此被固定下來；
2）如果是 TCP 服務器端程序：因為無法預期客戶端使用的 IP 協議，所以 IPv4/v6 兩個套接字會被一直保留；
3）對于 UDP 應用程序：無論是客戶端還是服務器端程序，兩個套接字都會保留來完成通信。

圖 2 - 分隔棧結構：

5、如何驗證 IPv6 地址

5.1 IPv6 地址表示

從 IPv4 到 IPv6 最顯著的變化就是網絡地址的長度，IPv6 地址為 128 位長度，一般采用 32 個十六進制數，但通常寫做 8 組每組 4 個十六進制的形式。

IPv6地址組成如下圖所示：

▲ 本圖引用自《網絡編程懶人入門(十一)：一文讀懂什么是IPv6》

例如：

1）2001:0db8:85a3:08d3:1319:8a2e:0370:7344 是一個合法的 IPv6 地址。如果四個數字都是零，則可以被省略；
2）2001:0db8:85a3:0000:1319:8a2e:0370:7344 等同于 2001:0db8:85a3::1319:8a2e:0370:7344。

遵從這些規則，如果因為省略而出現了兩個以上的冒號的話，可以壓縮為一個，但這種零壓縮在地址中只能出現一次。

因此：

2001:0DB8:0000:0000:0000:0000:1428:57ab
2001:0DB8:0000:0000:0000::1428:57ab
2001:0DB8:0:0:0:0:1428:57ab
2001:0DB8:0::0:1428:57ab
2001:0DB8::1428:57ab

都是合法的地址，并且他們是等價的。但 2001::25de::cade 是非法的（因為這樣會使得搞不清楚每個壓縮中有幾個全零的分組）。同時前導的零可以省略，因此：2001:0DB8:02de::0e13 等于 2001: DB8:2de::e13。

5.2 IPv6 地址校驗

IPv4 地址可以很容易的轉化為 IPv6 格式。

舉例來說：如果 IPv4 的一個地址為 135.75.43.52（十六進制為 0x874B2B34），它可以被轉化為 0000:0000:0000:0000:0000:0000:874B:2B34 或者：:874B:2B34。同時，還可以使用混合符號（IPv4- compatible address），則地址可以為：:135.75.43.52。

在 IPv6 的環境下開發 Java 應用，或者移植已有的 IPv4 環境下開發的 Java 應用到 IPv6 環境中來，對于 IPv6 網絡地址的驗證是必須的步驟，尤其是對那些提供了 UI（用戶接口）的 Java 應用。

所幸的是：從 Java 1.5 開始，Java就增加了對 IPv6 網絡地址校驗的支持。程序員可以通過簡單地調用方法 sun.net.util.IPAddressUtil.isIPv6LiteralAddress() 來驗證一個 String 類型的輸入是否是一個合法的 IPv6 網絡地址。

為了更深入一步地了解 IPv6 的網絡地址規范，及其驗證算法，筆者參閱了一些材料，包括上文所述的方法 sun.net.util.IPAddressUtil.isIPv6LiteralAddress() 的源代碼，以及目前網絡上流傳的一些 IPv6 網絡地址的正則表達式，發現：

1）由于 IPv6 協議所允許的網絡地址格式較多，規范較寬松（例如零壓縮地址，IPv4 映射地址等），所以導致了 IPv6 網絡地址的格式變化很大；
2）Java 對于 IPv6 網絡地址的驗證是通過對輸入字符的循環匹配做到的，并沒有采取正則表達式的做法。其匹配過程中還依賴于其它的 Java 方法；
3）目前網絡上流傳的 IPv6 網絡地址驗證的正則表達式通常都只能涵蓋部分地址格式，而且表達式冗長難讀，非常不易于理解。

基于通用性考慮，以及為了使驗證方法盡量簡單易讀，筆者嘗試將 IPv6 網絡地址的格式簡單分類以后，使用多個正則表達式進行驗證。

這種做法兼顧了通用性（基于正則表達式，所以方便用各種不同的編程語言進行實現），以及易讀性（每個獨立的正則表達式相對簡短）；并且根據測試，支持目前所有的 IPv6 網絡地址格式類型，尚未發現例外。

以下是筆者用 Java 編寫的對于 IPv6 網絡地址的驗證方法。此算法可被簡單地用其它編程語言仿照重寫。

演示代碼1 - 驗證地址：

//IPv6 address validator matches these IPv6 formats
//::ffff:21:7.8.9.221 | 2001:0db8:85a3:08d3:1319:8a2e:0370:7344
//| ::8a2e:0:0370:7344 | 2001:0db8:85a3:08d3:1319:8a2e:100.22.44.55
//| 2001:0db8::8a2e:100.22.44.55 | ::100.22.44.55 | ffff::
//And such addresses are invalid
//::8a2e:0:0370:7344.4 | 2001:idb8::111:7.8.9.111 | 2001::100.a2.44.55
//| :2001::100.22.44.55
public static boolean isIPV6Format(String ip) {
    ip = ip.trim();

    //in many cases such as URLs, IPv6 addresses are wrapped by []
    if(ip.substring(0, 1).equals("[") && ip.substring(ip.length()-1).equals("]"))

        ip = ip.substring(1, ip.length()-1);

        return(1< Pattern.compile(":").split(ip).length)
        //a valid IPv6 address should contains no less than 1,
        //and no more than 7 ":” as separators
            && (Pattern.compile(":").split(ip).length <= 8)

        //the address can be compressed, but "::” can appear only once
            && (Pattern.compile("::").split(ip).length <= 2)

        //if a compressed address
            && (Pattern.compile("::").split(ip).length == 2)

            //if starts with "::” – leading zeros are compressed
            ? (((ip.substring(0, 2).equals("::"))
            ? Pattern.matches("^::([\\da-f]{1,4}(:)){0,4}(([\\da-f]{1,4}(:)[\\da-f]{1,4})
        |([\\da-f]{1,4})|((\\d{1,3}.){3}\\d{1,3}))", ip)
                : Pattern.matches("^([\\da-f]{1,4}(:|::)){1,5}
        (([\\da-f]{1,4}(:|::)[\\da-f]{1,4})|([\\da-f]{1,4})
        |((\\d{1,3}.){3}\\d{1,3}))", ip)))

        //if ends with "::" - ending zeros are compressed
                : ((ip.substring(ip.length()-2).equals("::"))
                ? Pattern.matches("^([\\da-f]{1,4}(:|::)){1,7}", ip)
                : Pattern.matches("^([\\da-f]{1,4}:){6}(([\\da-f]{1,4}
        :[\\da-f]{1,4})|((\\d{1,3}.){3}\\d{1,3}))", ip));
    }}

6、如何正規化 IPv6 地址

在網絡程序開發中，經常使用 IP 地址來標識一個主機，例如記錄終端用戶的訪問記錄等。由于 IPv6 具有有零壓縮地址等多種表示形式，因此直接使用 IPv6 地址作為標示符，可能會帶來一些問題。

為了避免這些問題，在使用 IPv6 地址之前，有必要將其正規化。

除了通過我們熟知的正則表達式，筆者在開發過程中發現使用一個簡單的 Java API 也可以達到相同的效果。

演示代碼2 - 正規化地址：

InetAddress inetAddr = InetAddress.getByName(ipAddr);
ipAddr = inetAddr.getHostAddress();
System.out.println(ipAddr);

InetAddress.getByName(String) 方法接受的參數既可以是一個主機名，也可以是一個 IP 地址字符串。

我們輸入任一信息的合法 IPv6 地址，再通過 getHostAddress() 方法取出主機 IP 時，地址字符串 ipAddr 已經被轉換為完整形式。

例如輸入 2002:97b:e7aa::97b:e7aa ，上述代碼執行過后，零壓縮部分將被還原，ipAddr 變為 2002:97b:e7aa:0:0:0:97b:e7aa 。

7、如何獲取本機 IPv6 地址

有時為了能夠注冊 listener，開發人員需要使用本機的 IPv6 地址，這一地址不能簡單得通過 InetAddress.getLocalhost() 獲得。因為這樣有可能獲得諸如 0:0:0:0:0:0:0:1 這樣的特殊地址。使用這樣的地址，其他服務器將無法把通知發送到本機上，因此必須先進行過濾，選出確實可用的地址。以下代碼實現了這一功能，思路是遍歷網絡接口的各個地址，直至找到符合要求的地址。

演示代碼3 - 獲取本機 IP 地址：

public static String getLocalIPv6Address() throws IOException {
    InetAddress inetAddress = null;
    Enumeration<NetworkInterface> networkInterfaces = NetworkInterface
        .getNetworkInterfaces();
    outer:
    while(networkInterfaces.hasMoreElements()) {
        Enumeration<InetAddress> inetAds = networkInterfaces.nextElement()
        .getInetAddresses();
        while(inetAds.hasMoreElements()) {
            inetAddress = inetAds.nextElement();
            //Check if it's ipv6 address and reserved address
            if(inetAddress instanceofInet6Address
                && !isReservedAddr(inetAddress)) {
                break outer;
            }
        }
    }

    String ipAddr = inetAddress.getHostAddress();
    // Filter network card No
    int index = ipAddr.indexOf('%');
    if(index > 0) {
        ipAddr = ipAddr.substring(0, index);
    }

    return ipAddr;
}

/**
* Check if it's "local address" or "link local address" or "loopbackaddress"
* @param ip address
* @return result
*/
private static boolean isReservedAddr(InetAddress inetAddr) {
    if(inetAddr.isAnyLocalAddress() || inetAddr.isLinkLocalAddress()
        || inetAddr.isLoopbackAddress()) {
        return true;
    }
    return false;
}

為了支持 IPv6，Java 中增加了兩個 InetAddress 的子類：Inet4Address 和 Inet6Address。

一般情況下這兩個子類并不會被使用到，但是當我們需要分別處理不同的 IP 協議時就非常有用，在這我們根據 Inet6Address 來篩選地址。

isReservedAddr() 方法過濾了本機特殊 IP 地址，包括”LocalAddress”，”LinkLocalAddress”和”LoopbackAddress”。讀者可根據自己的需要修改過濾標準。

另一個需要注意的地方是：在 windows 平臺上，取得的 IPv6 地址后面可能跟了一個百分號加數字。這里的數字是本機網絡適配器的編號。這個后綴并不是 IPv6 標準地址的一部分，可以去除。

8、IPv4/IPv6 雙環境下，網絡的選擇和測試

我們先看一下筆者所在的 IPv4/IPv6 開發測試環境及其配置方法。

筆者所處的 IPv4/IPv6 雙環境是一個典型的”6to4”雙棧網絡，其中存在著一個 IPv6 到 IPv4 的映射機制，即任意一個 IPv6 地址 2002:92a:8f7a:100:a:b:c:d 在路由時會被默認映射為 IPv4 地址 a.b.c.d，所以路由表只有一套。

在此環境內，IPv4 地址與 IPv6 地址的一一對應是人工保證的。如果一臺客戶機使用不匹配的 IPv4 和 IPv6 雙地址，或者同時使用 DHCPv4 和 DHCPv6（可能會導致 IPv4 地址和 IPv6 地址不匹配），會導致 IPv6 的路由尋址失敗。

正因為如此，為了配置雙地址環境，我們一般使用 DHCPv4 來自動獲取 IPv4 地址，然后人工配置相對應的 IPv6 地址。

Windows 系統：

1）Windows 2000 及以下：不支持 IPv6
2）Windows 2003 和 Windows XP：使用 Windows 自帶的 netsh 命令行方式添加 IPv6 地址以及 DNS，例如：C:>netsh interface ipv6 add address “Local Area Connection” 2002:92a:8f7a:100:10:13:1:2 和 C:>netsh interface ipv6 add dns “Local Area Connection” 2002:92a:8f7a:100:10::250
3）Windows 2008 和 Windows Vista：既可以使用 Windows 網絡屬性頁面進行配置，也可以使用類似 Windows 2003 和 Windows XP 的 netsh 命令行來配置

Linux 系統 （以下是 IPv6 的臨時配置方法，即不修改配置文件，計算機重啟后配置失效）：

1）Redhat Linux：最簡單的方法是使用 ifconfig 命令行添加 IPv6 地址，例如：ifconfig eth0 inet6 add 2002:92a:8f7a:100:10:14:24:106/96；
2）SUSE Linux：同上。

從實踐上講：由于 Java 的面向對象特性，以及java.net 包對于 IP 地址的良好封裝，從而使得將 Java 應用從 IPv4 環境移植到 IPv4/IPv6 雙環境，或者純 IPv6 環境變得異常簡單。通常我們需要做的僅是檢查代碼并移除明碼編寫的 IPv4 地址，用主機名來替代則可。

除此以外：對于一些特殊的需求，Java 還提供了 InetAddress 的兩個擴展類以供使用：Inet4Address 和 Inet6Address，其中封裝了對于 IPv4 和 IPv6 的特殊屬性和行為。

然而由于 Java 的多態特性，使得程序員一般只需要使用父類 InetAddress，Java 虛擬機可以根據所封裝的 IP 地址類型的不同，在運行時選擇正確的行為邏輯。所以在多數情況下，程序員并不需要精確控制所使用的類型及其行為，一切交給 Java 虛擬機即可。

具體的新增類型及其新增方法，請具體參閱Java的API文檔。

另外：在 IPv4/IPv6 雙環境中，對于使用 Java 開發的網絡應用，比較值得注意的是以下兩個 IPv6 相關的 Java 虛擬機系統屬性。

java.net.preferIPv4Stack=<true|false>
java.net.preferIPv6Addresses=<true|false>

preferIPv4Stack（默認 false）表示如果存在 IPv4 和 IPv6 雙棧，Java 程序是否優先使用 IPv4 套接字。默認值是優先使用 IPv6 套接字，因為 IPv6 套接字可以與對應的 IPv4 或 IPv6 主機進行對話；相反如果優先使用 IPv4，則只不能與 IPv6 主機進行通信。

preferIPv6Addresses（默認 false）表示在查詢本地或遠端 IP 地址時，如果存在 IPv4 和 IPv6 雙地址，Java 程序是否優先返回 IPv6 地址。Java 默認返回 IPv4 地址主要是為了向后兼容，以支持舊有的 IPv4 驗證邏輯，以及舊有的僅支持 IPv4 地址的服務。

9、寫在最后

本文對 IPv6 地址做了一些基本的介紹，著重介紹了如何使用 Java 開發兼容 IPv6 的網絡應用程序，包括如何驗證 IPv6 地址，如何正規化 IPv6 地址的表示，如何獲取本機 IPv6 的地址，以及在 IPv4/IPv6 雙地址環境下的網絡選擇和測試。

同時作者結合在日常工作中使用的 Java 代碼片段，希望呈現給讀者一個全方位的、具有較強實用性的文本介紹，也希望本文能給讀者在以后使用 Java 開發 IPv6 兼容程序的過程中帶來一些幫助。

10、參考資料

[1] IPv6 地址技術架構

[2] IPv6 協議技術文檔

[3] Networking IPv6 User Guide for JDK/JRE 5.0

附錄：相關文章

《技術往事：改變世界的TCP/IP協議（珍貴多圖、手機慎點）》
《通俗易懂-深入理解TCP協議（上）：理論基礎》
《通俗易懂-深入理解TCP協議（下）：RTT、滑動窗口、擁塞處理》
《計算機網絡通訊協議關系圖（中文珍藏版）》
《P2P技術詳解(一)：NAT詳解——詳細原理、P2P簡介》
《P2P技術詳解(二)：P2P中的NAT穿越(打洞)方案詳解(基本原理篇)》
《P2P技術詳解(三)：P2P中的NAT穿越(打洞)方案詳解(進階分析篇)》
《P2P技術詳解(四)：P2P技術之STUN、TURN、ICE詳解》
《通俗易懂：快速理解P2P技術中的NAT穿透原理》
《高性能網絡編程(一)：單臺服務器并發TCP連接數到底可以有多少》
《高性能網絡編程(二)：上一個10年，著名的C10K并發連接問題》
《高性能網絡編程(三)：下一個10年，是時候考慮C10M并發問題了》
《高性能網絡編程(四)：從C10K到C10M高性能網絡應用的理論探索》
《高性能網絡編程(五)：一文讀懂高性能網絡編程中的I/O模型》
《高性能網絡編程(六)：一文讀懂高性能網絡編程中的線程模型》
《高性能網絡編程(七)：到底什么是高并發？一文即懂！》
《網絡編程懶人入門(二)：快速理解網絡通信協議（下篇）》
《網絡編程懶人入門(三)：快速理解TCP協議一篇就夠》
《網絡編程懶人入門(四)：快速理解TCP和UDP的差異》
《網絡編程懶人入門(五)：快速理解為什么說UDP有時比TCP更有優勢》
《網絡編程懶人入門(六)：史上最通俗的集線器、交換機、路由器功能原理入門》
《網絡編程懶人入門(七)：深入淺出，全面理解HTTP協議》
《網絡編程懶人入門(八)：手把手教你寫基于TCP的Socket長連接》
《網絡編程懶人入門(九)：通俗講解，有了IP地址，為何還要用MAC地址？》
《網絡編程懶人入門(十)：一泡尿的時間，快速讀懂QUIC協議》
《網絡編程懶人入門(十一)：一文讀懂什么是IPv6》
《網絡編程懶人入門(十二)：快速讀懂Http/3協議，一篇就夠！》
《腦殘式網絡編程入門(一)：跟著動畫來學TCP三次握手和四次揮手》
《腦殘式網絡編程入門(二)：我們在讀寫Socket時，究竟在讀寫什么？》
《腦殘式網絡編程入門(三)：HTTP協議必知必會的一些知識》
《腦殘式網絡編程入門(四)：快速理解HTTP/2的服務器推送(Server Push)》
《腦殘式網絡編程入門(五)：每天都在用的Ping命令，它到底是什么？》
《腦殘式網絡編程入門(六)：什么是公網IP和內網IP？NAT轉換又是什么鬼？》
《腦殘式網絡編程入門(七)：面視必備，史上最通俗計算機網絡分層詳解》
《腦殘式網絡編程入門(八)：你真的了解127.0.0.1和0.0.0.0的區別？》
《腦殘式網絡編程入門(九)：面試必考，史上最通俗大小端字節序詳解》
《可能會搞砸你的面試：你知道一個TCP連接上能發起多少個HTTP請求嗎？》
《5G時代已經到來，TCP/IP老矣，尚能飯否？》

本文已同步發布于“即時通訊技術圈”公眾號。

▲ 本文在公眾號上的鏈接是：點此進入，原文鏈接是：http://www.52im.net/thread-3236-1-1.html

作者：Jack Jiang (點擊作者姓名進入Github)
出處：http://www.52im.net/space-uid-1.html
交流：歡迎加入即時通訊開發交流群 215891622
討論：http://www.52im.net/
Jack Jiang同時是【原創Java Swing外觀工程BeautyEye】和【輕量級移動端即時通訊框架MobileIMSDK】的作者，可前往下載交流。
本博文歡迎轉載，轉載請注明出處（也可前往我的52im.net 找到我）。

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問

Jack Jiang

導航

公告

常用鏈接

留言簿(285)

隨筆檔案

文章檔案

搜索

最新評論

閱讀排行榜

評論排行榜

60天內閱讀排行