1. 基本 概念
IO 是主存和外部設(shè)備 ( 硬盤(pán)、終端和網(wǎng)絡(luò)等 ) 拷貝數(shù)據(jù)的過(guò)程。 IO 是操作系統(tǒng)的底層功能實(shí)現(xiàn),底層通過(guò) I/O 指令進(jìn)行完成。
所有語(yǔ)言運(yùn)行時(shí)系統(tǒng)提供執(zhí)行 I/O 較高級(jí)別的工具。 (c 的 printf scanf,java 的面向?qū)ο蠓庋b )
2. Java 標(biāo)準(zhǔn) io 回顧
Java 標(biāo)準(zhǔn) IO 類庫(kù)是 io 面向?qū)ο蟮囊环N抽象。基于本地方法的底層實(shí)現(xiàn),我們無(wú)須關(guān)注底層實(shí)現(xiàn)。 InputStream\OutputStream( 字節(jié)流 ) :一次傳送一個(gè)字節(jié)。 Reader\Writer( 字符流 ) :一次一個(gè)字符。
3. nio 簡(jiǎn)介
nio 是 java New IO 的簡(jiǎn)稱,在 jdk1.4 里提供的新 api 。 Sun 官方標(biāo)榜的特性如下:
– 為所有的原始類型提供 (Buffer) 緩存支持。
– 字符集編碼解碼解決方案。
– Channel :一個(gè)新的原始 I/O 抽象。
– 支持鎖和內(nèi)存映射文件的文件訪問(wèn)接口。
– 提供多路 (non-bloking) 非阻塞式的高伸縮性網(wǎng)絡(luò) I/O 。
本文將圍繞這幾個(gè)特性進(jìn)行學(xué)習(xí)和介紹。
4. Buffer&Chanel
Channel 和 buffer 是 NIO 是兩個(gè)最基本的數(shù)據(jù)類型抽象。
Buffer:
– 是一塊連續(xù)的內(nèi)存塊。
– 是 NIO 數(shù)據(jù)讀或?qū)懙闹修D(zhuǎn)地。
Channel:
– 數(shù)據(jù)的源頭或者數(shù)據(jù)的目的地
– 用于向 buffer 提供數(shù)據(jù)或者讀取 buffer 數(shù)據(jù) ,buffer 對(duì)象的唯一接口。
– 異步 I/O 支持
圖1:channel和buffer關(guān)系
例子 1:CopyFile.java:
Java代碼

- package sample;
-
- import java.io.FileInputStream;
- import java.io.FileOutputStream;
- import java.nio.ByteBuffer;
- import java.nio.channels.FileChannel;
-
- public class CopyFile {
- public static void main(String[] args) throws Exception {
- String infile = "C:\\copy.sql";
- String outfile = "C:\\copy.txt";
- // 獲取源文件和目標(biāo)文件的輸入輸出流
- FileInputStream fin = new FileInputStream(infile);
- FileOutputStream fout = new FileOutputStream(outfile);
- // 獲取輸入輸出通道
- FileChannel fcin = fin.getChannel();
- FileChannel fcout = fout.getChannel();
- // 創(chuàng)建緩沖區(qū)
- ByteBuffer buffer = ByteBuffer.allocate(1024);
- while (true) {
- // clear方法重設(shè)緩沖區(qū),使它可以接受讀入的數(shù)據(jù)
- buffer.clear();
- // 從輸入通道中將數(shù)據(jù)讀到緩沖區(qū)
- int r = fcin.read(buffer);
- // read方法返回讀取的字節(jié)數(shù),可能為零,如果該通道已到達(dá)流的末尾,則返回-1
- if (r == -1) {
- break;
- }
- // flip方法讓緩沖區(qū)可以將新讀入的數(shù)據(jù)寫(xiě)入另一個(gè)通道
- buffer.flip();
- // 從輸出通道中將數(shù)據(jù)寫(xiě)入緩沖區(qū)
- fcout.write(buffer);
- }
- }
- }
其中 buffer 內(nèi)部結(jié)構(gòu)如下 ( 下圖拷貝自資料 ):
圖2:buffer內(nèi)部結(jié)構(gòu)
一個(gè) buffer 主要由 position,limit,capacity 三個(gè)變量來(lái)控制讀寫(xiě)的過(guò)程。此三個(gè)變量的含義見(jiàn)如下表格:
參數(shù) | 寫(xiě)模式 | 讀模式 |
position | 當(dāng)前寫(xiě)入的單位數(shù)據(jù)數(shù)量。 | 當(dāng)前讀取的單位數(shù)據(jù)位置。 |
limit | 代表最多能寫(xiě)多少單位數(shù)據(jù)和容量是一樣的。 | 代表最多能讀多少單位數(shù)據(jù),和之前寫(xiě)入的單位數(shù)據(jù)量一致。 |
capacity | buffer 容量 | buffer 容量 |
Buffer 常見(jiàn)方法:
flip(): 寫(xiě)模式轉(zhuǎn)換成讀模式
rewind() :將 position 重置為 0 ,一般用于重復(fù)讀。
clear() :清空 buffer ,準(zhǔn)備再次被寫(xiě)入 (position 變成 0 , limit 變成 capacity) 。
compact(): 將未讀取的數(shù)據(jù)拷貝到 buffer 的頭部位。
mark() 、 reset():mark 可以標(biāo)記一個(gè)位置, reset 可以重置到該位置。
Buffer 常見(jiàn)類型: ByteBuffer 、 MappedByteBuffer 、 CharBuffer 、 DoubleBuffer 、 FloatBuffer 、 IntBuffer 、 LongBuffer 、 ShortBuffer 。
channel 常見(jiàn)類型 :FileChannel 、 DatagramChannel(UDP) 、 SocketChannel(TCP) 、 ServerSocketChannel(TCP)
在本機(jī)上面做了個(gè)簡(jiǎn)單的性能測(cè)試。我的筆記本性能一般。 ( 具體代碼可以見(jiàn)附件。見(jiàn) nio.sample.filecopy 包下面的例子 ) 以下是參考數(shù)據(jù):
– 場(chǎng)景 1 : Copy 一個(gè) 370M 的文件
– 場(chǎng)景 2: 三個(gè)線程同時(shí)拷貝,每個(gè)線程拷貝一個(gè) 370M 文件
場(chǎng)景 | FileInputStream+ FileOutputStream | FileInputStream+ BufferedInputStream+ FileOutputStream | ByteBuffer+ FileChannel | MappedByteBuffer +FileChannel |
場(chǎng)景一時(shí)間 ( 毫秒 ) | 25155 | 17500 | 19000 | 16500 |
場(chǎng)景二時(shí)間 ( 毫秒 ) | 69000 | 67031 | 74031 | 71016 |
5. nio.charset
字符編碼解碼 : 字節(jié)碼本身只是一些數(shù)字,放到正確的上下文中被正確被解析。向 ByteBuffer 中存放數(shù)據(jù)時(shí)需要考慮字符集的編碼方式,讀取展示 ByteBuffer 數(shù)據(jù)時(shí)涉及對(duì)字符集解碼。
Java.nio.charset 提供了編碼解碼一套解決方案。
以我們最常見(jiàn)的 http 請(qǐng)求為例,在請(qǐng)求的時(shí)候必須對(duì)請(qǐng)求進(jìn)行正確的編碼。在得到響應(yīng)時(shí)必須對(duì)響應(yīng)進(jìn)行正確的解碼。
以下代碼向 baidu 發(fā)一次請(qǐng)求,并獲取結(jié)果進(jìn)行顯示。例子演示到了 charset 的使用。
例子 2BaiduReader.java
Java代碼

- package nio.readpage;
-
- import java.nio.ByteBuffer;
- import java.nio.channels.SocketChannel;
- import java.nio.charset.Charset;
- import java.net.InetSocketAddress;
- import java.io.IOException;
- public class BaiduReader {
- private Charset charset = Charset.forName("GBK");// 創(chuàng)建GBK字符集
- private SocketChannel channel;
- public void readHTMLContent() {
- try {
- InetSocketAddress socketAddress = new InetSocketAddress(
- "www.baidu.com", 80);
- //step1:打開(kāi)連接
- channel = SocketChannel.open(socketAddress);
- //step2:發(fā)送請(qǐng)求,使用GBK編碼
- channel.write(charset.encode("GET " + "/ HTTP/1.1" + "\r\n\r\n"));
- //step3:讀取數(shù)據(jù)
- ByteBuffer buffer = ByteBuffer.allocate(1024);// 創(chuàng)建1024字節(jié)的緩沖
- while (channel.read(buffer) != -1) {
- buffer.flip();// flip方法在讀緩沖區(qū)字節(jié)操作之前調(diào)用。
- System.out.println(charset.decode(buffer));
- // 使用Charset.decode方法將字節(jié)轉(zhuǎn)換為字符串
- buffer.clear();// 清空緩沖
- }
- } catch (IOException e) {
- System.err.println(e.toString());
- } finally {
- if (channel != null) {
- try {
- channel.close();
- } catch (IOException e) {
- }
- }
- }
- }
- public static void main(String[] args) {
- new BaiduReader().readHTMLContent();
- }
- }
6. 非阻塞 IO
關(guān)于非阻塞 IO 將從何為阻塞、何為非阻塞、非阻塞原理和異步核心 API 幾個(gè)方面來(lái)理解。
何為阻塞?
一個(gè)常見(jiàn)的網(wǎng)絡(luò) IO 通訊流程如下 :

圖3:網(wǎng)絡(luò)通訊基本過(guò)程
從該網(wǎng)絡(luò)通訊過(guò)程來(lái)理解一下何為阻塞 :
在以上過(guò)程中若連接還沒(méi)到來(lái),那么 accept 會(huì)阻塞 , 程序運(yùn)行到這里不得不掛起, CPU 轉(zhuǎn)而執(zhí)行其他線程。
在以上過(guò)程中若數(shù)據(jù)還沒(méi)準(zhǔn)備好, read 會(huì)一樣也會(huì)阻塞。
阻塞式網(wǎng)絡(luò) IO 的特點(diǎn):多線程處理多個(gè)連接。每個(gè)線程擁有自己的棧空間并且占用一些 CPU 時(shí)間。每個(gè)線程遇到外部為準(zhǔn)備好的時(shí)候,都會(huì)阻塞掉。阻塞的結(jié)果就是會(huì)帶來(lái)大量的進(jìn)程上下文切換。且大部分進(jìn)程上下文切換可能是無(wú)意義的。比如假設(shè)一個(gè)線程監(jiān)聽(tīng)一個(gè)端口,一天只會(huì)有幾次請(qǐng)求進(jìn)來(lái),但是該 cpu 不得不為該線程不斷做上下文切換嘗試,大部分的切換以阻塞告終。
何為非阻塞?
下面有個(gè)隱喻:
一輛從 A 開(kāi)往 B 的公共汽車上,路上有很多點(diǎn)可能會(huì)有人下車。司機(jī)不知道哪些點(diǎn)會(huì)有哪些人會(huì)下車,對(duì)于需要下車的人,如何處理更好?
1. 司機(jī)過(guò)程中定時(shí)詢問(wèn)每個(gè)乘客是否到達(dá)目的地,若有人說(shuō)到了,那么司機(jī)停車,乘客下車。 ( 類似阻塞式 )
2. 每個(gè)人告訴售票員自己的目的地,然后睡覺(jué),司機(jī)只和售票員交互,到了某個(gè)點(diǎn)由售票員通知乘客下車。 ( 類似非阻塞 )
很顯然,每個(gè)人要到達(dá)某個(gè)目的地可以認(rèn)為是一個(gè)線程,司機(jī)可以認(rèn)為是 CPU 。在阻塞式里面,每個(gè)線程需要不斷的輪詢,上下文切換,以達(dá)到找到目的地的結(jié)果。而在非阻塞方式里,每個(gè)乘客 ( 線程 ) 都在睡覺(jué) ( 休眠 ) ,只在真正外部環(huán)境準(zhǔn)備好了才喚醒,這樣的喚醒肯定不會(huì)阻塞。
非阻塞的原理
把整個(gè)過(guò)程切換成小的任務(wù),通過(guò)任務(wù)間協(xié)作完成。
由一個(gè)專門(mén)的線程來(lái)處理所有的 IO 事件,并負(fù)責(zé)分發(fā)。
事件驅(qū)動(dòng)機(jī)制:事件到的時(shí)候觸發(fā),而不是同步的去監(jiān)視事件。
線程通訊:線程之間通過(guò) wait,notify 等方式通訊。保證每次上下文切換都是有意義的。減少無(wú)謂的進(jìn)程切換。
以下是異步 IO 的結(jié)構(gòu):

圖4:非阻塞基本原理
Reactor 就是上面隱喻的售票員角色。每個(gè)線程的處理流程大概都是讀取數(shù)據(jù)、解碼、計(jì)算處理、編碼、發(fā)送響應(yīng)。
異步 IO 核心 API
Selector
異步 IO 的核心類,它能檢測(cè)一個(gè)或多個(gè)通道 (channel) 上的事件,并將事件分發(fā)出去。
使用一個(gè) select 線程就能監(jiān)聽(tīng)多個(gè)通道上的事件,并基于事件驅(qū)動(dòng)觸發(fā)相應(yīng)的響應(yīng)。而不需要為每個(gè) channel 去分配一個(gè)線程。
SelectionKey
包含了事件的狀態(tài)信息和時(shí)間對(duì)應(yīng)的通道的綁定。
例子 1 單線程實(shí)現(xiàn)監(jiān)聽(tīng)兩個(gè)端口。 ( 見(jiàn) nio.asyn 包下面的例子。 )
例子 2 NIO 線程協(xié)作實(shí)現(xiàn)資源合理利用。 (wait,notify) 。 ( 見(jiàn) nio.asyn.multithread 下的例子 )