漫話：如何給女朋友解釋什麼是Linux的五種IO模型？

知識 09-05

來自：漫話編程（微信號：mhcoding）

漫小畫

擅長漫話

程小員

擅長編程

周日午後，剛剛放下手裡的電話，正在給剛剛的面試者寫評價。剛剛寫到『對Linux的基本IO模型理解不深』這句的時候，女朋友突然出現。

哈，這個面試者咋不知道IO模型呢，我都知道呢。

你怎麼知道呢，你給我說說。

上次你給我講過呀。

在Java中，主要有三種IO模型，分別是阻塞IO（BIO）、非阻塞IO（NIO）和非同步IO（AIO）。

額、你說的這個是Java中提供的IO有關的API啊。並不是操作系統層面的IO模型呢。

這有啥區別嗎？他們有啥關係嗎？

Java中提供的IO有關的API，在文件處理的時候，其實依賴操作系統層面的IO操作實現的。

比如在Linux 2.6以後，Java中NIO和AIO都是通過epoll來實現的，而在Windows上，AIO是通過IOCP來實現的。

可以把Java中的BIO、NIO和AIO理解為是Java語言對操作系統的各種IO模型的封裝。程序員在使用這些API的時候，不需要關心操作系統層面的知識，也不需要根據不同操作系統編寫不同的代碼。只需要使用Java的API就可以了。

哦。那這個我不懂，你給我講講吧。

好吧，那就給你簡單介紹一下吧。

嗯嗯，好的，講的好了的話，晚上給你做紅燒魚吃。

嗯嗯，好的。

在Linux(UNIX)操作系統中，共有五種IO模型，分別是：

阻塞IO模型

、

非阻塞IO模型

、

IO復用模型

、

信號驅動IO模型

以及

非同步IO模型

。

既然提到晚上吃魚，那就通過釣魚的例子來解釋這五種IO模型吧。

到底什麼是IO

我們常說的IO，指的是文件的輸入和輸出，但是在操作系統層面是如何定義IO的呢？到底什麼樣的過程可以叫做是一次IO呢？

拿一次磁碟文件讀取為例，我們要讀取的文件是存儲在磁碟上的，我們的目的是把它讀取到內存中。可以把這個步驟簡化成把數據從硬體（硬碟）中讀取到用戶空間中。

其實真正的文件讀取還涉及到緩存等細節，這裡就不展開講述了。關於用戶空間、內核空間以及硬體等的關係如果讀者不理解的話，可以通過釣魚的例子理解。

釣魚的時候，剛開始魚是在魚塘裡面的，我們的釣魚動作的最終結束標誌是魚從魚塘中被我們釣上來，放入魚簍中。

這裡面的魚塘就可以映射成磁碟，中間過渡的魚鉤可以映射成內核空間，最終放魚的魚簍可以映射成用戶空間。一次完整的釣魚（IO）操作，是魚（文件）從魚塘（硬碟）中轉移（拷貝）到魚簍（用戶空間）的過程。

阻塞IO模型

我們釣魚的時候，有一種方式比較愜意，比較輕鬆，那就是我們坐在魚竿面前，這個過程中我們什麼也不做，雙手一直把著魚竿，就靜靜的等著魚兒咬鉤。一旦手上感受到魚的力道，就把魚釣起來放入魚簍中。然後再釣下一條魚。

映射到Linux操作系統中，這就是一種最簡單的IO模型，即阻塞IO。阻塞 I/O 是最簡單的 I/O 模型，一般表現為進程或線程等待某個條件，如果條件不滿足，則一直等下去。條件滿足，則進行下一步操作。

應用進程通過系統調用 recvfrom 接收數據，但由於內核還未準備好數據報，應用進程就會阻塞住，直到內核準備好數據報，recvfrom 完成數據報複製工作，應用進程才能結束阻塞狀態。

這種釣魚方式相對來說比較簡單，對於釣魚的人來說，不需要什麼特製的魚竿，拿一根夠長的木棍就可以悠閑的開始釣魚了（實現簡單）。缺點就是比較耗費時間，比較適合那種對魚的需求量小的情況（並發低，時效性要求低）。

這個釣魚的人真傻，等魚咬鉤的時候可以做點別的事情呀。

嗯，你說的這種就是兩外一種IO模型了。

非阻塞IO模型

我們釣魚的時候，在等待魚兒咬鉤的過程中，我們可以做點別的事情，比如玩一把王者榮耀、看一集《延禧攻略》等等。但是，我們要時不時的去看一下魚竿，一旦發現有魚兒上鉤了，就把魚釣上來。

映射到Linux操作系統中，這就是非阻塞的IO模型。應用進程與內核交互，目的未達到之前，不再一味的等著，而是直接返回。然後通過輪詢的方式，不停的去問內核數據準備有沒有準備好。如果某一次輪詢發現數據已經準備好了，那就把數據拷貝到用戶空間中。

應用進程通過 recvfrom 調用不停的去和內核交互，直到內核準備好數據。如果沒有準備好，內核會返回error，應用進程在得到error後，過一段時間再發送recvfrom請求。在兩次發送請求的時間段，進程可以先做別的事情。

這種方式釣魚，和阻塞IO比，所使用的工具沒有什麼變化，但是釣魚的時候可以做些其他事情，增加時間的利用率。

這樣確實好了一點了。魚兒上鉤之前我可以去淘寶挑兩條裙子。

額，但是你還是要時不時的關注魚竿的動向。

這還不好解決，買一個帶提醒功能的魚竿不就行了。

嗯，你說的又是另外一種IO模型了。

信號驅動IO模型

我們釣魚的時候，為了避免自己一遍一遍的去查看魚竿，我們可以給魚竿安裝一個報警器。當有魚兒咬鉤的時候立刻報警。然後我們再收到報警後，去把魚釣起來。

映射到Linux操作系統中，這就是信號驅動IO。應用進程在讀取文件時通知內核，如果某個 socket 的某個事件發生時，請向我發一個信號。在收到信號後，信號對應的處理函數會進行後續處理。

應用進程預先向內核註冊一個信號處理函數，然後用戶進程返回，並且不阻塞，當內核數據準備就緒時會發送一個信號給進程，用戶進程便在信號處理函數中開始把數據拷貝的用戶空間中。

這種方式釣魚，和前幾種相比，所使用的工具有了一些變化，需要有一些定製（實現複雜）。但是釣魚的人就可以在魚兒咬鉤之前徹底做別的事兒去了。等著報警器響就行了。

嗯，這種方式最輕鬆啦。

是的。我問你啊，你還有什麼好的方法可以最短時間內釣更多的魚嗎？

這還能難倒我么，同一時間擺放多個魚竿同時釣唄。

好聰明，你說的又是另外一種IO模型了。

IO復用模型

我們釣魚的時候，為了保證可以最短的時間釣到最多的魚，我們同一時間擺放多個魚竿，同時釣魚。然後哪個魚竿有魚兒咬鉤了，我們就把哪個魚竿上面的魚釣起來。

映射到Linux操作系統中，這就是IO復用模型。多個進程的IO可以註冊到同一個管道上，這個管道會統一和內核進行交互。當管道中的某一個請求需要的數據準備好之後，進程再把對應的數據拷貝到用戶空間中。

IO多路轉接是多了一個select函數，多個進程的IO可以註冊到同一個select上，當用戶進程調用該select，select會監聽所有註冊好的IO，如果所有被監聽的IO需要的數據都沒有準備好時，select調用進程會阻塞。當任意一個IO所需的數據準備好之後，select調用就會返回，然後進程在通過recvfrom來進行數據拷貝。

這裡的IO復用模型，並沒有向內核註冊信號處理函數，所以，他並不是非阻塞的。

進程在發出select後，要等到select監聽的所有IO操作中至少有一個需要的數據準備好，才會有返回，並且也需要再次發送請求去進行文件的拷貝。

這種方式的釣魚，通過增加魚竿的方式，可以有效的提升效率。

奧，我太聰明了。上面這幾種我都聽懂了。

真的聽懂了么，那我考考你：上面幾種哪個是非同步的，哪個是同步的？

這難不倒我的、信號驅動的是非同步的，其他的都是同步的。

錯錯錯，上面的所有的都是同步的。

為什麼以上四種都是同步的

我們說阻塞IO模型、非阻塞IO模型、IO復用模型和信號驅動IO模型都是同步的IO模型。原因是因為，無論以上那種模型，真正的數據拷貝過程，都是同步進行的。

信號驅動難道不是非同步的么？

信號驅動，內核是在數據準備好之後通知進程，然後進程再通過recvfrom操作進行數據拷貝。我們可以認為數據準備階段是非同步的，但是，數據拷貝操作是同步的。所以，整個IO過程也不能認為是非同步的。

你呦把我繞懵了，你還是拿釣魚來說吧。

好的。

我們把釣魚過程，可以拆分為兩個步驟：1、魚咬鉤（數據準備）。2、把魚釣起來放進魚簍里（數據拷貝）。無論以上提到的哪種釣魚方式，在第二步，都是需要人主動去做的，並不是魚竿自己完成的。所以，這個釣魚過程其實還是同步進行的。

這和燒水有啥區別，你不是告訴我安裝報警器的水壺是非同步的嗎？

同樣是報警器，燒水和釣魚的是兩回事。

燒水的報警器一響，整個燒水過程就完成了。水已經是開水了。

釣魚的報警器一響，只能說明魚兒已經咬鉤了，但是還沒有真正的釣上來。

所以，使用帶有報警器的水壺燒水，燒水過程是非同步的。

而使用帶有報警器的魚竿釣魚，釣魚的過程還是同步的。

這次我明白了，那有沒有真正非同步的IO呢？

其實是有的。

非同步IO模型

我們釣魚的時候，採用一種高科技釣魚竿，即全自動釣魚竿。可以自動感應魚上鉤，自動收竿，更厲害的可以自動把魚放進魚簍里。然後，通知我們魚已經釣到了，他就繼續去釣下一條魚去了。

映射到Linux操作系統中，這就是非同步IO模型。應用進程把IO請求傳給內核後，完全由內核去操作文件拷貝。內核完成相關操作後，會發信號告訴應用進程本次IO已經完成。

用戶進程發起aio_read操作之後，給內核傳遞描述符、緩衝區指針、緩衝區大小等，告訴內核當整個操作完成時，如何通知進程，然後就立刻去做其他事情了。當內核收到aio_read後，會立刻返回，然後內核開始等待數據準備，數據準備好以後，直接把數據拷貝到用戶控制項，然後再通知進程本次IO已經完成。

這種方式的釣魚，無疑是最省事兒的。啥都不需要管，只需要交給魚竿就可以了。

嗯，這次我明白了，原來這才叫非同步的IO。

是的，以上就是Linux操作系統的5種IO模型啦。

5種IO模型對比

看來這個問題確實挺難的。這個小朋友沒回答上來也算可以理解了吧。

這個問題看似複雜，但其實是看一個人是否真正理解IO的最好的問題了。

行行行，你說的都對。

額

介紹完這些之後，我默默的刪掉了之前寫好的那句面試評價『對Linux的基本IO模型理解不深』，改成了『對IO體系理解的不夠深入，只會使用封裝好的API』。

●編號586，輸入編號直達本文

●輸入m獲取文章