網(wǎng)絡(luò)編程 socket阻塞與非阻塞,同步與異步、I/O模型

本文根據(jù)眾多互聯(lián)網(wǎng)博客內(nèi)容整理后形成,引用內(nèi)容的版權(quán)歸原始作者所有,僅限于學(xué)習(xí)研究使用,不得用于任何商業(yè)用途。

概念理解
在進(jìn)行網(wǎng)絡(luò)編程時(shí),我們常常見到同步(Sync)/異步(Async),阻塞(Block)/非阻塞(Unblock)四種調(diào)用方式:

同步/異步主要針對(duì)C端:

同步
所謂同步,就是在c端發(fā)出一個(gè)功能調(diào)用時(shí),在沒(méi)有得到結(jié)果之前,該調(diào)用就不返回。也就是必須一件一件事做,等前一件做完了才能做下一件事。

例如普通B/S模式(同步):提交請(qǐng)求->等待服務(wù)器處理->處理完畢返回 這個(gè)期間客戶端瀏覽器不能干任何事

異步
異步的概念和同步相對(duì)。當(dāng)c端一個(gè)異步過(guò)程調(diào)用發(fā)出后,調(diào)用者不能立刻得到結(jié)果。實(shí)際處理這個(gè)調(diào)用的部件在完成后,通過(guò)狀態(tài)、通知和回調(diào)來(lái)通知調(diào)用者。

例如 ajax請(qǐng)求(異步): 請(qǐng)求通過(guò)事件觸發(fā)->服務(wù)器處理(這是瀏覽器仍然可以作其他事情)->處理完畢

阻塞/非阻塞主要針對(duì)S端:
阻塞
阻塞調(diào)用是指調(diào)用結(jié)果返回之前,當(dāng)前線程會(huì)被掛起(線程進(jìn)入非可執(zhí)行狀態(tài),在這個(gè)狀態(tài)下,cpu不會(huì)給線程分配時(shí)間片,即線程暫停運(yùn)行)。函數(shù)只有在得到結(jié)果之后才會(huì)返回。

有人也許會(huì)把阻塞調(diào)用和同步調(diào)用等同起來(lái),實(shí)際上他是不同的。對(duì)于同步調(diào)用來(lái)說(shuō),很多時(shí)候當(dāng)前線程還是激活的,只是從邏輯上當(dāng)前函數(shù)沒(méi)有返回而已。 例如,我們?cè)趕ocket中調(diào)用recv函數(shù),如果緩沖區(qū)中沒(méi)有數(shù)據(jù),這個(gè)函數(shù)就會(huì)一直等待,直到有數(shù)據(jù)才返回。而此時(shí),當(dāng)前線程還會(huì)繼續(xù)處理各種各樣的消息。

快遞的例子:比如你某個(gè)時(shí)候到A樓一層(假如是內(nèi)核緩沖區(qū))取快遞,但是你不知道快遞什么時(shí)候過(guò)來(lái),你又不能干別的事,只能死等著。但你可以睡覺(進(jìn)程處于休眠狀態(tài)),因?yàn)槟阒揽爝f把貨送來(lái)時(shí)一定會(huì)給你打個(gè)電話(假定一定能叫醒你)。

非阻塞
非阻塞和阻塞的概念相對(duì)應(yīng),指在不能立刻得到結(jié)果之前,該函數(shù)不會(huì)阻塞當(dāng)前線程,而會(huì)立刻返回。

還是等快遞的例子:如果用輪詢的方法,每隔5分鐘到A樓一層(內(nèi)核緩沖區(qū))去看快遞來(lái)了沒(méi)有。如果沒(méi)來(lái),立即返回。而快遞來(lái)了,就放在A樓一層,等你去取。

對(duì)象的阻塞模式和阻塞函數(shù)調(diào)用
對(duì)象是否處于阻塞模式和函數(shù)是不是阻塞調(diào)用有很強(qiáng)的相關(guān)性,但是并不是一一對(duì)應(yīng)的。阻塞對(duì)象上可以有非阻塞的調(diào)用方式,我們可以通過(guò)一定的API去輪詢狀態(tài),在適當(dāng)?shù)臅r(shí)候調(diào)用阻塞函數(shù),就可以避免阻塞。而對(duì)于非阻塞對(duì)象,調(diào)用特殊的函數(shù)也可以進(jìn)入阻塞調(diào)用。函數(shù)select就是這樣的一個(gè)例子。

  1. 同步,就是我客戶端(c端調(diào)用者)調(diào)用一個(gè)功能,該功能沒(méi)有結(jié)束前,我(c端調(diào)用者)死等結(jié)果。
  2. 異步,就是我(c端調(diào)用者)調(diào)用一個(gè)功能,不需要知道該功能結(jié)果,該功能有結(jié)果后通知我(c端調(diào)用者)即回調(diào)通知。
    同步/異步主要針對(duì)C端, 但是跟S端不是完全沒(méi)有關(guān)系,同步/異步機(jī)制必須S端配合才能實(shí)現(xiàn).同步/異步是由c端自己控制,但是S端是否阻塞/非阻塞, C端完全不需要關(guān)心.
  3. 阻塞, 就是調(diào)用我(s端被調(diào)用者,函數(shù)),我(s端被調(diào)用者,函數(shù))沒(méi)有接收完數(shù)據(jù)或者沒(méi)有得到結(jié)果之前,我不會(huì)返回。
  4. 非阻塞, 就是調(diào)用我(s端被調(diào)用者,函數(shù)),我(s端被調(diào)用者,函數(shù))立即返回,通過(guò)select通知調(diào)用者

同步IO和異步IO的區(qū)別就在于:數(shù)據(jù)訪問(wèn)的時(shí)候進(jìn)程是否阻塞!
阻塞IO和非阻塞IO的區(qū)別就在于:應(yīng)用程序的調(diào)用是否立即返回!

同步和異步都只針對(duì)于本機(jī)SOCKET而言的。

同步和異步,阻塞和非阻塞,有些混用,其實(shí)它們完全不是一回事,而且它們修飾的對(duì)象也不相同。
阻塞和非阻塞是指當(dāng)server端的進(jìn)程訪問(wèn)的數(shù)據(jù)如果尚未就緒,進(jìn)程是否需要等待,簡(jiǎn)單說(shuō)這相當(dāng)于函數(shù)內(nèi)部的實(shí)現(xiàn)區(qū)別,也就是未就緒時(shí)是直接返回還是等待就緒;
而同步和異步是指client端訪問(wèn)數(shù)據(jù)的機(jī)制,同步一般指主動(dòng)請(qǐng)求并等待I/O操作完畢的方式,當(dāng)數(shù)據(jù)就緒后在讀寫的時(shí)候必須阻塞(區(qū)別就緒與讀寫二個(gè)階段,同步的讀寫必須阻塞),異步則指主動(dòng)請(qǐng)求數(shù)據(jù)后便可以繼續(xù)處理其它任務(wù),隨后等待I/O,操作完畢的通知,這可以使進(jìn)程在數(shù)據(jù)讀寫時(shí)也不阻塞。(等待"通知")

Node.js里面的描述:

線程在執(zhí)行中如果遇到磁盤讀寫或網(wǎng)絡(luò)通信(統(tǒng)稱為I/O 操作),通常要耗費(fèi)較長(zhǎng)的時(shí)間,這時(shí)操作系統(tǒng)會(huì)剝奪這個(gè)線程的CPU 控制權(quán),使其暫停執(zhí)行,同時(shí)將資源讓給其他的工作線程,這種線程調(diào)度方式稱為 阻塞。當(dāng)I/O 操作完畢時(shí),操作系統(tǒng)將這個(gè)線程的阻塞狀態(tài)解除,恢復(fù)其對(duì)CPU的控制權(quán),令其繼續(xù)執(zhí)行。這種I/O 模式就是通常的同步式I/O(Synchronous I/O)或阻塞式I/O (Blocking I/O)。
相應(yīng)地,異步式I/O (Asynchronous I/O)或非阻塞式I/O (Non-blocking I/O)則針對(duì)所有I/O 操作不采用阻塞的策略。當(dāng)線程遇到I/O 操作時(shí),不會(huì)以阻塞的方式等待I/O 操作的完成或數(shù)據(jù)的返回,而只是將I/O 請(qǐng)求發(fā)送給操作系統(tǒng),繼續(xù)執(zhí)行下一條語(yǔ)句。當(dāng)操作系統(tǒng)完成I/O 操作時(shí),以事件的形式通知執(zhí)行I/O 操作的線程,線程會(huì)在特定時(shí)候處理這個(gè)事件。為了處理異步I/O,線程必須有事件循環(huán),不斷地檢查有沒(méi)有未處理的事件,依次予以處理。阻塞模式下,一個(gè)線程只能處理一項(xiàng)任務(wù),要想提高吞吐量必須通過(guò)多線程。而非阻塞模式下,一個(gè)線程永遠(yuǎn)在執(zhí)行計(jì)算操作,這個(gè)線程所使用的CPU 核心利用率永遠(yuǎn)是100%,I/O 以事件的方式通知。在阻塞模式下,多線程往往能提高系統(tǒng)吞吐量,因?yàn)橐粋€(gè)線程阻塞時(shí)還有其他線程在工作,多線程可以讓CPU 資源不被阻塞中的線程浪費(fèi)。</span>而在非阻塞模式下,線程不會(huì)被I/O 阻塞,永遠(yuǎn)在利用CPU。多線程帶來(lái)的好處僅僅是在多核CPU 的情況下利用更多的核,而Node.js的單線程也能帶來(lái)同樣的好處。這就是為什么Node.js 使用了單線程、非阻塞的事件編程模式。

Linux下的五種I/O模型

1)阻塞I/O(blocking I/O)
2)非阻塞I/O (nonblocking I/O)
3)I/O復(fù)用(select 和poll) (I/O multiplexing)
4)信號(hào)驅(qū)動(dòng)I/O (signal driven I/O (SIGIO))
5)異步I/O (asynchronous I/O (the POSIX aio_functions))

前四種都是同步,只有最后一種才是異步IO。

阻塞I/O模型:
簡(jiǎn)介:進(jìn)程會(huì)一直阻塞,直到數(shù)據(jù)拷貝完成

應(yīng)用程序調(diào)用一個(gè)IO函數(shù),導(dǎo)致應(yīng)用程序阻塞,等待數(shù)據(jù)準(zhǔn)備好。 如果數(shù)據(jù)沒(méi)有準(zhǔn)備好,一直等待….數(shù)據(jù)準(zhǔn)備好了,從內(nèi)核拷貝到用戶空間,IO函數(shù)返回成功指示。

我們 第一次接觸到的網(wǎng)絡(luò)編程都是從 listen()、send()、recv()等接口開始的。使用這些接口可以很方便的構(gòu)建服務(wù)器 /客戶機(jī)的模型。

阻塞I/O模型圖:在調(diào)用recv()/recvfrom()函數(shù)時(shí),發(fā)生在內(nèi)核中等待數(shù)據(jù)和復(fù)制數(shù)據(jù)的過(guò)程。

當(dāng)調(diào)用recv()函數(shù)時(shí),系統(tǒng)首先查是否有準(zhǔn)備好的數(shù)據(jù)。如果數(shù)據(jù)沒(méi)有準(zhǔn)備好,那么系統(tǒng)就處于等待狀態(tài)。當(dāng)數(shù)據(jù)準(zhǔn)備好后,將數(shù)據(jù)從系統(tǒng)緩沖區(qū)復(fù)制到用戶空間,然后該函數(shù)返回。在套接應(yīng)用程序中,當(dāng)調(diào)用recv()函數(shù)時(shí),未必用戶空間就已經(jīng)存在數(shù)據(jù),那么此時(shí)recv()函數(shù)就會(huì)處于等待狀態(tài)。

當(dāng)使用socket()函數(shù)和WSASocket()函數(shù)創(chuàng)建套接字時(shí),默認(rèn)的套接字都是阻塞的。這意味著當(dāng)調(diào)用Windows Sockets API不能立即完成時(shí),線程處于等待狀態(tài),直到操作完成。

并不是所有Windows Sockets API以阻塞套接字為參數(shù)調(diào)用都會(huì)發(fā)生阻塞。例如,以阻塞模式的套接字為參數(shù)調(diào)用bind()、listen()函數(shù)時(shí),函數(shù)會(huì)立即返回。將可能阻塞套接字的Windows Sockets API調(diào)用分為以下四種:

1.輸入操作: recv()、recvfrom()、WSARecv()和WSARecvfrom()函數(shù)。以阻塞套接字為參數(shù)調(diào)用該函數(shù)接收數(shù)據(jù)。如果此時(shí)套接字緩沖區(qū)內(nèi)沒(méi)有數(shù)據(jù)可讀,則調(diào)用線程在數(shù)據(jù)到來(lái)前一直睡眠。
2.輸出操作: send()、sendto()、WSASend()和WSASendto()函數(shù)。以阻塞套接字為參數(shù)調(diào)用該函數(shù)發(fā)送數(shù)據(jù)。如果套接字緩沖區(qū)沒(méi)有可用空間,線程會(huì)一直睡眠,直到有空間。
3.接受連接:accept()和WSAAcept()函數(shù)。以阻塞套接字為參數(shù)調(diào)用該函數(shù),等待接受對(duì)方的連接請(qǐng)求。如果此時(shí)沒(méi)有連接請(qǐng)求,線程就會(huì)進(jìn)入睡眠狀態(tài)。
4.外出連接:connect()和WSAConnect()函數(shù)。對(duì)于TCP連接,客戶端以阻塞套接字為參數(shù),調(diào)用該函數(shù)向服務(wù)器發(fā)起連接。該函數(shù)在收到服務(wù)器的應(yīng)答前,不會(huì)返回。這意味著TCP連接總會(huì)等待至少到服務(wù)器的一次往返時(shí)間。

使用阻塞模式的套接字,開發(fā)網(wǎng)絡(luò)程序比較簡(jiǎn)單,容易實(shí)現(xiàn)。當(dāng)希望能夠立即發(fā)送和接收數(shù)據(jù),且處理的套接字?jǐn)?shù)量比較少的情況下,使用阻塞模式來(lái)開發(fā)網(wǎng)絡(luò)程序比較合適。

阻塞模式套接字的不足表現(xiàn)為,在大量建立好的套接字線程之間進(jìn)行通信時(shí)比較困難。當(dāng)使用“生產(chǎn)者-消費(fèi)者”模型開發(fā)網(wǎng)絡(luò)程序時(shí),為每個(gè)套接字都分別分配一個(gè)讀線程、一個(gè)處理數(shù)據(jù)線程和一個(gè)用于同步的事件,那么這樣無(wú)疑加大系統(tǒng)的開銷。其最大的缺點(diǎn)是當(dāng)希望同時(shí)處理大量套接字時(shí),將無(wú)從下手,其擴(kuò)展性很差.

阻塞模式給網(wǎng)絡(luò)編程帶來(lái)了一個(gè)很大的問(wèn)題,如在調(diào)用 send()的同時(shí),線程將被阻塞,在此期間,線程將無(wú)法執(zhí)行任何運(yùn)算或響應(yīng)任何的網(wǎng)絡(luò)請(qǐng)求。這給多客戶機(jī)、多業(yè)務(wù)邏輯的網(wǎng)絡(luò)編程帶來(lái)了挑戰(zhàn)。這時(shí),我們可能會(huì)選擇多線程的方式來(lái)解決這個(gè)問(wèn)題。

應(yīng)對(duì)多客戶機(jī)的網(wǎng)絡(luò)應(yīng)用,最簡(jiǎn)單的解決方式是在服務(wù)器端使用多線程(或多進(jìn)程)。多線程(或多進(jìn)程)的目的是讓每個(gè)連接都擁有獨(dú)立的線程(或進(jìn)程),這樣任何一個(gè)連接的阻塞都不會(huì)影響其他的連接。

具體使用多進(jìn)程還是多線程,并沒(méi)有一個(gè)特定的模式。傳統(tǒng)意義上,進(jìn)程的開銷要遠(yuǎn)遠(yuǎn)大于線程,所以,如果需要同時(shí)為較多的客戶機(jī)提供服務(wù),則不推薦使用多進(jìn)程;如果單個(gè)服務(wù)執(zhí)行體需要消耗較多的 CPU 資源,譬如需要進(jìn)行大規(guī)模或長(zhǎng)時(shí)間的數(shù)據(jù)運(yùn)算或文件訪問(wèn),則進(jìn)程較為安全。通常,使用 pthread_create () 創(chuàng)建新線程,fork() 創(chuàng)建新進(jìn)程。

多線程/進(jìn)程服務(wù)器同時(shí)為多個(gè)客戶機(jī)提供應(yīng)答服務(wù)。模型如下:
圖片待補(bǔ)。。。。。

主線程持續(xù)等待客戶端的連接請(qǐng)求,如果有連接,則創(chuàng)建新線程,并在新線程中提供為前例同樣的問(wèn)答服務(wù)。

上述多線程的服務(wù)器模型似乎完美的解決了為多個(gè)客戶機(jī)提供問(wèn)答服務(wù)的要求,但其實(shí)并不盡然。如果要同時(shí)響應(yīng)成百上千路的連接請(qǐng)求,則無(wú)論多線程還是多進(jìn)程都會(huì)嚴(yán)重占據(jù)系統(tǒng)資源,降低系統(tǒng)對(duì)外界響應(yīng)效率,而線程與進(jìn)程本身也更容易進(jìn)入假死狀態(tài)。

由此可能會(huì)考慮使用“線程池”或“連接池”。“線程池”旨在減少創(chuàng)建和銷毀線程的頻率,其維持一定合理數(shù)量的線程,并讓空閑的線程重新承擔(dān)新的執(zhí)行任務(wù)。“連接池”維持連接的緩存池,盡量重用已有的連接、減少創(chuàng)建和關(guān)閉連接的頻率。這兩種技術(shù)都可以很好的降低系統(tǒng)開銷,都被廣泛應(yīng)用很多大型系統(tǒng),如apache,MySQL數(shù)據(jù)庫(kù)等。

但是,“線程池”和“連接池”技術(shù)也只是在一定程度上緩解了頻繁調(diào)用 IO 接口帶來(lái)的資源占用。而且,所謂“池”始終有其上限,當(dāng)請(qǐng)求大大超過(guò)上限時(shí),“池”構(gòu)成的系統(tǒng)對(duì)外界的響應(yīng)并不比沒(méi)有池的時(shí)候效果好多少。所以使用“池”必須考慮其面臨的響應(yīng)規(guī)模,并根據(jù)響應(yīng)規(guī)模調(diào)整“池”的大小。

對(duì)應(yīng)上例中的所面臨的可能同時(shí)出現(xiàn)的上千甚至上萬(wàn)次的客戶端請(qǐng)求,“線程池”或“連接池”或許可以緩解部分壓力,但是不能解決所有問(wèn)題。

非阻塞IO模型

簡(jiǎn)介:非阻塞IO通過(guò)進(jìn)程反復(fù)調(diào)用IO函數(shù)(多次系統(tǒng)調(diào)用,并馬上返回);在數(shù)據(jù)拷貝的過(guò)程中,進(jìn)程是阻塞的;

我們把一個(gè)SOCKET接口設(shè)置為非阻塞就是告訴內(nèi)核,當(dāng)所請(qǐng)求的I/O操作無(wú)法完成時(shí),不要將進(jìn)程睡眠,而是返回一個(gè)錯(cuò)誤。這樣我們的I/O操作函數(shù)將不斷的測(cè)試數(shù)據(jù)是否已經(jīng)準(zhǔn)備好,如果沒(méi)有準(zhǔn)備好,繼續(xù)測(cè)試,直到數(shù)據(jù)準(zhǔn)備好為止。在這個(gè)不斷測(cè)試的過(guò)程中,會(huì)大量的占用CPU的時(shí)間。

把SOCKET設(shè)置為非阻塞模式,即通知系統(tǒng)內(nèi)核:在調(diào)用Windows Sockets API時(shí),不要讓線程睡眠,而應(yīng)該讓函數(shù)立即返回。在返回時(shí),該函數(shù)返回一個(gè)錯(cuò)誤代碼。圖所示,一個(gè)非阻塞模式套接字多次調(diào)用recv()函數(shù)的過(guò)程。前三次調(diào)用recv()函數(shù)時(shí),內(nèi)核數(shù)據(jù)還沒(méi)有準(zhǔn)備好。因此,該函數(shù)立即返回WSAEWOULDBLOCK錯(cuò)誤代碼。第四次調(diào)用recv()函數(shù)時(shí),數(shù)據(jù)已經(jīng)準(zhǔn)備好,被復(fù)制到應(yīng)用程序的緩沖區(qū)中,recv()函數(shù)返回成功指示,應(yīng)用程序開始處理數(shù)據(jù)。


當(dāng)使用socket()函數(shù)和WSASocket()函數(shù)創(chuàng)建套接字時(shí),默認(rèn)都是阻塞的。在創(chuàng)建套接字之后,通過(guò)調(diào)用ioctlsocket()函數(shù),將該套接字設(shè)置為非阻塞模式。Linux下的函數(shù)是:fcntl().

套接字設(shè)置為非阻塞模式后,在調(diào)用Windows Sockets API函數(shù)時(shí),調(diào)用函數(shù)會(huì)立即返回。大多數(shù)情況下,這些函數(shù)調(diào)用都會(huì)調(diào)用“失敗”,并返回WSAEWOULDBLOCK錯(cuò)誤代碼。說(shuō)明請(qǐng)求的操作在調(diào)用期間內(nèi)沒(méi)有時(shí)間完成。通常,應(yīng)用程序需要重復(fù)調(diào)用該函數(shù),直到獲得成功返回代碼。

需要說(shuō)明的是并非所有的Windows Sockets API在非阻塞模式下調(diào)用,都會(huì)返回WSAEWOULDBLOCK錯(cuò)誤。例如,以非阻塞模式的套接字為參數(shù)調(diào)用bind()函數(shù)時(shí),就不會(huì)返回該錯(cuò)誤代碼。當(dāng)然,在調(diào)用WSAStartup()函數(shù)時(shí)更不會(huì)返回該錯(cuò)誤代碼,因?yàn)樵摵瘮?shù)是應(yīng)用程序第一調(diào)用的函數(shù),當(dāng)然不會(huì)返回這樣的錯(cuò)誤代碼。

要將套接字設(shè)置為非阻塞模式,除了使用ioctlsocket()函數(shù)之外,還可以使用WSAAsyncselect()和WSAEventselect()函數(shù)。當(dāng)調(diào)用該函數(shù)時(shí),套接字會(huì)自動(dòng)地設(shè)置為非阻塞方式。

由于使用非阻塞套接字在調(diào)用函數(shù)時(shí),會(huì)經(jīng)常返回WSAEWOULDBLOCK錯(cuò)誤。所以在任何時(shí)候,都應(yīng)仔細(xì)檢查返回代碼并作好對(duì)“失敗”的準(zhǔn)備。應(yīng)用程序連續(xù)不斷地調(diào)用這個(gè)函數(shù),直到它返回成功指示為止。上面的程序清單中,在While循環(huán)體內(nèi)不斷地調(diào)用recv()函數(shù),以讀入1024個(gè)字節(jié)的數(shù)據(jù)。這種做法很浪費(fèi)系統(tǒng)資源。

要完成這樣的操作,有人使用MSG_PEEK標(biāo)志調(diào)用recv()函數(shù)查看緩沖區(qū)中是否有數(shù)據(jù)可讀。同樣,這種方法也不好。因?yàn)樵撟龇▽?duì)系統(tǒng)造成的開銷是很大的,并且應(yīng)用程序至少要調(diào)用recv()函數(shù)兩次,才能實(shí)際地讀入數(shù)據(jù)。較好的做法是,使用套接字的“I/O模型”來(lái)判斷非阻塞套接字是否可讀可寫。

非阻塞模式套接字與阻塞模式套接字相比,不容易使用。使用非阻塞模式套接字,需要編寫更多的代碼,以便在每個(gè)Windows Sockets API函數(shù)調(diào)用中,對(duì)收到的WSAEWOULDBLOCK錯(cuò)誤進(jìn)行處理。因此,非阻塞套接字便顯得有些難于使用。

但是,非阻塞套接字在控制建立的多個(gè)連接,在數(shù)據(jù)的收發(fā)量不均,時(shí)間不定時(shí),明顯具有優(yōu)勢(shì)。這種套接字在使用上存在一定難度,但只要排除了這些困難,它在功能上還是非常強(qiáng)大的。通常情況下,可考慮使用套接字的“I/O模型”,它有助于應(yīng)用程序通過(guò)異步方式,同時(shí)對(duì)一個(gè)或多個(gè)套接字的通信加以管理。

IO復(fù)用模型:

簡(jiǎn)介:主要是select和epoll;對(duì)一個(gè)IO端口,兩次調(diào)用,兩次返回,比阻塞IO并沒(méi)有什么優(yōu)越性;關(guān)鍵是能實(shí)現(xiàn)同時(shí)對(duì)多個(gè)IO端口進(jìn)行監(jiān)聽;

I/O復(fù)用模型會(huì)用到select、poll、epoll函數(shù),這幾個(gè)函數(shù)也會(huì)使進(jìn)程阻塞,但是和阻塞I/O所不同的的,這兩個(gè)函數(shù)可以同時(shí)阻塞多個(gè)I/O操作。而且可以同時(shí)對(duì)多個(gè)讀操作,多個(gè)寫操作的I/O函數(shù)進(jìn)行檢測(cè),直到有數(shù)據(jù)可讀或可寫時(shí),才真正調(diào)用I/O操作函數(shù)。


信號(hào)驅(qū)動(dòng)IO

簡(jiǎn)介:兩次調(diào)用,兩次返回;

首先我們?cè)试S套接口進(jìn)行信號(hào)驅(qū)動(dòng)I/O,并安裝一個(gè)信號(hào)處理函數(shù),進(jìn)程繼續(xù)運(yùn)行并不阻塞。當(dāng)數(shù)據(jù)準(zhǔn)備好時(shí),進(jìn)程會(huì)收到一個(gè)SIGIO信號(hào),可以在信號(hào)處理函數(shù)中調(diào)用I/O操作函數(shù)處理數(shù)據(jù)。


異步IO模型

簡(jiǎn)介:數(shù)據(jù)拷貝的時(shí)候進(jìn)程無(wú)需阻塞。

當(dāng)一個(gè)異步過(guò)程調(diào)用發(fā)出后,調(diào)用者不能立刻得到結(jié)果。實(shí)際處理這個(gè)調(diào)用的部件在完成后,通過(guò)狀態(tài)、通知和回調(diào)來(lái)通知調(diào)用者的輸入輸出操作

圖片待補(bǔ)...............................

同步IO引起進(jìn)程阻塞,直至IO操作完成。
異步IO不會(huì)引起進(jìn)程阻塞。
IO復(fù)用是先通過(guò)select調(diào)用阻塞。

5個(gè)I/O模型的比較:

  1. select、poll、epoll簡(jiǎn)介

select原型說(shuō)明

epoll模型

epoll跟select都能提供多路I/O復(fù)用的解決方案。在現(xiàn)在的Linux內(nèi)核里有都能夠支持,其中epoll是Linux所特有,而select則應(yīng)該是POSIX所規(guī)定,一般操作系統(tǒng)均有實(shí)現(xiàn)

select:

select本質(zhì)上是通過(guò)設(shè)置或者檢查存放fd標(biāo)志位的數(shù)據(jù)結(jié)構(gòu)來(lái)進(jìn)行下一步處理。這樣所帶來(lái)的缺點(diǎn)是:

1、 單個(gè)進(jìn)程可監(jiān)視的fd數(shù)量被限制,即能監(jiān)聽端口的大小有限。
一般來(lái)說(shuō)這個(gè)數(shù)目和系統(tǒng)內(nèi)存關(guān)系很大,具體數(shù)目可以cat /proc/sys/fs/file-max察看。32位機(jī)默認(rèn)是1024個(gè)。64位機(jī)默認(rèn)是2048.
2、 對(duì)socket進(jìn)行掃描時(shí)是線性掃描,即采用輪詢的方法,效率較低:
當(dāng)套接字比較多的時(shí)候,每次select()都要通過(guò)遍歷FD_SETSIZE個(gè)Socket來(lái)完成調(diào)度,不管哪個(gè)Socket是活躍的,都遍歷一遍。這會(huì)浪費(fèi)很多CPU時(shí)間。如果能給套接字注冊(cè)某個(gè)回調(diào)函數(shù),當(dāng)他們活躍時(shí),自動(dòng)完成相關(guān)操作,那就避免了輪詢,這正是epoll與kqueue做的。
3、需要維護(hù)一個(gè)用來(lái)存放大量fd的數(shù)據(jù)結(jié)構(gòu),這樣會(huì)使得用戶空間和內(nèi)核空間在傳遞該結(jié)構(gòu)時(shí)復(fù)制開銷大

poll:
poll本質(zhì)上和select沒(méi)有區(qū)別,它將用戶傳入的數(shù)組拷貝到內(nèi)核空間,然后查詢每個(gè)fd對(duì)應(yīng)的設(shè)備狀態(tài),如果設(shè)備就緒則在設(shè)備等待隊(duì)列中加入一項(xiàng)并繼續(xù)遍歷,如果遍歷完所有fd后沒(méi)有發(fā)現(xiàn)就緒設(shè)備,則掛起當(dāng)前進(jìn)程,直到設(shè)備就緒或者主動(dòng)超時(shí),被喚醒后它又要再次遍歷fd。這個(gè)過(guò)程經(jīng)歷了多次無(wú)謂的遍歷。

它沒(méi)有最大連接數(shù)的限制,原因是它是基于鏈表來(lái)存儲(chǔ)的,但是同樣有一個(gè)缺點(diǎn):

1、大量的fd的數(shù)組被整體復(fù)制于用戶態(tài)和內(nèi)核地址空間之間,而不管這樣的復(fù)制是不是有意義。
2、poll還有一個(gè)特點(diǎn)是“水平觸發(fā)”,如果報(bào)告了fd后,沒(méi)有被處理,那么下次poll時(shí)會(huì)再次報(bào)告該fd。

epoll:

epoll支持水平觸發(fā)和邊緣觸發(fā),最大的特點(diǎn)在于邊緣觸發(fā),它只告訴進(jìn)程哪些fd剛剛變?yōu)榫托钁B(tài),并且只會(huì)通知一次。還有一個(gè)特點(diǎn)是,epoll使用“事件”的就緒通知方式,通過(guò)epoll_ctl注冊(cè)fd,一旦該fd就緒,內(nèi)核就會(huì)采用類似callback的回調(diào)機(jī)制來(lái)激活該fd,epoll_wait便可以收到通知

epoll的優(yōu)點(diǎn):

1、沒(méi)有最大并發(fā)連接的限制,能打開的FD的上限遠(yuǎn)大于1024(1G的內(nèi)存上能監(jiān)聽約10萬(wàn)個(gè)端口);
2、效率提升,不是輪詢的方式,不會(huì)隨著FD數(shù)目的增加效率下降。只有活躍可用的FD才會(huì)調(diào)用callback函數(shù); 即Epoll最大的優(yōu)點(diǎn)就在于它只管你“活躍”的連接,而跟連接總數(shù)無(wú)關(guān),因此在實(shí)際的網(wǎng)絡(luò)環(huán)境中,Epoll的效率就會(huì)遠(yuǎn)遠(yuǎn)高于select和poll。
3、 內(nèi)存拷貝,利用mmap()文件映射內(nèi)存加速與內(nèi)核空間的消息傳遞;即epoll使用mmap減少?gòu)?fù)制開銷。

select、poll、epoll 區(qū)別總結(jié):

1、支持一個(gè)進(jìn)程所能打開的最大連接數(shù)

項(xiàng)目 說(shuō)明
select 單個(gè)進(jìn)程所能打開的最大連接數(shù)有FD_SETSIZE宏定義,其大小是32個(gè)整數(shù)的大小(在32位的機(jī)器上,大小就是3232,同理64位機(jī)器上FD_SETSIZE為3264),當(dāng)然我們可以對(duì)進(jìn)行修改,然后重新編譯內(nèi)核,但是性能可能會(huì)受到影響,這需要進(jìn)一步的測(cè)試。
poll poll本質(zhì)上和select沒(méi)有區(qū)別,但是它沒(méi)有最大連接數(shù)的限制,原因是它是基于鏈表來(lái)存儲(chǔ)的
epoll 雖然連接數(shù)有上限,但是很大,1G內(nèi)存的機(jī)器上可以打開10萬(wàn)左右的連接,2G內(nèi)存的機(jī)器可以打開20萬(wàn)左右的連接

2、FD劇增后帶來(lái)的IO效率問(wèn)題

項(xiàng)目 說(shuō)明
select 因?yàn)槊看握{(diào)用時(shí)都會(huì)對(duì)連接進(jìn)行線性遍歷,所以隨著FD的增加會(huì)造成遍歷速度慢的“線性下降性能問(wèn)題”。
poll 同上
epoll 因?yàn)閑poll內(nèi)核中實(shí)現(xiàn)是根據(jù)每個(gè)fd上的callback函數(shù)來(lái)實(shí)現(xiàn)的,只有活躍的socket才會(huì)主動(dòng)調(diào)用callback,所以在活躍socket較少的情況下,使用epoll沒(méi)有前面兩者的線性下降的性能問(wèn)題,但是所有socket都很活躍的情況下,可能會(huì)有性能問(wèn)題。

3、 消息傳遞方式

項(xiàng)目 說(shuō)明
select 內(nèi)核需要將消息傳遞到用戶空間,都需要內(nèi)核拷貝動(dòng)作
poll 同上
epoll epoll通過(guò)內(nèi)核和用戶空間共享一塊內(nèi)存來(lái)實(shí)現(xiàn)的。

總結(jié):

綜上,在選擇select,poll,epoll時(shí)要根據(jù)具體的使用場(chǎng)合以及這三種方式的自身特點(diǎn)。

1、表面上看epoll的性能最好,但是在連接數(shù)少并且連接都十分活躍的情況下,select和poll的性能可能比epoll好,畢竟epoll的通知機(jī)制需要很多函數(shù)回調(diào)。
2、select低效是因?yàn)槊看嗡夹枰喸儭5托б彩窍鄬?duì)的,視情況而定,也可通過(guò)良好的設(shè)計(jì)改善

同步/異步與阻塞/非阻塞經(jīng)常看到是成對(duì)出現(xiàn):
同步阻塞,異步非阻塞,同步非阻塞

參考資料
socket阻塞與非阻塞,同步與異步、I/O模型 - huangguisu](http://blog.csdn.net/hguisu/article/details/7453390)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容