之前有用到socket編程中的select函數(shù)實現(xiàn)異步,現(xiàn)在要寫一個raw socket 來實現(xiàn)本地流量監(jiān)控,同時記錄ICMP,TCP,UDP流量,遇到起線程的問題,所以就有了想法,都是實現(xiàn)異步,select函數(shù)和起線程有什么區(qū)別,當(dāng)前流行的服務(wù)器解決方案是什么。
答案:
- select函數(shù)(poll,epoll類似)本質(zhì)不是異步,只是實現(xiàn)非阻塞的方法。
- 當(dāng)前流行的解決方案是:event loop + thread pool,就是事件輪循加線程池的做法。
select 函數(shù)本質(zhì)不是異步
我在之前寫的文章socket編程的幾個問題中提到過select函數(shù),它可以監(jiān)控接收或發(fā)送事件的情況,若需要接收或發(fā)送,就進(jìn)行處理,如果出現(xiàn)錯誤或者沒有需要處理的事件就跳出執(zhí)行之后的事件,不必一直等待。而傳統(tǒng)的阻塞模式會一直等待事件發(fā)生才返回。
這是實現(xiàn)非阻塞的方法,但是本質(zhì)上它是一個同步的函數(shù),是同步執(zhí)行的。換句話說,它實現(xiàn)的功能本身和異步?jīng)]有關(guān)系,但是可以異步地執(zhí)行select函數(shù)。
參考1
參考2
事件輪循加線程池
首先,了解一下線程池的概念。線程池,字面理解,就是一個放了很多線程的地方,我們把它叫做線程池,我們需要了解的是為什么需要用到它。
假設(shè)一個服務(wù)器完成一項任務(wù)所需時間為:T1 創(chuàng)建線程時間, T2 在線程中執(zhí)行 任務(wù)的時間,T3 銷毀線程時間。
如果:T1 + T3 遠(yuǎn)大于 T2,則可以采用線程池,以提高服務(wù)器性能。
也就是說,采用線程池是為了免去創(chuàng)建線程和銷毀線程的時間,我們循環(huán)利用線程池的線程,而不需要每一個連接對應(yīng)一個線程,這樣會大大減少創(chuàng)建和銷毀線程的個數(shù)。舉個栗子:
假設(shè)一個服務(wù)器一天要處理50000個請求,并且每個請求需要一個單獨的線程完成。在線程池中,線程數(shù)一般是固定的,所以產(chǎn)生線程總數(shù)不會超過線程池中線程的數(shù)目,而如果服務(wù)器不利用線程池來處理這些請求則線程總數(shù)為50000。一般線程池大小是遠(yuǎn)小于50000。所以利用線程池的服務(wù)器程序不會為了創(chuàng)建50000而在處理請求時浪費時間,從而提高效率。
那么具體事件輪循加線程池的怎么做。
先用select接口(poll/epoll,kq,iocp)接受請求,這樣可以保證并發(fā),在這個環(huán)節(jié)他只管收,不處理業(yè)務(wù),把FD放到一個buffer(一個q里面),然后業(yè)務(wù)處理模型對接線程池。可以使復(fù)雜業(yè)務(wù)處理上的負(fù)擔(dān)被分擔(dān)。select+線程池,這樣兼顧了并發(fā)(犧牲了一點性能),又保證了因為邏輯代碼的簡潔性。
也就是說,我select函數(shù)負(fù)責(zé)接收判斷請求狀態(tài)(即判斷有沒有可讀或者可寫的套接字,有的話加入到數(shù)組中),而內(nèi)部的處理接收或發(fā)送信息的過程交給線程池來做。
總結(jié)
多線程,異步這些概念總是含含糊糊,真真假假地在腦海里閃現(xiàn),一會覺得理解了,暗自慶幸,一會又想不通,糾結(jié)萬分。有時候不必太過鉆牛角尖,這些概念不過人取的名字,其實并不像看上去那樣分得那么開或是靠得那么緊。可能是某一個上古程序員想實現(xiàn)一邊看電影一邊聽音樂,實現(xiàn)的這個目的呢,起個名字,叫異步吧,怎么解決呢,想了個辦法,用多線程吧,囔,起了個名字,多線程。