多臺處理器和一臺處理器的多個核是不一樣的。
多個單核CPU,那么每一個CPU都需要有較為獨立的電路支持,有自己的Cache,而他們之間通過板上的總線進行通信。假如在這樣的架構上,我們要跑一個多線程的程序(常見典型情況),不考慮超線程,那么每一個線程就要跑在一個獨立的CPU上,線程間的所有協作都要走總線,而共享的數據更是有可能要在好幾個Cache里同時存在。這樣的話,總線開銷相比較而言是很大的,怎么辦?那么多Cache,即使我們不心疼存儲能力的浪費,一致性怎么保證?如果真正做出來,還要在主板上占多塊地盤,給布局布線帶來更大的挑戰,怎么搞定?
如果我們選擇多核單CPU,那么我們只需要一套芯片組,一套存儲,多核之間通過芯片內部總線進行通信,共享使用內存。在這樣的架構上,如果我們跑一個多線程的程序,那么線程間通信將比上一種情形更快。如果最終實現出來,對板上空間的占用較小,布局布線的壓力也較小。
這就像為什么你要去公司上班而不是在家里上班一樣。去公司上班(多核CPU)的話,資源共享(共享緩存),溝通方便(CPU內數據傳輸速度遠大于總線速度)。
除非信息技術(類比總線)上有突破性進展,否則我們還是每天要擠公車去公司上班(多CPU方案無法取代多核)。
多核可以通過軟件封裝讓普通用戶看成一個處理器(最開始就是單核cpu,即一個處理器一個核心,這是很自然的人類設計),這樣原來在單機上跑的程序設計基本不用更改就能獲得不錯的性能,最初的目的是提升普通PC計算能力的同時不增加原有程序的復雜性。但是在研究領域這是一個很好地研究方向,未來可能前景不錯。
多個CPU則由于排名第一說的那些總線帶寬等原因,最終形成分布式系統(當然,其實多核從內部看也是分布式結構的,但從外部看就可以簡單認為是單個處理器了),從而必然面臨的數據一致性,以及一些主從關系控制,可靠性保障之類的問題,一般人搞不來這種程序,因為調試,運行,故障等等問題太多。
舉一個形象的例子。
形象的任務目標: 你需要搬很多磚,你現在有一百支手。
實際的任務目標: 你有一個很大的計算任務,你有很多cpu。
實現方式: 你可以全把100支手安在一個人身上(多核),亦可以安在100個人身上,每個人1個手(多個單核CPU)。
分析:
多核實現,(即100支手安在一個人身上):
這個人再笨,再不會用 ,干活速度也比只有1個手的人快不少。但快的有限。
即使人有一百只手,可一次搬的板磚太多了,脊椎估計頂不住,他在某些地方存在瓶頸(比如I/O),可能腦子控制不過來(內部的協調邏輯,調度策略復雜)。
但是科學家很喜歡這種東西,你有瓶頸,我就可以研究啊,可以想辦法提高啊,優化啊,什么的。
完全的分布式實現,(即100只手安在100個人身上):
人多力量大,100個人協調好了,必然效率非常高,Google,阿里巴巴,等等大公司都喜歡這種東西。價格便宜量又足(對比另一個)。
但是,協調不好,各種問題就來了。
- 可能倆人搶著搬一塊磚(數據一致性)
- 可能一個人搬著磚走了一半不走了(單點故障),最要命的是別人都沒看見他不走了!那塊磚最后搞不好就丟了!
- 可能因為任務沒分配好(任務調度),幾個人累死,幾個人傻看著
- 到了飯點和發工資的日子,人們可能會發生爭搶。(稀缺資源的分配,如I/O)
- 拜占庭問題,時鐘不同步問題等等,一大堆了。 都是多少年的老問題。
最后用一句我最喜歡的話結束:
There is no magic in computer science.
解釋一:并行是指兩個或者多個事件在同一時刻發生;而并發是指兩個或多個事件在同一時間間隔發生。
解釋二:并行是在不同實體上的多個事件,并發是在同一實體上的多個事件。
解釋三:并行是在多臺處理器上同時處理多個任務,如hadoop分布式集群。并發是在一臺處理器上“同時”處理多個任務,所以并發編程的目標是充分的利用處理器的每一個核,以達到最高的處理性能。
分布式和集中式是一對兒概念。
http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000/001374027586935cf69c53637d8458c9aec27dd546a6cd6000/
多進程單線程模型與單進程多線程模型之爭
http://www.lxweimin.com/p/c61a7746d139
多進程單線程模型典型代表:nginx
單進程多線程模型典型代表:memcached
iOS編程串行并行并發,同步異步阻塞非阻塞的區別。
進程:一個可執行的程序。
任務:一塊可執行的代碼。
線程:指的是一個獨立的代碼執行路徑,線程是代碼執行路徑的最小分支。
串行和并行:串行是一次只能執行一個任務,并行是一次能執行多個任務。
并行是CPU的多核芯同時執行多個任務,并發是CPU的單核心交替執行兩個任務。
簡單說,多核并行 + 單核并發,并行與并發說的是一臺cpu的事情。
集中式與分布式才是一個cpu與多個cpu的區別。
進程是資源分配的單位,線程是調度的單位。
一. 進程和線程的區別
下面是在網上看到的一個科普貼:
單進程單線程:一個人在一個桌子上吃菜。
單進程多線程:多個人在同一個桌子上一起吃菜。
多進程單線程:多個人每個人在自己的桌子上吃菜。
多線程的問題是多個人同時吃一道菜的時候容易發生爭搶,例如兩個人同時夾一個菜,一個人剛伸出筷子,結果伸到的時候已經被夾走菜了。。。此時就必須等一個人夾一口之后,在還給另外一個人夾菜,也就是說資源共享就會發生沖突爭搶。
對于 Windows 系統來說,【開桌子】的開銷很大(創建進程的時間開銷很大),因此 Windows 鼓勵大家在一個桌子上吃菜。因此 Windows 多線程學習重點是要大量面對資源爭搶與同步方面的問題。
對于 Linux 系統來說,【開桌子】的開銷很小,因此 Linux 鼓勵大家盡量每個人都開自己的桌子吃菜。這帶來新的問題是:坐在兩張不同的桌子上,說話不方便。因此,Linux 下的學習重點大家要學習進程間通訊的方法。