一、概述:
進程就是一個程序運行的時候被CPU抽象出來的,一個程序運行后被抽象為一個進程,但是線程是從一個進程里面分割出來的,由于CPU處理進程的時候是采用時間片輪轉的方式,所以要把一個大個進程給分割成多個線程,例如:網際快車中文件分成100部分 10個線程 文件就被分成了10份來同時下載 1-10 占一個線程 11-20占一個線程,依次類推,線程越多,文件就被分的越多,同時下載 當然速度也就越快。
進程:程序的一次執行,是具有一定獨立功能的程序關于某個數據集合上的一次運行活動,進程是系統進行資源分配和調度的一個獨立單位。進程是程序在計算機上的一次執行活動。當你運行一個程序,你就啟動了一個進程。顯然,程序只是一組指令的有序集合,它本身沒有任何運行的含義,只是一個靜態實體。而進程則不同,它是程序在某個數據集上的執行,是一個動態實體。它因創建而產生,因調度而運行,因等待資源或事件而被處于等待狀態,因完成任務而被撤消,反映了一個程序在一定的數據集上運行的全部動態過程。進程是操作系統分配資源的單位。在Windows下,進程又被細化為線程,也就是一個進程下有多個能獨立運行的更小的單位。線程(Thread)是進程的一個實體,是CPU調度和分派的基本單位。線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。
線程: CPU的基本調度單位,是一個實體,是CPU調度和分派的基本單位,它是比進程更小的能獨立運行的基本單位。線程自己基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程序計數器,一組寄存器和棧),但是它可與同進程中的其它線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。
在串行程序基礎上引入了線程和進程是為了提高程序的并發度,從而提高程序運行效率和相應時間。
二、探究
- 1、在單核計算機里,有一個資源是無法被多個程序并行使用的:cpu。
沒有操作系統的情況下,一個程序一直獨占著全都cpu。
如果要有兩個任務來共享同一個CPU,程序員就需要仔細地為程序安排好運行計劃--某時刻cpu和由程序A來獨享,下一時刻cpu由程序B來獨享
而這種安排計劃后來成為OS的核心組件,被單獨名命為“scheduler”,即“調度器”,它關心的只是怎樣把單個cpu的運行拆分成一段一段的“運行片”,輪流分給不同的程序去使用,而在宏觀上,因為分配切換的速度極快,就制造出多程序并行在一個cpu上的假象。 - 2、在單核計算機里,有一個資源可以被多個程序共用,然而會引出麻煩:內存。
在一個只有調度器,沒有內存管理組件的操作系統上,程序員需要手工為每個程序安排運行的空間 -- 程序A使用物理地址0x00-0xff,程序B使用物理地址0x100-0x1ff,等等。
然而這樣做有個很大的問題:每個程序都要協調商量好怎樣使用同一個內存上的不同空間,軟件系統和硬件系統千差萬別,使這種定制的方案沒有可行性。
為了解決這個麻煩,計算機系統引入了“虛擬地址”的概念,從三方面入手來做: - 2.1、硬件上,CPU增加了一個專門的模塊叫MMU,負責轉換虛擬地址和物理地址。
- 2.2、操作系統上,操作系統增加了另一個核心組件:memory management,即內存管理模塊,它管理物理內存、虛擬內存相關的一系列事務。
- 2.3、應用程序上,發明了一個叫做【進程】的模型,(注意)每個進程都用【完全一樣的】虛擬地址空間,然而經由操作系統和硬件MMU協作,映射到不同的物理地址空間上。不同的【進程】,都有各自獨立的物理內存空間,不用一些特殊手段,是無法訪問別的進程的物理內存的。
- 3、現在,不同的應用程序,可以不關心底層的物理內存分配,也不關心CPU的協調共享了。然而還有一個問題存在:有一些程序,想要共享CPU,【并且還要共享同樣的物理內存】,這時候,一個叫【線程】的模型就出現了,它們被包裹在進程里面,在調度器的管理下共享CPu,擁有同樣的虛擬地址空間,同時也共享同一個物理地址空間,然而,它們無法越過包裹自己的進程,去訪問別一個進程的物理地址空間。
- 4、進程之間怎樣共享同一個物理地址空間呢?不同的系統方法各異,符合posix規范的操作系統都提供了一個接口,叫mmap,可以把一個物理地址空間映射到不同的進程中,由不同的進程來共享。
- 5、PS:在有的操作系統里,進程不是調度單位(即不能被調度器使用),線程是最基本的調度單位,調度器只調度線程,不調度進程,比如VxWorks。
三、線程和進程的區別
線程和進程的主要差別在于它們是不同的操作系統資源管理方式。進程擁有獨立的地址空間,一個進程崩潰后,在保護模式下不會對其他進程產生影響,而線程只是一個進程中的不同執行路徑。線程擁有自己的堆棧和局部變量,但線程之間沒有單獨的地址空間,一個線程死掉就等于整個進程死掉,所以多進程的程序要比多線程的程序健壯,但在進程切換時,耗費資源較大,效率要差一些。但在進程切換時,耗費資源比較大,效率要差一些。但對于一些要求同時進行并且又要共享某些變量的并發操作,只能用線程,不能用進程。
- 簡而言之,一個程序至少有一個進程,一個進程至少有一個線程。
- 線程的劃分尺度小于進程,使得多線程程序的并發性高。
- 另外,進程在執行過程中擁有獨立的內存單元,而多個線程共享內存,從而極大地提高了程序的運行效率。
- 線程在執行過程中與進程還是有區別的。每個獨立的線程有一個程序運行的入口、順序執行序列和程序的出口。但是線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。
- 從邏輯角度來看,多線程的意義在于一個應用程序中,有多個執行部分可以同時執行。但操作系統并沒有將多個線程看做獨立的應用,來實現進程的調度和管理以及資源分配。
四、線程和進程的關系
線程是屬于進程的,線程運行在進程空間內,同一進程所產生的線程共享同一內存空間,當進程退出時該進程所產生的線程都會被強制退出并清除。線程可與屬于同一進程的其它線程共享進程所擁有的全部資源,但是其本身基本上不擁有系統資源,只擁有一點在運行中必不可少的信息(如程序計數器、一組寄存器和棧)。
在同一個時間里,同一個計算機系統中如果允許兩個或兩個以上的進程處于運行狀態,這便是多任務。現代的操作系統幾乎都是多任務操作系統,能夠同時管理多個進程的運行。 多任務帶來的好處是明顯的,比如你可以邊聽mp3邊上網,與此同時甚至可以將下載的文檔打印出來,而這些任務之間絲毫不會相互干擾。那么這里就涉及到并行的問題,俗話說,一心不能二用,這對計算機也一樣,原則上一個CPU只能分配給一個進程,以便運行這個進程。我們通常使用的計算機中只有一個CPU,也就是說只有一顆心,要讓它一心多用,同時運行多個進程,就必須使用并發技術。實現并發技術相當復雜,最容易理解的是“時間片輪轉進程調度算法”,它的思想簡單介紹如下:在操作系統的管理下,所有正在運行的進程輪流使用CPU,每個進程允許占用CPU的時間非常短(比如10毫秒),這樣用戶根本感覺不出來CPU是在輪流為多個進程服務,就好象所有的進程都在不間斷地運行一樣。但實際上在任何一個時間內有且僅有一個進程占有CPU。
如果一臺計算機有多個CPU,情況就不同了,如果進程數小于CPU數,則不同的進程可以分配給不同的CPU來運行,這樣,多個進程就是真正同時運行的,這便是并行。但如果進程數大于CPU數,則仍然需要使用并發技術。
在Windows中,進行CPU分配是以線程為單位的,一個進程可能由多個線程組成,這時情況更加復雜,但簡單地說,有如下關系:
總線程數<= CPU數量:并行運行
總線程數> CPU數量:并發運行
并行運行的效率顯然高于并發運行,所以在多CPU的計算機中,多任務的效率比較高。但是,如果在多CPU計算機中只運行一個進程(線程),就不能發揮多CPU的優勢。
多任務操作系統(如Windows)的基本原理是:操作系統將CPU的時間片分配給多個線程,每個線程在操作系統指定的時間片內完成(注意,這里的多個線程是分屬于不同進程的).操作系統不斷的從一個線程的執行切換到另一個線程的執行,如此往復,宏觀上看來,就好像是多個線程在一起執行.由于這多個線程分屬于不同的進程,因此在我們看來,就好像是多個進程在同時執行,這樣就實現了多任務.
四、優缺點
線程和進程在使用上各有優缺點:線程執行開銷小,但不利于資源的管理和保護;而進程正相反。同時,線程適合于在SMP機器上運行,而進程則可以跨機器遷移。