Linux vmstat命令實戰詳解

vmstat命令是最常見的Linux/Unix監控工具,可以展現給定時間間隔的服務器的狀態值,包括服務器的CPU使用率,內存使用,虛擬內存交換情況,IO讀寫情況。這個命令是我查看Linux/Unix最喜愛的命令,一個是Linux/Unix都支持,二是相比top,我可以看到整個機器的CPU,內存,IO的使用情況,而不是單單看到各個進程的CPU使用率和內存使用率(使用場景不一樣)。

一般vmstat工具的使用是通過兩個數字參數來完成的,第一個參數是采樣的時間間隔數,單位是秒,第二個參數是采樣的次數,如:

root@ubuntu:~#

vmstat21

procs-----------memory---------- ---swap-- -----io---- -system------cpu----

r? b? swpd? free? buff? cache? si? so? ? bi? boincs us sy id wa10034984723158363819540000120001000

2表示每個兩秒采集一次服務器狀態,1表示只采集一次。

實際上,在應用過程中,我們會在一段時間內一直監控,不想監控直接結束vmstat就行了,例如:

vmstat2

procs -----------memory---------- ---swap-- -----io-----system-- ----cpu----

r? b? swpd? free? buff? cache? si? so? ? bi? ? boincs us sy id wa10034998403158363819660000120001000000349958431583638196600000881580010000003499708315836381966000028616200100000034997083158363819660000108115100100010034997323158363819660000283154001000

這表示vmstat每2秒采集數據,一直采集,直到我結束程序,這里采集了5次數據我就結束了程序。

好了,命令介紹完畢,現在開始實戰講解每個參數的意思。

r表示運行隊列(就是說多少個進程真的分配到CPU),我測試的服務器目前CPU比較空閑,沒什么程序在跑,當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關系,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,服務器的狀態很危險。top的負載類似每秒的運行隊列。如果運行隊列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。

b表示阻塞的進程,這個不多說,進程阻塞,大家懂的。

swpd虛擬內存已使用的大小,如果大于0,表示你的機器物理內存不足了,如果不是程序內存泄露的原因,那么你該升級內存了或者把耗內存的任務遷移到其他機器。

free空閑的物理內存的大小,我的機器內存總共8G,剩余3415M。

buffLinux/Unix系統是用來存儲,目錄里面有什么內容,權限等的緩存,我本機大概占用300多M

cachecache直接用來記憶我們打開的文件,給文件做緩沖,我本機大概占用300多M(這里是Linux/Unix的聰明之處,把空閑的物理內存的一部分拿來做文件和目錄的緩存,是為了提高

程序執行的性能,當程序使用內存時,buffer/cached會很快地被使用。)

si每秒從磁盤讀入虛擬內存的大小,如果這個值大于0,表示物理內存不夠用或者內存泄露了,要查找耗內存進程解決掉。我的機器內存充裕,一切正常。

so每秒虛擬內存寫入磁盤的大小,如果這個值大于0,同上。

bi塊設備每秒接收的塊數量,這里的塊設備是指系統上所有的磁盤和其他塊設備,默認塊大小是1024byte,我本機上沒什么IO操作,所以一直是0,但是我曾在處理拷貝大量數據(2-3T)的機器上看過可以達到140000/s,磁盤寫入速度差不多140M每秒

bo塊設備每秒發送的塊數量,例如我們讀取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO過于頻繁,需要調整。

in每秒CPU的中斷次數,包括時間中斷

cs每秒上下文切換次數,例如我們調用系統函數,就要進行上下文切換,線程的切換,也要進程上下文切換,這個值要越小越好,太大了,要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中,我們一般做性能測試時會進行幾千并發甚至幾萬并發的測試,選擇web服務器的進程可以由進程或者線程的峰值一直下調,壓測,直到cs到一個比較小的值,這個進程和線程數就是比較合適的值了。系統調用也是,每次調用系統函數,我們的代碼就會進入內核空間,導致上下文切換,這個是很耗資源,也要盡量避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU干正經事的時間少了,CPU沒有充分利用,是不可取的。

us用戶CPU時間,我曾經在一個做加密解密很頻繁的服務器上,可以看到us接近100,r運行隊列達到80(機器在做壓力測試,性能表現不佳)。

sy系統CPU時間,如果太高,表示系統調用時間長,例如是IO操作頻繁。

id空閑CPU時間,一般來說,id

+ us + sy = 100,一般我認為id是空閑CPU使用率,us是用戶CPU使用率,sy是系統CPU使用率。

wt等待IO

CPU時間。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • linux系統性能監視命令,經過百度谷歌,加上各渠道獲得,查找到相關命令匯集,望能學有所收獲 ...
    _王子_閱讀 1,392評論 3 13
  • linux是當前在服務器領域最成功操作系統,不僅性能卓越,安全性高,更重要的是提供了一套完善的監控機制,來檢測系統...
    劉建會閱讀 1,529評論 0 2
  • 在聽“”王子“”分享的過程中剛好聽到他曾做過性能方面的測試,事后向他請教,他把他在簡書寫的Linux服務器監控命...
    許小小晴閱讀 739評論 0 0
  • free 通過讀取/proc/meminfo文件中信息,顯示系統中空閑物理內存總量,已使用的內存總量,swap空間...
    羽非衣閱讀 823評論 0 2
  • 出門在外,不知不覺已經八年了,真是彈指一揮,歲月已逝。每次回家,我都會來到淮河岸邊,沿著大堤毫無目的的漫步,聽著碼...
    亂世佳虎閱讀 457評論 0 0