我是如何把CPU使用率從70%降到25%的

最近將公司的一個C++服務的CPU使用率從70%左右降到了25%,跟大家分享一下其中的方法論。最重要的有三點:一是工具鏈,二是壓測,三是自動化。
工具鏈
Linux下查看CPU使用率的常用命令有top,htop和vmstat等。這些命令只能查詢到進程的CPU使用率,但我還是不知道哪一段程序占用了過高的CPU。
Perf is a profiler tool for Linux 2.6+ based systems that abstracts away CPU hardware differences in Linux performance measurements and presents a simple command line interface. Perf is based on the perf_events interface exported by recent versions of the Linux kernel.

簡單來說,perf是基于perf_event的性能調優工具,通過采樣kernel的指令,來統計function級別的CPU使用率。我覺得perf是可以在生產系統使用的,對性能幾乎沒有影響。


上圖就是perf的輸出,一般都是好幾MB,分析起來很不方便。Brendan Gregg大神發明了Flame Graphs,將perf的輸出可視化,大大簡化了分析過程。

Flame Graphs有幾個特點:
顏色沒有特殊含義,并不是顏色越深越重要

每個方塊都代表一個function

自頂向下就是function的call stack

最頂部的function正在消耗CPU,所有頂部function的邊長加起來是100%

長度越長代表消耗的CPU越高,應優先關注

另外C++程序的perf輸出,是匯編風格的函數名,可以用c++filt轉義成正常的函數名。再就是CMake的Build mode設置為RelWithDebInfo,Debug mode的性能太差,會影響分析。
壓測
做性能調優,離不開壓測工具,我們可以選擇用http://jmeter.apache.org/
這里提供另外一個思路:
因為線上系統有特定的請求模式,用JMeter模擬的請求模式與線上系統的相差較大,調優的結果不一定能解決線上問題。

我截取了一段時間內的線上系統日志,通過在測試系統回放線上請求,來模擬線上系統的請求模式,并且通過一些參數來控制QPS等負載。

自動化
因為在整個調優過程中,我需要反復的改code、部署和測試。將部署和測試等流程自動化,大大減輕了我的負擔,也讓我可以保持一個愉悅的心情。
高性能C++后臺的建議
盡量使用Memory Pool,頻繁的使用臨時分配的內存空間,會導致較高的Page Fault,占用大量的CPU

使用STL和Boost要謹慎,并且要理解背后的復雜度和overhead。使用率較高的vector和string等,盡量當C的字符串和數組來用

頻繁執行的代碼塊,比如for loop內部的邏輯,盡量不要用類繼承,智能指針,操作符重載等C++特性,多少會有overhead

注意代碼細節,即使if條件的順序變化,有些場景都會影響性能

最后,推薦http://www.brendangregg.com/,里面的方法論和工具鏈,讓人受益匪淺。

西七樓小密圈
因為很難在一篇文章中講明白所有的知識點,所以創建了小密圈方便大家反饋交流。
小密圈收費¥90是為了設立門檻,篩選真正誠心學習課程的朋友。

凡是認真學習并堅持到最后的朋友,我會發¥100的紅包。


長按二維碼,關注公眾號!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容