最近將公司的一個C++服務的CPU使用率從70%左右降到了25%,跟大家分享一下其中的方法論。最重要的有三點:一是工具鏈,二是壓測,三是自動化。
工具鏈
Linux下查看CPU使用率的常用命令有top,htop和vmstat等。這些命令只能查詢到進程的CPU使用率,但我還是不知道哪一段程序占用了過高的CPU。
Perf is a profiler tool for Linux 2.6+ based systems that abstracts away CPU hardware differences in Linux performance measurements and presents a simple command line interface. Perf is based on the perf_events interface exported by recent versions of the Linux kernel.
簡單來說,perf是基于perf_event的性能調優工具,通過采樣kernel的指令,來統計function級別的CPU使用率。我覺得perf是可以在生產系統使用的,對性能幾乎沒有影響。
上圖就是perf的輸出,一般都是好幾MB,分析起來很不方便。Brendan Gregg大神發明了Flame Graphs,將perf的輸出可視化,大大簡化了分析過程。
Flame Graphs有幾個特點:
顏色沒有特殊含義,并不是顏色越深越重要
每個方塊都代表一個function
自頂向下就是function的call stack
最頂部的function正在消耗CPU,所有頂部function的邊長加起來是100%
長度越長代表消耗的CPU越高,應優先關注
另外C++程序的perf輸出,是匯編風格的函數名,可以用c++filt轉義成正常的函數名。再就是CMake的Build mode設置為RelWithDebInfo,Debug mode的性能太差,會影響分析。
壓測
做性能調優,離不開壓測工具,我們可以選擇用http://jmeter.apache.org/。
這里提供另外一個思路:
因為線上系統有特定的請求模式,用JMeter模擬的請求模式與線上系統的相差較大,調優的結果不一定能解決線上問題。
我截取了一段時間內的線上系統日志,通過在測試系統回放線上請求,來模擬線上系統的請求模式,并且通過一些參數來控制QPS等負載。
自動化
因為在整個調優過程中,我需要反復的改code、部署和測試。將部署和測試等流程自動化,大大減輕了我的負擔,也讓我可以保持一個愉悅的心情。
高性能C++后臺的建議
盡量使用Memory Pool,頻繁的使用臨時分配的內存空間,會導致較高的Page Fault,占用大量的CPU
使用STL和Boost要謹慎,并且要理解背后的復雜度和overhead。使用率較高的vector和string等,盡量當C的字符串和數組來用
頻繁執行的代碼塊,比如for loop內部的邏輯,盡量不要用類繼承,智能指針,操作符重載等C++特性,多少會有overhead
注意代碼細節,即使if條件的順序變化,有些場景都會影響性能
最后,推薦http://www.brendangregg.com/,里面的方法論和工具鏈,讓人受益匪淺。
西七樓小密圈
因為很難在一篇文章中講明白所有的知識點,所以創建了小密圈方便大家反饋交流。
小密圈收費¥90是為了設立門檻,篩選真正誠心學習課程的朋友。
凡是認真學習并堅持到最后的朋友,我會發¥100的紅包。
長按二維碼,關注公眾號!