最近了解到一個東西,SRE。從DevOps角度我認為值得一看,章節不多,如果時間充足,計劃在7月開始5天看完。
中文版本下載地址 http://www.java1234.com/a/javabook/javabase/2017/0625/8352.html
SER介紹
SRE全稱:Site Reliability Engineering,翻譯過來就是:站點可靠性工程師。SRE的職責確保站定的可用,為了達到這個目的,他需要對站點涉及的系統、組件熟悉,需要關注生產運行時的狀態,為此,他需要有很多工具和系統支撐其完成上述工作,比如自動化發布系統,監控系統,日志系統,服務器資源分配和編排等,這些工具需要他們自己完成開發和維護。
SRE是一個綜合素質很高的全能手,需要懂服務器基礎架構、操作系統、網絡、中間件容器、常用編程語言、全局的架構意識、非常強的問題分析能力、極高的抗壓能力(以便沉著高效地排障),他們還需要懂性能調優理論...
SRE的工作是Develop+Operate的結合,SRE是DevOps的實踐者,他們的工作內容和職責和傳統運維工程師差不多:發布、部署、監控、排障,目標一致。但是SRE的手段更加自動化,更高效,這種高效來源于自動化工具、監控工具的支撐,更因為其作為這些工具的開發者,不斷優化和調整,使整個工具箱使起來更加得心應手,這也是DevOps的魅力所在。