初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

運(yùn)維,哎,多么沉重的話題,初創(chuàng)公司的運(yùn)維,哎,還能愉快的聊天嗎?

初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

初創(chuàng)公司的運(yùn)維,如今其實(shí)兼技術(shù)支持、系統(tǒng)管理員(SA)、網(wǎng)管、網(wǎng)絡(luò)工程師、研發(fā)工程師、架構(gòu)師,干著這些看似不相干甚至矛盾的工作。

他們的具體工作?

  • 在辦公室中安裝系統(tǒng)、幫同事排除機(jī)器故障
  • 在機(jī)房插網(wǎng)線、搬機(jī)器、拆服務(wù)器箱子
  • 天天盯著N個監(jiān)控屏幕、8小時一動不動盯著流量圖
  • 在 BOSS、開發(fā)工程師、網(wǎng)絡(luò)/系統(tǒng)工程師、DBA 中間跑來跑去進(jìn)行溝通
  • 在夜半三更收到服務(wù)器監(jiān)控系統(tǒng)的警報,起床趕到機(jī)房,節(jié)假日陪女朋友收到報警也得趕到機(jī)房(當(dāng)然更多的是沒女朋友)
初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

。。。。。。初創(chuàng)公司有那種整天斗地主,麻將下棋的嗎?(還缺人嗎,會打麻將的那種)

上面這些是有一定規(guī)模的公司運(yùn)維的工作,當(dāng)然初創(chuàng)公司同樣的工作也是要運(yùn)維來做的,而且不乏一人當(dāng)多人用,即使是這樣,當(dāng)出現(xiàn)下面這些問題或需求時,怎么淡定呢?

  • 系統(tǒng)升級,如升級成 centos7 換成了 systemd,不少運(yùn)維腳本都得重寫
  • 業(yè)務(wù)上加了中間件,需要迅速監(jiān)控上
  • 研發(fā),運(yùn)營,QA,產(chǎn)品經(jīng)理都找你要業(yè)務(wù)數(shù)據(jù),用戶數(shù)據(jù),測試數(shù)據(jù)等
  • 監(jiān)控的數(shù)據(jù)要高度可視化,BOSS 一眼也能看懂
  • 業(yè)務(wù)層面的數(shù)據(jù)也需要一同監(jiān)控,運(yùn)營需要的用戶信息也想可視化。。。。
初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

于是找個大的 Zabbix/Nagios 框架,不停的寫腳本,進(jìn)行后期維護(hù),圖表不好看,那再接上 Graphite,這些如果熟悉還好,不熟悉的話還得先花一個月(?)去學(xué)習(xí),而且規(guī)模大了一個人也不一定搞定的了,,,,但作為一個初創(chuàng)企業(yè)/團(tuán)隊,需要這么麻煩嗎,真的需要弄這么大一個輪子嗎,真的需要配備專門的人力去做這么這些事嗎,畢竟公司一共就這幾個人。。。。。

解放人力或者說把人用在更重要的地方(不是說運(yùn)維不重要)才是現(xiàn)在公司應(yīng)該采取的策略,現(xiàn)在市場上有那么多監(jiān)控軟件,找到自己適合的就要用啊啊啊啊啊,把一般運(yùn)維的工作分散,服務(wù)器托管,用第三方工具,例如:

  • IDC 機(jī)房改成云服務(wù)器,安全也有保障,還提供免費(fèi)的流量等監(jiān)控
  • 對海量日志信息進(jìn)行收集存儲,并提供實(shí)時搜索功能,輔助快速定位故障
  • 通過第三方 APM 產(chǎn)品進(jìn)行性能分析,故障診斷,緩慢代碼定位等自動化運(yùn)維任務(wù)
  • 收集服務(wù)數(shù)據(jù),只要有線上服務(wù)在運(yùn)行,服務(wù)數(shù)據(jù)流經(jīng)過的所有節(jié)點(diǎn)產(chǎn)生的數(shù)據(jù),都要采集、存儲和分析起來,供不同的運(yùn)維場景使用
  • 業(yè)務(wù)數(shù)據(jù),運(yùn)營數(shù)據(jù)通過直接 SDK/API 倒入實(shí)時顯示圖表的工具上,使得所有數(shù)據(jù)可視化
  • 設(shè)置監(jiān)控告警,實(shí)現(xiàn)應(yīng)用軟件、中間件、數(shù)據(jù)庫、主機(jī)、網(wǎng)絡(luò)、存儲、云資源的全方位監(jiān)控告警
  • 所有數(shù)據(jù)統(tǒng)一平臺,誰想看什么數(shù)據(jù)都有

運(yùn)維的本質(zhì)——可視化,當(dāng)你把應(yīng)用所用的所有服務(wù)器數(shù)據(jù),業(yè)務(wù)層數(shù)據(jù),日志等都監(jiān)控起來,都有相應(yīng)的可視化的數(shù)據(jù),出現(xiàn)問題都有據(jù)可查,或者根據(jù)已有數(shù)據(jù)做趨勢預(yù)測,設(shè)置報警,出現(xiàn)問題時第一時間知道(網(wǎng)站反應(yīng)慢了第一個發(fā)現(xiàn)的是運(yùn)維而不是用戶),公司不管哪個部門需要的數(shù)據(jù)都可以放在一起看,簡直完美!

初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

硬廣來襲,非戰(zhàn)斗人員迅速撤離~~~

作為次時代系統(tǒng)監(jiān)控工具,數(shù)據(jù)處理平臺 Cloud Insight 完全能夠解決上述問題,目前已經(jīng)做到:

  • 一鍵部署,40s完成 Linux/Windows/Docker 系統(tǒng)服務(wù)器監(jiān)控
  • 簡單配置,支持30+ 數(shù)據(jù)庫,中間件組件監(jiān)控
  • 支持 SDK(API 開發(fā)中) 自定義上傳時間序列數(shù)據(jù)
  • 儀表盤,自定義你的個人風(fēng)格儀表盤
  • 告警/事件流,針對全指標(biāo)設(shè)置報警策略

hostmap 等功能還在完善中,功能那么多,放哪張圖好呢,好糾結(jié)。。。放張儀表盤展示 SDK 自定義上傳數(shù)據(jù)的吧!

初創(chuàng)公司誰來當(dāng)你們的運(yùn)維

已經(jīng)有很多初創(chuàng)公司選擇 Cloud Insight,因?yàn)椴渴鸷唵窝杆伲С值慕M件也多,可以自定義上傳數(shù)據(jù),有技術(shù)支持來解決問題,有一批(注意這個詞是「批」)開發(fā)人員在不斷增加功能,還有什么理由不用呢?

好啦,回答一下標(biāo)題的問題:初創(chuàng)公司誰來當(dāng)你們的運(yùn)維?當(dāng)然是 Cloud Insight 啦。。。

Cloud Insight 集監(jiān)控、管理、計算、協(xié)作、可視化于一身,幫助所有 IT 公司,減少在系統(tǒng)監(jiān)控上的人力和時間成本投入,讓運(yùn)維工作更加高效、簡單。想閱讀更多技術(shù)文章,請訪問 OneAPM 官方技術(shù)博客

本文轉(zhuǎn)自 OneAPM 官方博客

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容