圖片發自簡書App
李培龍-滴滴出行-滴滴出行海量數據場景下的智能監控與故障定位實踐
這里的維度增加意思是:根據一些經驗,將某些能夠直接觀察到的指標進行組合,形成新的指標
根據后面頁面意思,滴滴實際上是將這些指標在后臺進行各種聚合操作,形成相關知識,并發現異常。
如果10000指標,兩輛組合,那么就是1億新指標,即為維度爆炸
但是,肯定有些指標組合在一起是沒有關聯的,演講者并未指明;聚合操作也是依賴專家知識。
圖片發自簡書App
業務直接用sdk上報指標,可自定義
--滴滴業務比較新,可能不存在推廣sdk的問題
用falcon存儲時序數據--falcon主要開發者就在滴滴公司
圖片發自簡書App
圖片發自簡書App
圖片發自簡書App
單模型,用hw方法,滴滴大部分重要指標(一百個左右)都用這個方式
--人工發現周期
--人工配置參數,訓練效果可疑
--異常判定,未使用hw自身的level區間,有疑問在問
圖片發自簡書App
多模型分類器
圖片發自簡書App
圖片發自簡書App
存在問題
圖片發自簡書App
實驗新方法
圖片發自簡書App
也做了調用鏈
已經做到用戶監控,能關聯單用戶和整個連路
圖片發自簡書App
使用tls來實現
并且提供數據透傳服務,如壓測標簽
圖片發自簡書App
圖片發自簡書App