Zabbix監控特定進程配置詳解

有時候我們需要監控一個進程是否停掉了,如果停掉了就立馬報警,以下記錄了下詳細步驟,通過這個示例會學到很多zabbix核心配置相關的東西。
總的來說,配置一個完整的監控流程如下:

  • 1.創建監控項,即配置要監控的指標,如內存的使用率,CPU的使用率,進程的運行狀況等,配了監控項后就會定時收集機器的配置信息,然后等待zabbix server收集(zabbix agent被動模式)。
  • 2.創建觸發器,觸發器將監控項收集的數據通過觸發器表達式進行評估。
    在觸發器表達式中我們可以定義哪些值范圍是合理,哪些是不合理的,如果出現不合理的值,觸發器會把狀態改為PROBLEM,接下來就到了報警以及發郵件。
  • 3.創建動作,在zabbix中動作的意思是觸發器觸發后要進行的操作,一般是通過配置給相關負責人發送郵件,短信等通知。

下面配置監控服務器的logstash(開源實時日志同步項目)進程是否在運行:

  • 1.首先創建監控進程的監控項:
    監控項的組成:key[參數]
    例如獲取5分鐘的負載情況:system.cpu.load[avg5],avg5是對應的參數。
    zabbix agent支持的所有key可以到這里找到:
    http://www.ttlsa.com/zabbix/zabbix-agent-types-and-all-keys/
    在這里我們需要的是proc.num這個key,以下是對此key的詳解:

    可以看到此監控項的返回值是進程數量,其中cmdline參數可以是進程名字包含的關鍵字,在這里我的進程的關鍵字是logstash,因此按如下方式創建監控logstash進程的監控項,表示機器所有用戶所有狀態的logstash進程數量:
  • 2.創建對應監控項的觸發器:
    創建觸發器主要是編寫觸發器表達式,也就是評估監控項是否在合理范圍的表達式。觸發器表達式格式如下:
{<host>:<key>.<function>(<parameter>)}<operator><constant>
{主機:key.函數(參數)}<表達式><常數>

對于觸發器表達式更加詳細的介紹請參考這里:
http://www.ttlsa.com/zabbix/zabbix-trigger-expression/
觸發器表達式示例:
觸發器名稱:Processor load is too high on www.zabbix.com

{www.zabbix.com:system.cpu.load[all,avg1].last(0)}>5

觸發器說明:
www.zabbix.com:host名稱
system.cpu.load[all,avg1]:item值,一分內cpu平均負載值
last(0):最新值
>5:最新值大于5
如上所示,www.zabbix.com這個主機的監控項,最新的CPU負載值如果大于5,那么表達式會返回true,這樣一來觸發器狀態就改變為“problem”了。
在這里針對logstash進程觸發器配置如下:


上面配置表示如果機器logstash進程數量的最新值小于1,就會觸發報警。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • Zabbix簡介 Zabbix官方網站Zabbix中文文檔 本文系統環境是CentOS7x86_64, Zabbi...
    Zhang21閱讀 8,086評論 0 37
  • Spring Cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具(例如配置管理,服務發現,斷路器,智...
    卡卡羅2017閱讀 134,991評論 19 139
  • 1、自定義key 接口:server端之所以能夠監控agent端,是因為agent端有一個的接口,這個接口用于和s...
    張大志的博客閱讀 779評論 0 2
  • 1.寫在前面 本文主要介紹的是zabbix的編譯安裝過程,包含它的基礎環境LNMP,雖然zabbix官方一般推薦的...
    天之藍色閱讀 2,565評論 0 16
  • 偶然聽到一首歌,七月上。節湊輕松舒緩,一下子就被歌曲中的意境吸引。一人一把吉他走遍大江南北,沉浸在自己的歌聲中,游...
    小樣過來吧閱讀 252評論 0 0