使用filebeat收集ES集群運行日志和慢日志并寫入到ES

使用filebeat收集ES集群運行日志和慢日志并寫入到ES

背景

Elasticsearch集群運行過程中,運行日志和慢日志能夠幫助集群使用者迅速定位出現的問題。鑒于Elasticsearch的一大應用場景是日志收集,因此我們嘗試使用filebeat收集Elasticsearch集群各節點中的運行日志和慢日志,并寫入到另一個公共的Elasticsearch集群中,使用Kibana進行日志檢索。

為什么是filebeat

filebeat歸屬于Beats家族,使用go語言開發,是一個輕量的日志收集器,因為輕量所以適用于部署在需要收集日志的服務器中。相比之下,另一個可用于日志收集的logstash組件就比較笨重了,運行于JVM中,占用服務器資源比filebeat多,所以不適用直接部署在服務器中,但是logstash對已采集數據的清洗、過濾等處理能力要比filebeat強。通常的日至系統架構中,將filebeat部署在服務器中用于收集日志,然后寫入到單獨部署的logstash集群中,經logstash對日志內容進行統一處理之后,再寫入到Elasticsearch集群中去。

實戰過程

Elasticsearch集群運行日志和慢日志內容分析

首先要分析一下要收集的日志格式,確定日志每一行記錄的固定pattern,以及是否要對日志內容進行解析,提取重要字段或者過濾一些無用的字段。
以下是Elasticsearch集群的運行日志和慢日志示例(5.6.4版本):

運行日志:

[2018-10-23T20:42:37,451][INFO ][o.e.h.n.Netty4HttpServerTransport] [1540298502000001009] publish_address {10.0.64.80:16703}, bound_addresses {0.0.0.0:16703}
[2018-10-23T20:42:37,451][INFO ][o.e.n.Node               ] [1540298502000001009] started
[2018-10-23T20:42:37,463][INFO ][o.e.g.GatewayService     ] [1540298502000001009] recovered [0] indices into cluster_state

慢日志:

[2018-10-28T12:04:17,307][WARN ][index.indexing.slowlog.index] [1540298502000001009] [pmc/wCALr6BfRm-sr3qOQuGX
Xw] took[18.6ms], took_millis[18], type[articles], id[AWa41-J9c0s1mOPvR6F3], routing[] , source[]

從以上日志內容可以看出,運行日志是的格式為"[時間戳][日志級別][類名][節點名][日志詳細信息]", 慢日志的格式為"[時間戳][日志級別][日志類別][節點名][日志詳細信息]"。
需要完成的解析工作為:

  1. 解析出時間戳,并替換默認的@timestamp字段,并且保證時區為中國時間
  2. 解析出日志級別,作為一個單獨的字段,便于檢索
  3. 每一行日志中去除已經解析的時間戳和日志字段
  4. 解析出異常日志,與異常日志的前一行合并作為一條記錄
  5. 為了節省存儲空間,去除filebeat默認增加的beat.name,beat.version,beat.host等無關緊要的字段

定義日志解析pipeline

filebeat對收集到的日志處理能力是比較弱的,并且為了提高日志收集性能,一般不在filebeat中進行日志內容的處理,可以借助于logstash強大的日志處理能力或者Elasticsearch的ingest pipeline功能對日志內容進行處理。
Elasticsearch的ingest pipeline可查閱官方文檔了解更多ingest api.

基于上一節定義的五項日志處理工作,前三項可以由ingest pipeline解決,下面定義名為es-log-pipeline的pipeline:

{
  "description": "es-log-pipeline",
  "processors": [{
    "grok": {
      "field": "message",
      "patterns": [
        "^\\[%{TIMESTAMP_ISO8601:timestamp}\\]\\[%{LOGLEVEL:level}%{SPACE}\\]%{GREEDYDATA:message}"
      ]
    },
    "remove": {
      "field": "@timestamp"
    }
  }, {
    "date": {
      "field": "timestamp",
      "formats": ["ISO8601"],
      "timezone": "Asia/Shanghai",
      "ignore_failure": true
    },
    "remove": {
      "field": "timestamp"
    }
  }],
  "on_failure": [{
    "set": {
      "field": "error.message",
      "value": "{{ _ingest.on_failure_message }}"
    }
  }]
}

主要使用了grok processors進行日志解析,解析出了日志中的時間戳字段和日志級別字段,并將時間戳替換為filebeat默認提供的@timestamp字段。

調用Elasticsearch 的ingest API創建上述pipeline:
curl -X PUT _ingest/pipeline/es-log-pipeline

定義filebeat配置

日志解析工作的4和5兩項可以由filebeat處理,定義filebeat.yml配置文件:

filebeat.prospectors:
- input_type: log
  paths:
    - {{.runlogPath}}
  fields:
    type: "runlog"
    ip: "{{.ip}}"
  fields_under_root: true
  multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}'
  multiline.negate: true
  multiline.match: after
- input_type: log
  paths:
    - {{.searchSlowlogPath}}
  fields:
    type: "slowlog"
    logtype: "search"
    ip: "{{.ip}}"
  fields_under_root: true
  multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}'
  multiline.negate: true
  multiline.match: after
- input_type: log
  paths:
    - {{.indexSlowLogPath}}
  fields:
    type: "slowlog"
    logtype: "indexing"
    ip: "{{.ip}}"
  fields_under_root: true
  multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}'
  multiline.negate: true
  multiline.match: after

processors:
- drop_fields:
     fields: ["beat", "offset", "source"]

output.elasticsearch:
  hosts: ["{{.esEndPoint}}"]
  index: "es-%{[type]}-%{+yyyy.MM.dd}"
  pipeline: "es-log-pipeline"

上述配置按天創建了兩個索引,分別為es-runlog-%{+yyyy.MM.dd}和es-slowlog-%{+yyyy.MM.dd},分別存儲運行日志和慢日志。

經過上述配置,啟動filebeat, 就可以實現收集Elasticsearch集群的運行日志和慢日志并寫入到另外一個Elasticsearch集群中。

總結

  1. 日志格式解析的工作比較繁瑣,需要詳細了解grok processor的處理能力grok processor
  2. filebeat目錄下有名為filebeat.template.json的文件,該文件定義了filebeat的默認模板,如果需要可以修改該模板配置文件或者自定義新模板。
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,002評論 6 542
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,400評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,136評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,714評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,452評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,818評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,812評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,997評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,552評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,292評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,510評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,035評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,721評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,121評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,429評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,235評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,480評論 2 379

推薦閱讀更多精彩內容

  • 她叫葵,她說她是鬼。 我說,向陽花這種植物,怎么會是鬼呢? 你不懂,物極必反,所有的堅強都是經歷了諸多的黑暗才學會...
    肉粽醬閱讀 295評論 0 0
  • 寶寶到家的第二天,家里來了很多親戚,其中主要是慧妹娘家那邊的人。 這是我們家鄉的習俗,叫做“送奶糖”。 但時間不是...
    旦旦日記閱讀 2,645評論 0 2
  • 同學張是典型的文化人。上學我們背不下古文,背不下魯迅的文章時,他已經能自如地用古文寫文章了;當我們還搞不...
    潘多拉簡書閱讀 553評論 0 0
  • 一、BroadcastReceiver簡介 1.BroadcastReceiver是Android四大組件之一。一...
    沫沫么么噠Die閱讀 632評論 2 1