聊聊flink的checkpoint配置

本文主要研究下flink的checkpoint配置

實(shí)例

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

// start a checkpoint every 1000 ms
env.enableCheckpointing(1000);

// advanced options:

// set mode to exactly-once (this is the default)
env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);

// checkpoints have to complete within one minute, or are discarded
env.getCheckpointConfig().setCheckpointTimeout(60000);

// make sure 500 ms of progress happen between checkpoints
env.getCheckpointConfig().setMinPauseBetweenCheckpoints(500);

// allow only one checkpoint to be in progress at the same time
env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);

// enable externalized checkpoints which are retained after job cancellation
env.getCheckpointConfig().enableExternalizedCheckpoints(ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);

// This determines if a task will be failed if an error occurs in the execution of the task’s checkpoint procedure.
env.getCheckpointConfig().setFailOnCheckpointingErrors(true);
  • 使用StreamExecutionEnvironment.enableCheckpointing方法來(lái)設(shè)置開(kāi)啟checkpoint;具體可以使用enableCheckpointing(long interval),或者enableCheckpointing(long interval, CheckpointingMode mode);interval用于指定checkpoint的觸發(fā)間隔(單位milliseconds),而CheckpointingMode默認(rèn)是CheckpointingMode.EXACTLY_ONCE,也可以指定為CheckpointingMode.AT_LEAST_ONCE
  • 也可以通過(guò)StreamExecutionEnvironment.getCheckpointConfig().setCheckpointingMode來(lái)設(shè)置CheckpointingMode,一般對(duì)于超低延遲的應(yīng)用(大概幾毫秒)可以使用CheckpointingMode.AT_LEAST_ONCE,其他大部分應(yīng)用使用CheckpointingMode.EXACTLY_ONCE就可以
  • checkpointTimeout用于指定checkpoint執(zhí)行的超時(shí)時(shí)間(單位milliseconds),超時(shí)沒(méi)完成就會(huì)被abort掉
  • minPauseBetweenCheckpoints用于指定checkpoint coordinator上一個(gè)checkpoint完成之后最小等多久可以出發(fā)另一個(gè)checkpoint,當(dāng)指定這個(gè)參數(shù)時(shí),maxConcurrentCheckpoints的值為1
  • maxConcurrentCheckpoints用于指定運(yùn)行中的checkpoint最多可以有多少個(gè),用于包裝topology不會(huì)花太多的時(shí)間在checkpoints上面;如果有設(shè)置了minPauseBetweenCheckpoints,則maxConcurrentCheckpoints這個(gè)參數(shù)就不起作用了(大于1的值不起作用)
  • enableExternalizedCheckpoints用于開(kāi)啟checkpoints的外部持久化,但是在job失敗的時(shí)候不會(huì)自動(dòng)清理,需要自己手工清理state;ExternalizedCheckpointCleanup用于指定當(dāng)job canceled的時(shí)候externalized checkpoint該如何清理,DELETE_ON_CANCELLATION的話,在job canceled的時(shí)候會(huì)自動(dòng)刪除externalized state,但是如果是FAILED的狀態(tài)則會(huì)保留;RETAIN_ON_CANCELLATION則在job canceled的時(shí)候會(huì)保留externalized checkpoint state
  • failOnCheckpointingErrors用于指定在checkpoint發(fā)生異常的時(shí)候,是否應(yīng)該fail該task,默認(rèn)為true,如果設(shè)置為false,則task會(huì)拒絕checkpoint然后繼續(xù)運(yùn)行

flink-conf.yaml相關(guān)配置

#==============================================================================
# Fault tolerance and checkpointing
#==============================================================================

# The backend that will be used to store operator state checkpoints if
# checkpointing is enabled.
#
# Supported backends are 'jobmanager', 'filesystem', 'rocksdb', or the
# <class-name-of-factory>.
#
# state.backend: filesystem

# Directory for checkpoints filesystem, when using any of the default bundled
# state backends.
#
# state.checkpoints.dir: hdfs://namenode-host:port/flink-checkpoints

# Default target directory for savepoints, optional.
#
# state.savepoints.dir: hdfs://namenode-host:port/flink-checkpoints

# Flag to enable/disable incremental checkpoints for backends that
# support incremental checkpoints (like the RocksDB state backend). 
#
# state.backend.incremental: false
  • state.backend用于指定checkpoint state存儲(chǔ)的backend,默認(rèn)為none
  • state.backend.async用于指定backend是否使用異步snapshot(默認(rèn)為true),有些不支持async或者只支持async的state backend可能會(huì)忽略這個(gè)參數(shù)
  • state.backend.fs.memory-threshold,默認(rèn)為1024,用于指定存儲(chǔ)于files的state大小閾值,如果小于該值則會(huì)存儲(chǔ)在root checkpoint metadata file
  • state.backend.incremental,默認(rèn)為false,用于指定是否采用增量checkpoint,有些不支持增量checkpoint的backend會(huì)忽略該配置
  • state.backend.local-recovery,默認(rèn)為false
  • state.checkpoints.dir,默認(rèn)為none,用于指定checkpoint的data files和meta data存儲(chǔ)的目錄,該目錄必須對(duì)所有參與的TaskManagers及JobManagers可見(jiàn)
  • state.checkpoints.num-retained,默認(rèn)為1,用于指定保留的已完成的checkpoints個(gè)數(shù)
  • state.savepoints.dir,默認(rèn)為none,用于指定savepoints的默認(rèn)目錄
  • taskmanager.state.local.root-dirs,默認(rèn)為none

小結(jié)

  • 可以通過(guò)使用StreamExecutionEnvironment.enableCheckpointing方法來(lái)設(shè)置開(kāi)啟checkpoint;具體可以使用enableCheckpointing(long interval),或者enableCheckpointing(long interval, CheckpointingMode mode)
  • checkpoint的高級(jí)配置可以配置checkpointTimeout(用于指定checkpoint執(zhí)行的超時(shí)時(shí)間,單位milliseconds),minPauseBetweenCheckpoints(用于指定checkpoint coordinator上一個(gè)checkpoint完成之后最小等多久可以出發(fā)另一個(gè)checkpoint),maxConcurrentCheckpoints(用于指定運(yùn)行中的checkpoint最多可以有多少個(gè),如果有設(shè)置了minPauseBetweenCheckpoints,則maxConcurrentCheckpoints這個(gè)參數(shù)大于1的值不起作用),enableExternalizedCheckpoints(用于開(kāi)啟checkpoints的外部持久化,在job failed的時(shí)候externalized checkpoint state無(wú)法自動(dòng)清理,但是在job canceled的時(shí)候可以配置是刪除還是保留state)
  • 在flink-conf.yaml里頭也有checkpoint的相關(guān)配置,主要是state backend的配置,比如state.backend.async、state.backend.incremental、state.checkpoints.dir、state.savepoints.dir等

doc

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,563評(píng)論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,694評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 178,672評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 63,965評(píng)論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,690評(píng)論 6 413
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 56,019評(píng)論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,013評(píng)論 3 449
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 43,188評(píng)論 0 290
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,718評(píng)論 1 336
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,438評(píng)論 3 360
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,667評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,149評(píng)論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,845評(píng)論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 35,252評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 36,590評(píng)論 1 295
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,384評(píng)論 3 400
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,635評(píng)論 2 380

推薦閱讀更多精彩內(nèi)容