分布式資源管理系統:YARN

一 產生背景

運維成本:
   如果采用“一個框架一個集群”的模式,則可能需要多個管理員管理這些集群;進而增加運維成本,而共享模式通常需要少數管理員即可完成多個框架的統一管理。
數據共享:
   隨著數據量的暴增,跨集群間的數據移動不僅需花費更長的時間,且硬件成本也會大大增加,而共享集群模式可讓多種框架共享數據和硬件資源,將大大減小數據移動帶來的成本。
MR v1版本的缺陷:
   擴展性受限制,單點故障,不支持其他分布式計算框架.

二 YARN 的由來

Yet Another Resource Negotiagor:又一個計算框架
Hadoop2.x 中發布
它是統一的集群資源管理框架,用來負責集群的管理和調度.


Paste_Image.png

三 YARN基本框架

Paste_Image.png
  • Resource Manager
    整個集群只有一個,負責集群資源的統一管理和調度:
    詳細功能:

    • 處理客戶端請求
    • 啟動/監控ApplicationMaster
    • 監控NodeManager
    • 資源分配與調度
  • Node Manager
    每個節點只有一個,負責資源的管理和使用
    詳細功能:

    • 單個節點上的資源管理和任務管理
    • 處理來自ResourceManager的命令
    • 處理來自ApplicationMaster的命令
  • ApplicationMaster
    每個應用程序只有一個,負責應用程序的管理和任務調度
    詳細功能:

    • 數據切分
    • 為應用程序申請資源,進一步分配給內部任務
    • 任務監控和容錯
  • Container
    對任務運行環境的抽象
    描述一系列信息:

    • 任務運行資源(節點,cpu,內存)
    • 任務啟動命令
    • 任務運行環境

四. YARN運行過程剖析

Paste_Image.png
  • YARN 容錯性

    • Resource Manager
      基于zookeeper實現HA(HADOOP2.6+)
    • Node Manager
      失敗后,RM將失敗以后任務告訴對于AM
      AM 決定如何處理失敗任務.
    • Application Master
      失敗后,由RM負責重啟。
      AM需處理內部任務的容錯問題。
      hadoop已經實現了內部容錯,spark的話就需要重頭開始跑.
      RMAppMaster會保存已經運行完成的task,重啟后無需重新運行.
  • YARN 調度框架

    • 雙層調度框架
      RM將資源分配給AM
      AM將資源進一步分配給Task
    • 基于資源預留的調度策略
      資源不夠時,會為Task預留,直到資源充足。
Paste_Image.png
  • YARN資源調度器

    • 多類型資源調度
      支持cpu,內存調度
    • 提供多種資源調度器
      FIFO
      Fair Scheduler
      Capacity Scheduler
    • 多租戶資源調度器
      支持資源按照比例分配
      支持層級隊列劃分方式
      支持資源搶占
  • YARN 資源隔離方案

    • 支持內存和cpu兩種資源隔離
      內存是一種“決定生死”的資源
      CPU是一種“影響快慢”的資源
    • 內存隔離
      基于線程監控方案
      基于Cgroups方案
    • CPU隔離
      默認不對cpu資源進行隔離
      基于Cgroups隔離方案

五. YARN資源調度過程

Paste_Image.png
  • 調度方法:

    • FIFO

      • 將所有應用程序放到一個隊列中
      • 隊列前面的程序優先獲得資源
      • 局限性明顯
        資源利用率不高,無法交叉運行作業
        不夠靈活,比如緊急作業無法插隊
    • 多隊列組織方式

      • 將所有應用程序放到多個隊列
      • 每個隊列可單獨實現調度策略
      • 每個隊列對應一定比如的調度資源
        優勢明顯:
        • 按隊列組織資源和用戶,符合生產需求
        • 不同隊列的資源分配策略不同,更加靈活
          兩種多隊列調度器: Fair, Capacity
    • Capacity Scheduler

      • 由Yahoo開源,共享資源調度器
      • 每個隊列內部采用FIFO調度策略
      • 每個隊列分配一定比例資源
      • 可限制每個用戶的資源使用量
Paste_Image.png
  • Fair Scheduler
    • 由Facebook開源共享集群調度器
    • 以隊列方式組織作業
    • 基于最小資源量與公平共享量進行調度
    • 作業優先級越高,分配的資源越多
Paste_Image.png
  • 基于標簽的調度機制

    • YARN 基于標簽的調度
      • 基于hadoop2.6.0開始,提供基于標簽的調度策略
      • 常用于異構集群(操作系統不同,安裝的版本不同,硬件不同)
    • 思路
      • 將一些高配機器打上highmemory/highdisk標簽,并結合隊列配置(比如reporting隊列) 使之生效。
      • 將所有mapreduce程序提交到reporing隊列中
        hadoop jar ***.jar -Dmapreduce.job.queuename=reporing...
  • 基于標簽調度機制:原理

Paste_Image.png
Paste_Image.png

六. 運行在YARN上的計算框架

  • 運行在YARN上的計算框架

    • 離線計算框架 MapReduce
    • DAG計算框架: Tez
    • 流式計算框架: Storm
    • 內存計算框架: Spark
  • MapReduce on YARN

Paste_Image.png
  • DAG 計算框架 Tez
Paste_Image.png
Paste_Image.png
Paste_Image.png
Paste_Image.png
  • 流式計算框架 Storm
Paste_Image.png
Paste_Image.png
Paste_Image.png
  • Spark on YARN
Paste_Image.png

七. 日志分析系統架構

Paste_Image.png
  • 資源管理模塊

    • 資源劃分
      啟用 Capacity Scheduler
      劃分多個隊列,每個隊列設置一定比例資源,每個隊列交由一類應用
    • 資源隔離
      啟用cgroup資源隔離(linux 內核版本3.19上)
    • 異構集群
      根據機器硬件資源不同,打上不同類型的標簽
      不同隊列關聯不同的機器(標簽)
  • 資源劃分

Paste_Image.png
  • 資源劃分方法


    Paste_Image.png
  • 資源隔離配置方法

Paste_Image.png
  • 節點標簽
Paste_Image.png
  • 標簽調度,啟用步驟
Paste_Image.png
  • Yarn 配置
Paste_Image.png
Paste_Image.png
Paste_Image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,001評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,786評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,986評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,204評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,964評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,354評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,410評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,554評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,106評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,918評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,093評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,648評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,342評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,755評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,009評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,839評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,107評論 2 375

推薦閱讀更多精彩內容