HDFS HA集群管理

翻譯: https://www.cloudera.com/documentation/enterprise/latest/topics/cdh_hag_hdfs_ha_admin.html

管理HDFS高可用性群集

繼續閱讀:

手動切換到備用NameNode

使用Cloudera Manager手動故障轉移到備用NameNode

如果您正在運行啟用了HA的HDFS服務,則可以手動使活動的NameNode故障切換到備用NameNode。這對計劃中的停機時間很有用 - 用于主要主機的硬件更改,配置更改或軟件升級。

  1. 轉到HDFS服務。
  2. 單擊Instances 選項卡。
  3. 點擊 Federation and High Availability.
  4. 找到要在NameNode上進行故障轉移的Nameservice行。(在使用HDFS聯合時會顯示多行。)
  5. 選擇Actions > Manual Failover.。(如果未為群集啟用HA,則不會顯示此選項。)
  6. 從彈出窗口中選擇應該激活的NameNode,然后單擊Manual Failover

注意: 僅限高級用戶:您可以設置Force Failover復選框,以強制選定的NameNode處于活動狀態,無論其狀態或其他NameNode的狀態如何。強制進行故障轉移將首先嘗試將選定的NameNode故障轉移到活動模式,并將另一個NameNode故障轉移到待機模式。即使選定的NameNode處于安全模式,它也會這樣做。如果失敗,它將繼續將選定的NameNode轉換為活動模式。為避免使兩個NameNode處于活動狀態,只有在另一個NameNode完全停止或者可以通過第一個故障轉移步驟轉換到待機模式時,才使用它。

  1. 當所有步驟完成后,點擊完成

Cloudera Manager將您選擇的NameNode轉換為活動NameNode,將另一個NameNode轉換為備用NameNode。HDFS應該永遠不會有兩個活動NameNodes。

使用命令行手動故障轉移到備用NameNode

要在兩個NameNode之間啟動故障轉移,請運行該命令 hdfs haadmin -failover.

此命令會導致從第一個提供的NameNode到第二個的故障轉移。如果第一個NameNode處于Standby狀態,則此命令只是將第二個NameNode轉換為Active狀態而不會出錯。如果第一個NameNode處于Active狀態,則會嘗試將其正常轉換到Standby狀態。如果失敗,則fencing method (由 dfs.ha.fencing.methods配置)將按順序嘗試,直到其中一種方法成功。只有在這個過程之后,第二個NameNode才會轉換到活動狀態。如果沒有fencing method 成功,則第二個NameNode不會轉換為活動狀態,并且會返回錯誤。
注意:無論是使用Cloudera Manager 或 命令行配置HA,都可以運行hdfs haadmin -failover 。這意味著即使Cloudera Manager不可用,也可以手動啟動故障轉移。

將HA NameNode移動到新主機

使用Cloudera Manager將HA NameNode移動到新主機

請參閱使用遷移角色向導移動高可用NameNode,故障轉移控制器和JournalNode角色

使用命令行將HA NameNode移動到新主機

使用以下步驟將其中一個NameNode移動到新主機。

在這個例子中,當前的NameNodes稱為nn1 和 nn2 ,新的NameNode稱為 nn2-alt。這個例子假定nn2-alt 已經是此CDH 5 HA群集的成員,已配置自動故障轉移并且 nn2上的JournalNode 將被移到
nn2-alt 。

該過程將NameNode和JournalNode服務從nn2轉移到nn2-alt , 重新配置nn1以識別JournalNode的新目錄,重啟nn1 和 nn2-alt 。

第1步:確保nn1是活動的NameNode

確保不會移動的NameNode 處于活動狀態; 在這個例子中,nn1 必須活躍。您可以使用NameNodes的Web UI查看哪些是活動的; 請參閱啟動NameNodes

如果 nn1 不是活動的NameNode,請使用 hdfs haadmin -failover 命令來啟動故障轉移:

hdfs haadmin -failover nn2 nn1

第2步:在nn2上停止服務

一旦確定要移動的節點處于不活動狀態,請停止該節點上的服務:在本例中,停止服務nn2 。停止NameNode,ZKFC守護程序(如果是自動故障轉移部署)以及JournalNode(如果您正在移動它)。繼續如下。

  1. 停止NameNode守護進程:
$ sudo service hadoop-hdfs-namenode stop
  1. 如果ZKFC守護進程正在運行,請停止它:
$ sudo service hadoop-hdfs-zkfc stop
  1. 停止JournalNode守護程序,如果它正在運行:
$ sudo service hadoop-hdfs-journalnode stop 
  1. 確保這些服務未設置為在引導時重新啟動。如果你不打算使用nn2作為NameNode,您可能需要刪除這些服務。

第3步:在nn2-alt上安裝NameNode后臺進程

請參閱安裝說明 步驟3:使用YARN安裝CDH 5步驟4:使用MRv1安裝CDH 5 來安裝 hadoop-hdfs-namenode 。

第4步:在nn2-alt上配置HA

請參閱啟用HDFS HA 在core-site.xml和hdfs-site.xml中配置nn2-alt 。您應該復制已經在nn2相應文件中設置的值。

  • 如果您要將JournalNode重新定位到 nn2-alt ,按照這些指示安裝它,但不要啟動它。
  • 如果您使用自動故障轉移功能,請確保按照說明在nn2-alt上配置必要的屬性 并在ZooKeeper中初始化HA狀態。
    注意:如果已配置自動故障轉移,則無需關閉群集即可執行此操作; 僅當您從手動切換到自動故障切換時才需要關閉。

第5步:將dfs.name.dir和dfs.journalnode.edits.dir目錄的內容復制到nn2-alt

使用rsync或類似的工具來復制內容dfs.name.dir 目錄,如果您正在移動JournalNode到nn2-alt ,dfs.journalnode.edits.dir目錄也需要復制。

第6步:如果您正在移動JournalNode,請更新nn1上的dfs.namenode.shared.edits.dir

更新nn1上hdfs-site.xml文件中的 dfs.namenode.shared.edits.dir 值,有關更多信息,請參閱本節

步驟7:如果您使用自動故障轉移,請在nn2-alt上安裝zkfc守護程序

有關說明,請參閱部署自動故障轉移(如果已配置),但不要啟動守護程序。

第8步:在nn2-alt上啟動服務

啟動NameNode; 啟動ZKFC進行自動故障切換; 如果你想運行JournalNode,請在nn2-alt安裝并啟動它。繼續如下。

  1. 啟動JournalNode守護進程:
$ sudo service hadoop-hdfs-journalnode start 
  1. 啟動NameNode守護進程:
$ sudo service hadoop-hdfs-namenode start
  1. 啟動ZKFC守護進程:
$ sudo service hadoop-hdfs-zkfc start
  1. 將這些服務設置為在引導時重啟; 例如在RHEL兼容系統上:
$ sudo chkconfig hadoop-hdfs-namenode on
$ sudo chkconfig hadoop-hdfs-zkfc on
$ sudo chkconfig hadoop-hdfs-journalnode on

第9步:如果您要重新部署JournalNode,請故障轉移到nn2-alt

hdfs haadmin -failover nn1 nn2-alt

步驟10:如果您要重新安置JournalNode,請重新啟動nn1

重新啟動NameNode nn1 的守護進程,強制它重新讀取配置:

$ sudo service hadoop-hdfs-namenode stop 
$ sudo service hadoop-hdfs-namenode start

其他HDFS haadmin命令

HA NameNode配置并啟動后,您將有權訪問一些其他命令來管理HA HDFS集群。具體來說,你應該熟悉 hdfs haadmin 的子命令。

本頁介紹一些重要子命令的高級用法。有關每個子命令的具體使用信息,您應該運行 hdfs haadmin -help <command>.

getServiceState

getServiceState - 確定給定的NameNode是活動還是備用

連接到提供的NameNode以確定其當前狀態,會在STDOUT 打印“standby”或“active” 。此子命令可由cron作業或監視腳本使用,這些腳本需要根據NameNode當前處于活動狀態還是處于待機狀態而具有不同的行為。

checkHealth

checkHealth - 檢查給定NameNode的健康狀況

連接到提供的NameNode以檢查其健康狀況。NameNode能夠對自身執行一些診斷,包括檢查內部服務是否按預期運行。如果NameNode健康,該命令將返回0,否則返回非零值。可將此命令用于監視目的。

啟用HA后使用dfsadmin命令

默認情況下,dfsadmin命令會對活動和備用NameNode都起作用。要將選項限制為特定的NameNode,請使用 -fs選項。例如,

要為兩個NameNode打開安全模式,請運行:
hdfs dfsadmin -safemode enter

要打開單個NameNode的安全模式,請運行:
hdfs dfsadmin -fs hdfs://<host>:<port> -safemode enter

有關dfsadmin命令選項的完整列表,請運行:hdfs dfsadmin -help.

從NFS共享編輯目錄轉換為基于Quorum-based存儲

使用Cloudera Manager從NFS共享編輯目錄轉換為基于Quorum-based存儲

將HA配置從使用NFS共享編輯目錄轉換為基于Quorum-based的存儲涉及禁用當前HA配置,然后使用基于Quorum的存儲啟用HA。

  1. 禁用HA
  2. 盡管備用NameNode角色已刪除,但其名稱目錄不會被刪除。清空這些目錄。
  3. 啟用基于Quorom-based的HA

使用命令行將NFS共享編輯目錄轉換為基于Quorum-based存儲

要從使用NFS的共享存儲切換到基于Quorum-based存儲,請按照下列步驟操作:

  1. 禁用HA
  2. 使用基于Quorum-based存儲重新部署HA
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,702評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,615評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,606評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,044評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,826評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,227評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,307評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,447評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,992評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,807評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,001評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,550評論 5 361
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,243評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,667評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,930評論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,709評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,996評論 2 374

推薦閱讀更多精彩內容