摘要:如果兩個都掛掉了,那就要做相對麻煩的操作了,而且相對對數(shù)據(jù)不安全以下是參考案例異常停止后無法正常啟動
博客原文:hackershell
前段時間,standby的NN掛掉了,并且怎么起也起不來,如下日志:
2016-01-03 14:04:19,293 FATAL org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer: Unknown error encountered while tailing edits. Shutting down standby NN. java.io.IOException: Failed to apply edit log operation ReassignLeaseOp [leaseHolder=DFSClient_NONMAPREDUCE_854707399_1, path=/tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876, newHolde r=HDFS_NameNode, opCode=OP_REASSIGN_LEASE, txid=20790808505]: error File is not under construction: /tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876 at org.apache.hadoop.hdfs.server.namenode.MetaRecoveryContext.editLogLoaderPrompt(MetaRecoveryContext.java:94) at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadEditRecords(FSEditLogLoader.java:205) at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadFSEdits(FSEditLogLoader.java:112) at org.apache.hadoop.hdfs.server.namenode.FSImage.loadEdits(FSImage.java:771) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.doTailEdits(EditLogTailer.java:227) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:321) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:279) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:296) at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:456) at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:292)
剛開始懷疑是不是editlog的下載有問題,后來發(fā)現(xiàn)editlog是可以解析出來的,但是不排除editlog的順序存在bug
我們采取的方案是:
因?yàn)槊看螁佣夹枰虞deditlog,所以為了跳過此操作,我們將Active進(jìn)入安全模式,并進(jìn)行saveNameSpace將dump出來的fsimage和txid拷貝到Standby NN上,重啟就可以避免加載editlog了。
如果兩個NN都掛掉了,那就要做相對麻煩的操作了,而且相對對數(shù)據(jù)不安全
以下是參考案例:
Namenode異常停止后無法正常啟動
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/65400.html
摘要:是如何實(shí)現(xiàn)的我們前面說到,是如何判斷是否健康,接下來當(dāng)處于非健康狀態(tài)時,是如何進(jìn)行切換的呢在這個類中,實(shí)行了兩個重要的函數(shù),一個叫,另一個叫,顧名思義就是選舉和健康檢查用的回調(diào)函數(shù),其中還有兩個重要的組成部分,,總體的就如上圖所示。 博客原文:hackershell 之前在準(zhǔn)備中級課程PPT,整理了下HA的基本內(nèi)容,并且感謝松哥為我們提供了HA不會切的問題,以至于之后剛好出現(xiàn)的Name...
閱讀 2435·2021-11-23 10:04
閱讀 1510·2021-09-02 15:21
閱讀 901·2019-08-30 15:44
閱讀 1073·2019-08-30 10:48
閱讀 719·2019-08-29 17:21
閱讀 3565·2019-08-29 13:13
閱讀 1991·2019-08-23 17:17
閱讀 1797·2019-08-23 17:04