當數據庫出現故障時,營業系統需要配合進行切換及重啟恢復操作。而手動停止、啟動、重啟業務應用容器、進程等操作比較繁瑣效率低,原來需要多人同時花費大量時間完成的事情使用該場景功能現在只用一個人就能解決,把大量重復性工作并發執行減少工作量、人為誤操作等并提升整體工作效率。
場景流程
操作步驟
場景一:單節點故障/恢復,分為四個步驟。
select t.restarting_status, count(*)
from shsnc.process_yy_fwkt t
group by t.restarting_status
selectt.restarting_status, count(*)
fromshsnc.process_yy_fwkt t
group by t.restarting_status;
解決方案:直接修改pod的yaml的部署文件,apply滾動更新。
后續優化
目前整個場景流程中重啟容器、進程操作沒有檢查項是否重啟完成,檢查操作已在開發中。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/129346.html
此文已由作者王盼授權網易云社區發布。 歡迎訪問網易云社區,了解更多網易技術產品運營經驗~ 現狀計算節點發生磁盤損壞等數據無法恢復的異常時,節點上的云主機系統盤無法恢復,導致云主機只能被清理重建 計算節點宕機但磁盤數據可用時,重啟即可恢復所有云主機的運行 計算節點多次宕機(或一段時間內頻繁宕機),則需要遷移所有云主機或者直接清理重建,云硬盤需要遷移到其他cinder-volume存儲服務節點 一般來...
摘要:以下這個名單恐怕是這些公司不想看到的的年前大云故障。微軟稱這次中斷是由外部網絡故障所導致,部分用戶受影響長達個小時。微軟表示這次中斷與故障無關。微軟最終確定人為錯誤是罪魁禍首。 本杰明?富蘭克林曾經說過,這個世界上有兩件事情不可避免,死亡和納稅。但如果這位偉大的政治家和發明家活在我們的現代世界,也許服務器停機也會進入這個名單。不管底層技術再怎么好,也不管托管提供商再多么能干,云總是會發生故障...
摘要:周四聲稱,輸錯命令導致了亞馬遜網絡服務出現持續數小時的故障事件。太平洋標準時上午,一名獲得授權的團隊成員使用事先編寫的,執行一條命令,該命令旨在為計費流程使用的其中一個子系統刪除少量服務器。 AWS解釋了其廣大US-EAST-1地理區域的S3存儲服務是如何受到中斷的,以及它在采取什么措施防止這種情況再次發生。?AWS周四聲稱,輸錯命令導致了亞馬遜網絡服務(AWS)出現持續數小時的故障事件。這...
閱讀 1353·2023-01-11 13:20
閱讀 1699·2023-01-11 13:20
閱讀 1211·2023-01-11 13:20
閱讀 1904·2023-01-11 13:20
閱讀 4161·2023-01-11 13:20
閱讀 2751·2023-01-11 13:20
閱讀 1397·2023-01-11 13:20
閱讀 3664·2023-01-11 13:20