摘要:但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的實例由于所在物理服務器存在故障風險需要維護,阿里云設定了一個實例重啟的系統計劃事件,將在天后重啟該實例并遷移至安全的物理機運行。
摘要: 阿里云會針對ECS實例發布系統事件,當您收到阿里云計劃維護的通知時,可以利用ECS系統計劃事件了解與實例相關的計劃維護操作,并根據您的業務特性選擇合適的時間安排運維操作進行故障轉移,減少對系統可靠性和業務連續性的影響。
阿里云作為領先和值得信賴的云計算服務提供商,提供和保障計算、存儲、網絡資源以及底層基礎設施的可用性、穩定性、安全性。根據自身戰略發展和業務需求,您可以設計高可用的云上IT架構,在阿里云上選擇合適的產品、服務來搭建部署業務系統,并管理其中的數據。在此基礎上,通過阿里云提供的API、監控、編排等多樣化手段實現快速配置資源,搭建多套環境,自動化部署等IT運維能力。
相較于普通的IDC機房以及服務器廠商,阿里云會使用更嚴格的IDC標準、服務器準入標準以及運維標準,以保證云計算整個基礎框架的高可用性、數據的可靠性以及云服務器的高可用性。在此基礎之上,阿里云在各地域提供多可用區服務,當您需要更高的可用性時,可以利用阿里云的多可用區搭建自己的主備服務或者雙活服務。對于金融等對業務連續性有更高要求的行業領域,還可以通過多地域和多可用區搭建出更高的可用性服務,并實現更高的RTO、RPO數據保障能力。對于單臺ECS實例, 阿里云承諾一個服務周期內單臺ECS實例的服務可用性不低于99.95%;對于單地域多可用區,阿里云承諾一個服務周期內該單地域多可用區的服務可用性不低于99.99%。為了保障高水平的服務可用性,阿里云會主動對承載ECS實例運行的物理服務器做日常維護并修復潛在的軟硬件等系統故障,以持續提升系統可靠性、性能和安全防護能力,并在探測到物理服務器存在故障隱患時在線熱遷移實例至健康的服務器之上,保持ECS實例的健康運行狀態。
但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的ECS實例由于所在物理服務器存在故障風險需要維護,阿里云設定了一個實例重啟的系統計劃事件,將在2天后重啟該實例并遷移至安全的物理機運行。
您可能會疑惑,為什么還會受到這樣的信息呢?其實,這是由阿里云平臺主動運維自動觸發的維護通知。在主動運維過程上,某些軟硬件故障會導致實例無法在線遷移,這樣的情況下,阿里云會向用戶發送上述通知,提醒您系統即將通過重啟實例執行遷移操作。為了提升您運維ECS實例的效率和體驗,阿里云會發布ECS實例系統事件功能,當您接收到通知時,可以在ECS控制臺或使用OpenAPI查看系統計劃事件,并根據業務的需要選擇合適的時間點執行系統事件(某些情況下只能等待系統事件按計劃時間執行)。這樣便免去了通過工單聯系客服人工介入的過程,減少風險的同時,也為基于系統事件實現自動化故障轉移提供了基礎,讓運維更高效。
那么ECS實例會存在哪些類型的系統事件呢?阿里云會優先發布系統主動運維觸發的實例重啟(Reboot)類型事件,隨后會給大家提供更豐富的事件類型來滿足多種運維場景。如果存在系統計劃事件,ECS 控制臺待處理事件按鈕上會出現顯著標示提醒您查看。點擊該按鍵后進入 待處理事件 > 系統計劃事件 頁面,在這里您可以看到實例 ID、地域、運行狀態等實例相關信息,計劃執行的系統事件相關信息,推薦的用戶操作和可執行操作按鍵。您也可以通過調用OpenAPI DescribeInstanceFullStatus手動查詢或自動輪詢實例的系統計劃事件。
可以想象,當ECS實例承載關鍵業務時,任何非預期的實例重啟都有可能對系統可用性和業務連續性造成威脅或嚴重影響,因此我們建議您在搭建應用系統時能充分利用可用區、負載均衡等功能和服務來提升架構和服務的整體可用性。在此基礎上,對于阿里云主動修復系統故障觸發的系統事件,通常系統會提前48小時給您發送通知,因此您可以利用事件計劃時間之前的這段用戶操作窗口期,做有準備的負載和故障轉移操作并重啟實例,比如,在集群環境中及時將負載從有計劃事件的實例上轉移到其他實例,或提前備份、轉移本地磁盤的數據,或主動調整負載均衡和彈性伸縮的配置,以及基于業務邏輯做有順序的啟停實例等主動運維操作,最大限度地降低實例重啟對業務連續性的沖擊。
ECS系統事件的類型和場景會不斷完善和擴展,我們希望通過這樣的方式,逐步提升您在阿里云上的運維效率和體驗,提供更完備的接口和服務來支持用戶在阿里云上實現無憂運維和業務永續。
原文鏈接
閱讀更多干貨好文,請關注掃描以下二維碼:
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/8040.html
摘要:但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的實例由于所在物理服務器存在故障風險需要維護,阿里云設定了一個實例重啟的系統計劃事件,將在天后重啟該實例并遷移至安全的物理機運行。 摘要: 阿里云會針對ECS實例發布系統事件,當您收到阿里云計劃維護的通知時,可以利用ECS系統計劃事件了解與實例相關的計劃維護操作,并根據您的業務特性選擇合適的時間安排運維操作進行故障轉移,減少對系...
寶塔Linux面板支持哪些linux操作系統?寶塔Linux面板支持的Linux系統有centos、ubuntu、deepin、Alibaba Cloud Linux、debian和fedora等,今天小編來詳細說下寶塔面板支持的Linux操作系統版本及系統兼容性說明:寶塔Linux面板操作系統說明寶塔Linux面板操作系統支持:centos、ubuntu、deepin、Alibaba Cloud...
摘要:我加入了騰訊,騰訊企業文化很好,經常會有很多小組活動部門活動什么的,但是做運維很苦。所以,年的時候我們幾個騰訊的同事一同創業,希望把我們的想法和經驗能夠傳遞出來。這里我列出了騰訊互聯網運維團隊所經歷的三個階段。 本文是數人云深圳技術分享課上優維科技聯合創始人彭鯉航的演講實錄,演講主題是《運維自動化實踐》。 精彩觀點搶鮮看 實現運維自動化閉環,最主要就是配置管理、狀態管理和變更管理能力。...
摘要:靈活查詢,聚合分組并存除開單純的聚合和分組,還支持聚合和分組的復合查詢。所以,與會聚合為一條曲線,而和的關系則是分組的關系。當然,的功能在未來,還遠遠不止這些,高效運維的時代才剛剛開啟。 運維 2.0 時代 運維 2.0 是指,從技術運維升級為服務運維,向公司提供可依賴的專業服務。運維 2.0 強調服務交付能力,而不是技術能力,需求可依賴、懂業務、服務化的專業運維。 為了了解運維 2....
閱讀 2224·2019-08-30 15:53
閱讀 2452·2019-08-30 12:54
閱讀 1196·2019-08-29 16:09
閱讀 728·2019-08-29 12:14
閱讀 754·2019-08-26 10:33
閱讀 2480·2019-08-23 18:36
閱讀 2958·2019-08-23 18:30
閱讀 2117·2019-08-22 17:09