国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

云計(jì)算節(jié)點(diǎn)故障自動(dòng)化運(yùn)維服務(wù)設(shè)計(jì)

seanHai / 3357人閱讀

此文已由作者王盼授權(quán)網(wǎng)易云社區(qū)發(fā)布。

歡迎訪問(wèn)網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運(yùn)營(yíng)經(jīng)驗(yàn)~

現(xiàn)狀
計(jì)算節(jié)點(diǎn)發(fā)生磁盤損壞等數(shù)據(jù)無(wú)法恢復(fù)的異常時(shí),節(jié)點(diǎn)上的云主機(jī)系統(tǒng)盤無(wú)法恢復(fù),導(dǎo)致云主機(jī)只能被清理重建

計(jì)算節(jié)點(diǎn)宕機(jī)但磁盤數(shù)據(jù)可用時(shí),重啟即可恢復(fù)所有云主機(jī)的運(yùn)行

計(jì)算節(jié)點(diǎn)多次宕機(jī)(或一段時(shí)間內(nèi)頻繁宕機(jī)),則需要遷移所有云主機(jī)或者直接清理重建,云硬盤需要遷移到其他cinder-volume存儲(chǔ)服務(wù)節(jié)點(diǎn)

一般來(lái)說(shuō)重建過(guò)程比較耗時(shí),并且云主機(jī)數(shù)據(jù)盤數(shù)據(jù)會(huì)全部丟失;另外采用本地file鏡像啟動(dòng)的云主機(jī)離線或者在線遷移比較耗時(shí)并大類占用物理機(jī)硬盤和網(wǎng)絡(luò)IO,會(huì)進(jìn)一步加重計(jì)算節(jié)點(diǎn)負(fù)載,增大宕機(jī)可能性,實(shí)際情況下遷移操作的可執(zhí)行性大打折扣。

另外有一些對(duì)我們自動(dòng)化恢復(fù)流程有利的功能或者設(shè)備已經(jīng)逐步上線到新建機(jī)房,因此可以考慮在這些機(jī)房實(shí)施相關(guān)的自動(dòng)化恢復(fù)方案。比如義橋機(jī)房服務(wù)器已經(jīng)全部配備遠(yuǎn)程管理卡,并且基于ceph存儲(chǔ)作為系統(tǒng)盤+云硬盤的云主機(jī)也已經(jīng)上線到該機(jī)房,這是我們實(shí)施該方案的基礎(chǔ)。基于ceph存儲(chǔ)后端的云主機(jī)在異常恢復(fù)過(guò)程中,沒(méi)有數(shù)據(jù)的拷貝,不會(huì)占用硬盤和網(wǎng)絡(luò)IO,因此恢復(fù)速度較快,可以做到幾秒內(nèi)在正常節(jié)點(diǎn)恢復(fù)運(yùn)行(不包含云主機(jī)操作系統(tǒng)啟動(dòng)時(shí)間),相比現(xiàn)在的直接下線無(wú)法恢復(fù)或者數(shù)小時(shí)的更換硬件耗時(shí),是對(duì)云主機(jī)SLA相當(dāng)大的提升。

需求
保證異常節(jié)點(diǎn)上所有被標(biāo)記為需要恢復(fù)的云主機(jī)、云硬盤資源被正確恢復(fù)(處理過(guò)程中本進(jìn)程退出其他進(jìn)程可以繼續(xù))

把所有被處理的資源記錄在案(資源id、所在節(jié)點(diǎn)、處理時(shí)間、調(diào)用nova/cinder服務(wù)的request-id、處理狀態(tài)等)

保證異常處理服務(wù)本身的高可用

場(chǎng)景
用戶創(chuàng)建云主機(jī)
用戶創(chuàng)建云主機(jī)時(shí)指定宕機(jī)恢復(fù)策略,目前有三種:

null:不做處理,節(jié)點(diǎn)下線之后殘留在數(shù)據(jù)庫(kù)

恢復(fù):在其他正常節(jié)點(diǎn)恢復(fù)重建

刪除:直接刪除

節(jié)點(diǎn)首次異常
首次異常之后要嘗試重啟節(jié)點(diǎn)(上面的云主機(jī)、云硬盤不做特殊處理),但節(jié)點(diǎn)已自動(dòng)重啟的除外,并要分析異常原因,找到原因并可以修復(fù)的軟硬件異常,則不需要記錄到節(jié)點(diǎn)異常次數(shù)中,否則需要記錄在案,用做下次異常時(shí)的處理依據(jù),記錄前未找到原因,但事后找到的,需要從異常記錄中刪除該次記錄。

節(jié)點(diǎn)多次異常
多次異常節(jié)點(diǎn)需要做下線處理(多次異常包含首次異常后重啟失敗的情況),節(jié)點(diǎn)上的云主機(jī)需要根據(jù)創(chuàng)建時(shí)指定的宕機(jī)處理策略來(lái)執(zhí)行相應(yīng)的操作,云硬盤則一律遷移到其他正常服務(wù)的cinder-volume節(jié)點(diǎn)(并不會(huì)實(shí)際的遷移數(shù)據(jù),對(duì)用戶使用沒(méi)有任何影響),處理過(guò)的云主機(jī)、云硬盤要記錄在案,便于事后查驗(yàn)。

方案
本方案只是初步想法,還需要在開(kāi)發(fā)過(guò)程中繼續(xù)完善,尤其是服務(wù)高可用部分,以及與哨兵系統(tǒng)的交互部分,會(huì)對(duì)本服務(wù)的設(shè)計(jì)造成較大影響。

Alt pic

依賴
被恢復(fù)的云主機(jī)需使用ceph啟動(dòng)盤+ceph云硬盤

nova、cinder支持把服務(wù)強(qiáng)制設(shè)置為down狀態(tài)(cinder可選,nova必須支持,否則需要等待超時(shí)變成down才可以執(zhí)行云主機(jī)的宕機(jī)恢復(fù)操作)

哨兵系統(tǒng)異常主動(dòng)通知機(jī)制(建議),或者哨兵系統(tǒng)提供api供我們輪詢節(jié)點(diǎn)狀態(tài)

哨兵系統(tǒng)提供接口可強(qiáng)制重啟和下電節(jié)點(diǎn)

后續(xù)
L3節(jié)點(diǎn)宕機(jī)自動(dòng)化處理流程

動(dòng)態(tài)資源調(diào)度功能:可根據(jù)節(jié)點(diǎn)負(fù)載動(dòng)態(tài)均衡云主機(jī)分布

節(jié)電省成本:可將空閑節(jié)點(diǎn)云主機(jī)遷移之后下電節(jié)點(diǎn)

云硬盤是網(wǎng)易云提供多種硬件介質(zhì)的塊存儲(chǔ)設(shè)備,用戶可以根據(jù)實(shí)際生產(chǎn)環(huán)境,靈活選擇云硬盤類型和規(guī)格大小,彈性地創(chuàng)建、刪除、掛載、卸載、擴(kuò)容云硬盤。

更多網(wǎng)易技術(shù)、產(chǎn)品、運(yùn)營(yíng)經(jīng)驗(yàn)分享請(qǐng)點(diǎn)擊。

文章來(lái)源: 網(wǎng)易云社區(qū)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/25258.html

相關(guān)文章

  • 當(dāng)S8遇上邊緣計(jì)算:談阿里ENS對(duì)直播業(yè)務(wù)場(chǎng)景的支撐

    摘要:阿里云推出的邊緣節(jié)點(diǎn)服務(wù)這個(gè)云產(chǎn)品,就是針對(duì)前面提到的目標(biāo)場(chǎng)景,來(lái)應(yīng)對(duì)客戶自建邊緣設(shè)施遇到的痛點(diǎn)和挑戰(zhàn)的。針對(duì)賽事直播業(yè)務(wù)場(chǎng)景的優(yōu)化阿里云團(tuán)隊(duì)針對(duì)常規(guī)活動(dòng)賽事電競(jìng)直播這一業(yè)務(wù)場(chǎng)景,也做了很多技術(shù)優(yōu)化。 近日,英雄聯(lián)盟S8全球總決賽落下帷幕,中國(guó)戰(zhàn)隊(duì)IG零封FNC奪得冠軍。這場(chǎng)比賽引起了國(guó)內(nèi)網(wǎng)友的超高關(guān)注度,也給直播平臺(tái)帶來(lái)了不小的技術(shù)挑戰(zhàn)。虎牙直播平臺(tái)結(jié)合阿里云邊緣節(jié)點(diǎn)技術(shù)方案,保障了...

    lily_wang 評(píng)論0 收藏0
  • 應(yīng)用平臺(tái)的可用性——從新浪SAE看平臺(tái)設(shè)計(jì)

    摘要:網(wǎng)絡(luò)可用性更多的會(huì)依賴電信運(yùn)營(yíng)商的服務(wù)能力。目前網(wǎng)絡(luò)接入支持電信聯(lián)通教育移動(dòng)等,真正實(shí)現(xiàn)了國(guó)內(nèi)大的運(yùn)營(yíng)商網(wǎng)絡(luò)的覆蓋,這在國(guó)內(nèi)是很罕見(jiàn)的。 一、可用性如何定義 可用性(availability)是關(guān)于系統(tǒng)可供使用時(shí)間的表述,以不可用的時(shí)間為衡量指標(biāo)。不可用時(shí)間越短,可用性越高。通常用n個(gè)9來(lái)描述。比如4個(gè)9的可用性,則是指一年中不可用時(shí)間在52分鐘內(nèi),平均每周不可用時(shí)間在1分鐘。 可靠性...

    yanbingyun1990 評(píng)論0 收藏0
  • 余額寶11.11:基于日志數(shù)據(jù)分析的高效運(yùn)維

    摘要:接下來(lái)我們以余額寶為例,重點(diǎn)剖析天弘基金在日志數(shù)據(jù)分析領(lǐng)域是如何突破的此前,天弘基金一直使用開(kāi)源的日志方案,研發(fā)和運(yùn)維人員通過(guò)對(duì)日志數(shù)據(jù)進(jìn)行處理,使用日志文件進(jìn)行查詢檢索。 雙十一剛剛結(jié)束,其實(shí)最緊張的不是商鋪理貨,也不是網(wǎng)友緊盯大促商品準(zhǔn)備秒殺,而是網(wǎng)購(gòu)幕后的運(yùn)維人員,他們最擔(dān)心:什么網(wǎng)絡(luò)中斷、應(yīng)用卡頓、響應(yīng)速度慢,服務(wù)器宕機(jī)……雙十一作為電商 IT 部門的頭等大事,大促前,運(yùn)維人員就需要...

    wenshi11019 評(píng)論0 收藏0
  • 如烹小蝦: 運(yùn)維動(dòng)化閉環(huán),騰訊是這樣做的

    摘要:我加入了騰訊,騰訊企業(yè)文化很好,經(jīng)常會(huì)有很多小組活動(dòng)部門活動(dòng)什么的,但是做運(yùn)維很苦。所以,年的時(shí)候我們幾個(gè)騰訊的同事一同創(chuàng)業(yè),希望把我們的想法和經(jīng)驗(yàn)?zāi)軌騻鬟f出來(lái)。這里我列出了騰訊互聯(lián)網(wǎng)運(yùn)維團(tuán)隊(duì)所經(jīng)歷的三個(gè)階段。 本文是數(shù)人云深圳技術(shù)分享課上優(yōu)維科技聯(lián)合創(chuàng)始人彭鯉航的演講實(shí)錄,演講主題是《運(yùn)維自動(dòng)化實(shí)踐》。 精彩觀點(diǎn)搶鮮看 實(shí)現(xiàn)運(yùn)維自動(dòng)化閉環(huán),最主要就是配置管理、狀態(tài)管理和變更管理能力。...

    RyanQ 評(píng)論0 收藏0
  • OpenStack虛擬桌面在攜程呼叫中心的應(yīng)用

    摘要:一為什么要使用虛擬云桌面背景攜程呼叫中心,即服務(wù)聯(lián)絡(luò)中心,是攜程的核心部門之一,現(xiàn)有幾萬(wàn)員工。他們?nèi)晷r(shí)為全球攜程用戶提供服務(wù)。為此,攜程正式引入了虛擬云桌面。攜程云桌面現(xiàn)狀攜程云桌面現(xiàn)已部署上海南通如皋合肥信陽(yáng)穆棱六個(gè)呼叫中心。 編者:本文為劉科在第六期【攜程技術(shù)微分享】中的分享內(nèi)容。在攜程技術(shù)中心(微信號(hào)ctriptech)微信后臺(tái)回復(fù)【云桌面】,可加入微信交流群,和關(guān)注云桌面的...

    EsgynChina 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<