摘要:如果我們可以從上個月發生的停用事件中得到一個教訓的話,那么我想應該就是云計算故障總是會發生的。宕機事件放大了云計算的重要性在六月發生的兩次宕機事件都是由電氣故障引起的。
如果我們可以從上個月發生的AWS停用事件中得到一個教訓的話,那么我想應該就是“云計算故障總是會發生的”。IT專業人士以及其他的專家均表示,如果你希望在發生故障事件時你可以迅速作出反應,那么你較好事先就做好應對計劃。
根據不同應用程序和數據的不同重要等級,那些應對計劃包括在客戶自己的數據中心中運行冗余服務器,或使用多個云計算供應商來建立網絡。
時刻做好發生故障的準備,LiveFamily的創始人和CTO David Blinder說,LiveFamily是一個從事家譜研究的Facebook應用程序,同時也是位于華盛頓州Bellevue Intelius公司的一個部門。
在Amazon網絡服務(AWS)基礎設施上運行的LiveFamily在六月中受到了兩次停用事件的影響,雖然其危害并不是災難性的。這部分是因 為該公司使用了RightScale公司的云計算管理包,如果情況需要而且用戶愿意支付費用,該產品可重新分配路由和網絡流量至不同的云計算供應商。
但是,提供高層次彈性功能并不是免費。專家提醒說,客戶需要自行決定哪些應用程序是真正關鍵重要的。
IBM公司的業務連續性和彈性服務組向他們的潛在客戶進行了一次調查,內容就是在建立托管服務前哪些應用程序是關鍵,IBM公司的杰出工程師Rich Cocchiara說。
“讓我們確定你需要擁有的服務等級,為你提供你所需要服務種類的服務等級對象和協議,”Cocchiara說?!绊槺阏f一句,并不是所有的業務流程和應用程序都是一樣的。”
保護系統停用可以非常簡單,就如同在客戶的數據中心中保持私有云計算設備?;蛘?,它可能需要在不同的AWS可用性區域設立鏡像站點;它也可能很復雜,如運行多個云計算平臺。
“我們確實曾受到影響,但是我們的緩沖系統通過在發生問題時切換回本地處理與存儲基礎設施而挽救了我們,”匹茲堡LAN聯盟主席Colin Dean說,這是一個舉辦視頻游戲運動賽事的組織?!坝心撤N故障安全的考慮是理想的,即在發生故障時,把你的網站轉至備用?!?/p>
AWS宕機事件放大了云計算的重要性
AWS在六月發生的兩次宕機事件都是由電氣故障引起的。第二次停用事件源于東海岸發生的大規模雷電天氣所引發電氣備用系統發生不可事先預見的故障。停用事件也對公司位于美國東1區的可用區域之一造成了影響,該區域是AWS較大的一個,其中至少有10個數據中心。
在6月29日至6月30日晚上的幾個小時中,諸如Pinterest、Netflix以及Instagram等大量的大型網站都不可用。
此外,宕機事件也造成了AWS“控制面板”的崩潰問題——這也使問題進一步惡化。
就公司本身而言,Amazon已表示,公司將重新認證或更換未能正常運行的備用發電設備,同時調整硬件參數,如在切換發動機電源前等待多長時間以便于電源波動穩定下來。
AWS表示,這次發生的宕機事件并未影響“顯著”數量的客戶,雖然只有一個基于云計算的交友網站表示,受停用事件影響它將更換云計算供應商。
AWS沒有透露有多少客戶或用戶受到了宕機事件的影響。
LiveFamily有幸提前做好了應急預案,并在發生問題時成功地在不同的可用區域中運行AWS實例,雖然問題的發生是情有可原的,但是我們“確實受到了影響”,Blinder說。
RightScale云計算管理:Opscode Chef簡化恢復任務
除了提供其他的云計算自動化功能,包括RightScale公司的云計算管理以及其他諸如Opscode公司的Chef在內的產品可以有助于簡化客戶從停用事件恢復的操作任務。
“故障總是會發生的,”位于西雅圖Opscode公司的CCO和共同創始人Jesse Robbins說,Opscode公司主要致力于Chef云計算基礎設施自動化產品。
與RightScale類似,Chef支持多種云計算平臺,其中包括AWS、OpenStack、微軟公司的Window Azure,同時該公司剛剛宣布支持Google公司的計算引擎。
“如Chef這樣的工具可幫助你在發生故障時自動轉換至另一個云計算供應商或為你提供自己的云計算,”Robbins補充道。“如果你的前期準備工作做得充分,那么發生故障僅僅只是一次意外事件,一次緊急事件,而非一場災難?!?/p>
Jeremy Przygode是位于洛杉磯Stratalux公司的共同創始人和CEO,AWS的經銷商,Opscode的客戶。提供基于云計算技術管理服務的 Stratalux公司也有部分客戶受到了六月下旬發生的停用事件的影響,但是公司處理事件顯得從容不迫?!皢栴}發生了,”Przygode說。
運行多個云計算:復雜卻有效
對于那些真正無法承受停機時間的客戶來說,諸如RightScale、Opscode以及其他供應商提供的工具可使客戶運行多個云計算,但是這種做法是比較復雜的。
“這真的很難做到,”位于康涅狄格州斯坦福德的Gartner研究公司首席分析師Kyle Hilgendorf說,“你必須在另一個供應商那里保留一個確切應用程序棧的鏡像副本,然后你必須弄清楚如果其中一個發生故障時你該如何應對故障,切換至正常的云計算供應商。”
事實上,很多專家都認為,在云計算中實施關鍵任務應用程序實際上可有助于防止停用事件。
“我的專業背景告訴我,云計算是防止這些類型停用事件的工具,即提供某些客戶用戶之前不曾擁有過的某些功能,”IBM公司的Cocchiara說。
“因此,云計算不僅實現了價格實惠,而且因為它依賴于多個云計算中心,從而賦予用戶們決定他們應采取何種風險水平的能力,”Cocchiara補充道。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/3654.html
摘要:宕機事件放大了云計算的重要性在六月發生的兩次宕機事件都是由電氣故障引起的。因此,云計算不僅實現了價格實惠,而且因為它依賴于多個云計算中心,從而賦予用戶們決定他們應采取何種風險水平的能力,補充道。 如果我們可以從上個月發生的AWS停用事件中得到一個教訓的話,那么我想應該就是云計算故障總是會發生的。IT專業人士以及其他的專家均表示,如果你希望在發生故障事件時你可以迅速作出反應,那么你較好事先就做...
摘要:相比較微博的服務中斷,來自金融業的服務中斷所造成的影響和損失都要大很多。那么,在新的云計算時代,企業如何以更低的成本更低的門檻建立屬于自己的新型多活系統正在成為一個新命題。近期,娛樂圈的百瓜齊放也讓微博遭受了前所未有的飽和瓜擊,微博的服務沒有像之前那樣,流量一旦直線上升就會出現宕機問題,的確有了不小的提升。但這并不意味著類似的宕機和服務中斷問題就不多。在過去幾年間,業界排名靠前的云計算廠商們...
摘要:負載均衡服務一般都會有內外網隔離健康檢查等功能,從而提高系統的安全性和可用性。很多負載均衡服務還會提供多支持,支持跨的高可用和后端部署。 歡迎訪問網易云社區,了解更多網易技術產品運營經驗。 一個互聯網產品在搭建服務時可能經常會遇到以下困境:搭建的單節點 web服務性能和可靠性都無法達到要求,節點掛掉=服務異常;直接使用外網提供服務,經常會擔心被人攻破,且公司運維團隊水平較低,一不小心...
摘要:演講嘉賓簡介蔡松露子嘉,阿里云云數據庫總架構師,主要負責阿里云技術以及阿里云數據庫整體架構等工作。也就是說以上的四點只是達到了云原生數據庫的門檻值,還并不代表是這一個云原生的數據庫。 摘要:POLARDB是阿里云ApsaraDB數據庫團隊研發的基于云計算架構的下一代關系型數據庫,其最大的特色是計算節點與存儲節點分離,借助優秀的RDMA網絡以及最新的塊存儲技術。POLARDB不但滿足了公...
閱讀 728·2023-04-25 20:32
閱讀 2287·2021-11-24 10:27
閱讀 4532·2021-09-29 09:47
閱讀 2251·2021-09-28 09:36
閱讀 3648·2021-09-22 15:27
閱讀 2768·2019-08-30 15:54
閱讀 380·2019-08-30 11:06
閱讀 1278·2019-08-30 10:58