摘要:前言本文給大家分享的題目是基于微服務以及的高可用架構探索與實現。比如說年大地震的時候我正好在東京,當時在做一個金融系統的相關工作。那次大地震導致很多很多的問題,雖然大地震不是在東京發生,但是還是給我們的系統造成了影響。
前言
本文給大家分享的題目是《基于DevOps、微服務以及K8S的高可用架構探索與實現》。整個企業的高可用架構面臨很多的挑戰,面向微服務、容器化以及敏態交付,是我們現在的三駕馬車,而今天提到的一個比較接近的概念叫Kubernetes、DevOps和微服務這三駕馬車也能夠幫助企業級應用解決他們傳統的一些問題。
本文給大家分享的主要內容都是從金融和通信領域中的具體案例總結而來,通過這次分享希望對大家能有所借鑒。主要內容包括企業級高可用性架構面臨的挑戰,面臨這些內憂外患的挑戰我們應該怎樣做才能突破這樣的困境,有哪些原則和方法。
然后Kubernetes、DevOps和微服務這三架馬車如何各司其職為我們帶來很好的高可用性架構,以及大家也知道面臨的各種彈性的擴容需求。比如說我們的客戶在517電信日的時候,他們的需求可能是平時業務量的120多倍,這樣的情況下我們怎樣進行彈性擴容,這都是我要跟大家分享的內容。
企業級高可用性架構的挑戰企業級高可用架構面臨哪些挑戰,其實有很多,可能有遇到天災的挑戰。
比如說2011年311大地震的時候我正好在東京,當時在做一個金融系統的相關工作。那次大地震導致很多很多的問題,雖然大地震不是在東京發生,但是還是給我們的系統造成了影響。
當時根據我們的系統和容災備份中心進行合理調整,保證了我們的客戶,因為我們的客戶也是整個亞洲很大的一家銀行,保證他的業務正常運行,這一切都是我們提前需要考慮才能做到的。
除此之外還可能有很多人為的Miss帶來的問題。比如說,我們的一個銀行客戶,誤刪除根目錄,這樣的事情在十年之內發生了兩次,其實只要保證節點的冗余性,就不難解決。
我們說企業級高可用性架構面臨的天災人禍的挑戰,我們怎樣才能保障它。
我們要事前考慮好這些因素。比如說我們可能會有應用程序的異常退出、有操作系統宕機、服務器的宕機、停電、大地震、人為操作失誤、訪問量突然增大,原本是沒有問題的,我們企業是高可用的,但是突然業務擴展了100多倍。
我們在設計時是有一個原則,比如按照10倍設計,按照1.5倍測試,按照1.2倍發布這樣都是可以的。但是突然擴大100多倍我的架構是很難實現的,所以動態擴容也是一個重要的課題。
這些挑戰有這么多,其實我們還可以把整體的變得更加復雜。整個系統非常非常復雜,在整個金融領域當中可以看到復雜的架構比比皆是,復雜到什么程度呢?
舉個簡單的例子,日本超大銀行的核心外匯系統來說,它大概有1500萬行代碼,我們之前還討論過1500萬行代碼是什么量級。2006年我在做松下手機的開發時,總的代碼大概是600萬行,所以是3個手機的量,我們并行編譯需要8小時,有4種操作系統,5種編程語言,倒不是說設計架構時就要變成這樣,是因為很復雜的業務結合在一起就已經是這樣的現狀。
整個這樣的一個系統,怎樣才能保證高可用,我們有很多不同系統的集群,整個結合起來這么復雜、龐大的金融怎樣才能保證整體的可用性,而且我們還要重構。這些給我們帶來都是非常大的挑戰,而且變更越來越多,頻度也越來越大,還要求穩定性,因為我們的客戶都會要求,你又要快又要好。
他們的要求也不過分,但是對于我們的實現來說,這其實是很難的??蛻粲械臅r候說我就改了一個Bug為什么不讓我上線。這么大的架構我全編譯都要8個小時,你改了這一行bug,那編譯的過程你看不見嗎,1500萬行代碼,要編譯3個安卓手機。但是這些客戶不會說,他會說我的同行他們做的就這么快,這都是我們面臨的壓力。
今天我也會給大家舉一些案例,金融我個人接觸的行業中也分為到兩種,有傳統的金融,他們還是以穩為主,今天的一些案例中就是一些穩的,還有一些是快的。所以我們的容器化并不一定都是需要快。
我們講三架馬車,這三架馬車到底怎樣開,開起來穩不穩,怎樣進行擴展,這過程中我們需要注意什么,我們有些實踐,不敢說最好的,但是可以給大家帶來借鑒。
高可用性架構整體設計整個來說高可用有這么多的挑戰,如何進行整體的設計和架構。我這里的話列出了一些簡單的點。
高可用性架構目標我們說一個系統比較好的可用性,我們說它有良好的擴展性,整體是容易維護的,最重要的對客戶來說,我這個系統是隨時用都是可用的,很簡單,我的系統拿出去至少能夠跑起來,客戶能訪問。
所以我們講整體業務的連續性和穩定性,對于我們高可用性架構是最重要的。
我們業界經常說幾個9的目標,我們講99%其實是系統基本可用。99.9%,這個系統是具有高可用性的特點,這是說,我們一年可以有8.8個小時可以把我們的系統停下來。更多來說,比如說銀行,我們更多是做到4個9。這也結合了2017devops現狀調查報告來說,高績效的企業,他的業界banch
mark,平均下來他的MTTR的時間大概在一小時,也就是你的系統停一次,一年大概保4個9,如果停兩次的話,那4個9的高可用就保不住了。
但是我們不一定要我們的系統一定是為了沖幾個9,要看業務需求是否需要達到這個情況。我給客戶做的時候,會跟他說你的高可用目標,為什么先列目標,因為目標定下來后,你的成本就會出現,如果1500萬行代碼全部要4個9或者5個9的,其實我們是做不到的。我們核心的系統、關鍵的領域,甚至是2個9都無所謂。
有一個二八定律,80%的功能客戶基本上很少用,我們做的很復雜的功能,客戶都不用,這也是一個現狀。所以那些東西并不一定要達到4個9的可用性,所以目標設定非常重要。
除此之外,RPO和 RTO,從業務恢復的角度以及數據連續性的角度,對我們高可用性進行整體的規劃。我們國家2007年發布了容災備份相關信息產業的標準,將RPO和RTO分成六級,大家有興趣的可以看一下,其實不同行業在做的時候應該是先定目標,這個成本就出來了,然后再往下做高可用架構的設計,這樣才能往下細分。
比如我們要達到5個9,你一年只有5分鐘,我要這樣做。比如說我們的應用程序突然停了,既然停了把它重啟起來就可以了,無論哪種方式都是這樣的。但是關鍵是你是5個9,一年只有5分鐘怎么辦?你的策略就不一樣,你是不是應該保證兩個方式雙方都能正常運行的時候你再起另外一個。所以整體策略不同,成本也會不同。
高可用策略和手段整體的策略和手段有很多。我們提高可用最重要的一點是冗余。
我們會使用冗余的方式,你的一個application宕了,它要能訪問,那一定是在另一個地方有備份,客戶才會訪問到。如果你的Note也宕了,一定是其他的地方也有備份。我們保證Application在一臺機器上有多重運行,如果這臺機器宕了的話,在另一臺上也有運行,無論是哪種方式,它都是基礎的策略。
除此之外,我們會結合成本,做Active-Standby或Active-Active的方式,然后我們做高可用的架構其實是說,我們的兩臺機器都放上去,一臺機器一直是做一主一備,這對客戶來說成本投入沒有這么好,我看不到收益,所以我們一般做Active-Active雙活。
比如我們做集群是保證節點級別的可用性。我們做服務多重化是保證應用層級的高可用性。我們做容災備份,就像剛才給大家舉的例子,2011年日本大地震,如果我們給客戶沒有做容災備份的東西,他不可能依然能保證在整個過程中是可用的。
雖然是一主一從,但是兩者相互結合還是能保證他的服務正常運行。但是除此之外,還有很多的因素。成本是無處不在。而且我們的客戶也會知道,容災備份中心做成兩活其實是更好,但是成本會發生更大的變化。
另外我們平時的訓練,因為這跟技術無關,但是又非常的重要,因為我看過很多的系統,他們做得都很好,但是為什么他不敢切。
我看過太多很好的系統,但是有的系統我也沒見過,像2015年左右,紐約交易所停了218分鐘,這么龐大的一個系統停了218分鐘,后來我查了原因,他們說是因為技術的原因,后來我就沒看出因為什么技術的原因。
但是我相信他一定會有容災備份的策略,但是為什么不切。實際我接觸過很多企業,他們訓練不到位,導致他們不敢切,切過去OK,切回來怎么辦?可能就會出問題。
除此之外,還有橫向的擴容,我們的波峰來了,我們什么時候才能進行擴容,所以這個時候我們需要考慮。我們講跟DevOps進行結合,我們監控做到我們能夠確定什么時候進行橫向擴容。
比如說DevOps的透明化和我們整體的可視化結合起來,然后這些能夠保證我們系統的高可用性進行很好地對應,這是整體的策略和手段,當然還有很多,我只是列出了這幾個常見且重要的點。
要素和原則我們叫容器化、微服務和DevOps,是我們現在應用容器化的三架馬車可能更敏捷的對應。因為K8S本身就是容器和容器編輯的平臺,可以很好地進行管理。我們使用這三架馬車如何才能保證我們的系統更加可用、方便和靈活。K8S是用什么樣的方式來保證它的高可用性,首先有三個重要的點:
第一點,K8S是以容器化為基礎的,運行在它上面的應該是一些容器,以容器形式存在的這些服務,K8S 平臺保證了這些服務它本身是可用的。我們傳統的,自己寫SOA其實也是一樣的,只是k8s做的更好,它把這些變成透明化了。
第二點,我們保證K8S本身是可用的,因為K8S保證它的集群運行在這之上的服務是ok的,但是同時,怎樣才能保證K8S它也是高可用的,消除這些單點我們也會說到這些。
第三點,當我們業務的波峰來的時候我們如何處理。
然后我們講微服務,微服務為什么要引入,各個企業有自己的想法。我們引入微服務有很多自己的想法,比如要簡化,要解耦,要使我們的服務能夠獨立部署,它要能夠進行整個是無狀態可回滾的,整個來說我們是為了讓容器化變得更加簡單,這些微服務要按照這樣的策略進行設計。
我們講DevOps是怎樣做成橋梁和紐帶在微服務和K8S之間進行溝通。首先我們使用DevOps的理念,微服務的一旦落地,它帶來的好處同時也給我們的部署也帶來有壓力,所以我們如何做持續集成和持續交付,使得這些部署,應微服務帶來的部署這種壓力得到緩解,這是我們Devops實踐需要考慮的事情。
同時,我們通過環境的一致性,通過考慮安全的因素,使我們高可用性在很多方面得到整體的考慮。我們提到DevOps跟K8S自動的可動態的橫向的調整,K8S如何才能知道我們什么時候進行橫向調整。我們需要監控的機制,而我們DevOps的實踐中,我們需要讓整個的過程是透明的,可視的,所以我們通過使我們的系統具有整體監控的能力,讓我們知道什么時候該橫向擴容。
這是一個很簡單的例子,我們說整體的做一主多從的K8S架構的話,可以看出,這就是簡單的K8S的構成。K8S可以做成一主多從,同時我們的ETCD使用集群的方式來保證它的服務OK。消除單點的話就是Master一主多備,這是非常典型的很簡單的思路。無論哪種方式,我們都是要保證它的冗余度得到保證。
如何使得我們的微服務更加專注于業務的開發,我們在與我們的客戶進行實際應用時也使用一些傳統開箱即用的,比如說Spring Cloud等一些組件。幫助他整體的下面的框架基本上就不用再進行開發了。
我們傳統用Tuxedo時,都是要自己寫。突然會發現壓力一下全部減輕了,我們只需要注重業務的開發,突然發現非常順暢。
我們講DevOps他更多地是一種融合,所以我們最佳實踐進行結合,通過自動化流水線,保證了自動部署和自動集成的穩定性。
通過可視化的監控來確認我們什么時候可以動態擴容,通過一致性的環境來保證整個的流程是更加順暢的。
所以這是我們整體的一個架構和思路。在很多的系統之中和客戶進行推薦的時候我們基本上都是用這樣的方式。
Kubernetes的基礎服務下面我們講三架馬車第一架Kubernetes如何提供基礎服務。這些都是Kubernetes的基礎知識,我們可以很容易地得到,但是我們講使用Kubernetes的時候,在整個的架構中起到什么作用,還是剛才提到這三點。
第一點,我們使用Kubernetes的RC或Daemonset這些東西,我們保證了這些服務是可以自愈的,簡單來說就是有人幫我檢測、重啟,這些策略都可以進行調整的。
第二點,Kubernetes本身是需要ETCD和Master始終是可用的,所以我們需要通過具體的策略來保證我們的K8S本身也是可用的,所以這兩點能保證整個集群是OK的。我們Kubernetes提供基礎的平臺和服務,但是如果你的平臺和服務它本身是不穩定的,也是無法達到整個系統高可用的。我們講這個平臺應該比較厚重,同時也要比較穩靠,這是我們需要考慮的,我們實際跟客戶落地的時候,這些點都需要考慮,我列出了其中重要的幾點。
我們消除單點的ETCD。ETCD是CoreOS發布的關于鍵值的分布式數據存儲。在Kubernetes之中,我們使用apiserver跟它進行交互,如果它不穩定,我們數據的保存就沒有保障,所以我們要消除它的單點,那做一個集群就可以了。
我們做一主多備的Master。我們的Active Master一旦壞掉了切到另外一個,很簡單就是冗余,多放兩個在那里,壞了就切過去。理論上來說都非常簡單和單純,但是就用靠這種單純和簡單的方式,就能保證我們的客戶的整體系統比較穩定。
就像在311地震的時候,我們給一個日本的核心銀行的系統,做了一主一從的方式就能保證系統是高可用,所以我們事前需要考慮,同時考慮成本和整體策略,然后給客戶提供一個價錢和其他東西結合的一個方案。
第三點,就是Kubernetes能夠應付現在傳統金融在做動態擴容時很難做到的一點。使用傳統的方式,當客戶想追加節點的時候很困難??蛻粝朐黾右粋€節點時會發現非常困難。
我們傳統的方式做集群的話,我們可以做雙機或者多機,或者是做其它的都可以跑。但是我要加一個節點很困難,大家知道如果我們開始做架構時,上來就是說你使用了Kubernetes這種神器,或者是你程序本身都是容器化的,你就碰不到這種困難。
但是如果你從十幾年前開始做架構,會看到傳統的這種架構一步步怎樣走過來的時候你就會發現,這些真的是很厲害的神器。
為什么傳統金融在往這方面靠的原因,我們加一個Node的時候,做一個雙機集群,我們要自己劃磁盤,自己劃磁盤的仲裁,做心跳線,做設定。雖然做得很快但是也特別費工夫,關鍵的是對客戶來說,你要把這些機器停下,這些是要命的,而且花了很多的錢,而且對于K8S平臺來說這些都是透明的。
這是對客戶來說非常有意義的點。也是我們推它的原因。在使用監控,首先第一步看到整個的趨勢,問題會不會出現警告。同時對我們的動態擴容提供輸入。
對動態擴容提供輸入,我們整個動態擴容怎么做?我們做了簡單的整理。其實一旦你把所有的條件做好,剩下的都非常簡單了。
我們有些通信的客戶可能在波峰的時候可能他的具體的業務量達到平時的一百多倍,這種情況下怎么辦,找到時間點擴容就可以了。
我們還是按照步驟,定義業務、系統資源的指標,在這種情況下擴幾個pod,然后采集數據。那我們怎么知道這些是可以進行擴展的,然后具體的監控是實現說我看系統的日志和業務的日志我們可以擴了。在Kubernetes或Swarm層上面一條命令就可以做到了,這就已經很簡單了。
但是最關鍵的是我們之前需要做的這些,監控怎樣做好,我們給客戶的最佳實際案例是這樣做的,不要上來就開始做這個自動。自動化其實可以做到最后再做,我們要保證整個流程是平穩的。
比如說舉個簡單的例子,我們在金融的系統是這樣做的,我們如果想做什么樣的調整,比如說我要做這樣的動態調整,我會把整個的東西打到日志,把空跑的狀態確認出來,然后根據事后我們進行分析他算錯沒算錯。做完之后,再做動態的擴展,動態擴展相當于一個利器,很好用,但是用壞了也很危險,在具體實踐的時候,我們跟客戶實踐了以后才會做。
如果Kubernetes提供了這樣一個基礎服務,微服務就很輕松了。比如說我們傳統在做Tuxedo架構的時候,我們做微服務的自動重啟,壞掉了怎么辦?如果使用自己的SOA架構,你在里面寫循環,你自己總不能啟自己,需要有一個守護進程在后面做,守護進程宕了怎么辦?因為企業級高可用架構,尤其是銀行不可能像目前初創公司的做法,他要求他的系統一定是非常穩定的,你守護進程壞掉我也得保證,所以我們一般會再寫一個,再壞了怎么辦,沒完沒了的,所以那個要靠監控來做。
你要使用Tuxedo的話,就很簡單,在里面設定一個什么時候這個Sever等于Y,這個架構基本可以保證服務的多重化或者節點之間的控制。但是有一個很不好做的東西時什么呢。這是一個整體的SOA架構,你要進行全部編譯,這意味著你做服務動態調整要通過編譯來做,這就很麻煩了。這個相對于Kubernetes的方式很不靈活。
專注于業務實現的微服務架構使用了Kubernetes這種方式后,就會更加靈活,使我們的服務專注于服務的架構開發。
即使是這樣,我們依然有很多的東西需要考慮,我們為什么進行微服務的設計和架構,這有很多很多的痛點。
就是說我們大型的系統一旦出來,就像多米諾骨牌一樣,你拉其中的一塊,就會整個轟塌。以我十幾年的工程師經驗,這個過程是非常痛苦的,痛苦的人都知道怎么來的。
我只改了一行代碼,為什么整個程序宕了,整個應用毀了,這種情況會出現的。因為隨著年久失修,這些大型的系統,它會成為巨石一樣存在,誰都不敢改,改起來成本又非常大,維護的成本也非常高。
我接觸過很多大型項目,跟他們一起做他們做得非常優秀,但是即使這么優秀的企業我們還是發現了很多有意思的事情。
比如說當年Alpha推出市場的時候,原本在Alpha上運行的話我們轉到Hpux上,當然有一部分跑到了IBM的AIX上,但是無論你跑在哪種上面,如果有C這種通過編譯型語言的話,你要進行重新編譯和優化。
一個很有趣的規律就是超過百萬行級的代碼我們都會發現非常低級的bug,不管系統多么優秀。有一條到現在沒破,我們知道像C這種父子語句和判斷語句肯定會有用混的,If寫成父子語句的,有專門的把兩行寫成一行,就是為了省一行空間的寫法也有。我們明明確確的根據上下文判斷就是一個進或不進,改不改。這就陷入兩難,因為它有上百萬的代碼。
一個工程師我只負責以前在Alpha上面跑,現在在Hpux上跑,你們不是跟我說,我只是換一個機器,剩下都OK嗎,為什么不OK了?所以我們不敢改,因為很多時候時錯錯得正,你改了這個地方其它地方還有一個錯,最后結果正確的我怎么知道。
這個難點在于,還是整個的耦合度沒有拆分,這種情況下如果你的功能很小的話那就很好辦了。如果部署能夠獨立化,解耦做得很好,簡化做得很好,規模又小型化,這樣我們知道這塊影響到哪兒,大不了我把它重新用backup運行。我知道它影響到哪個地方,只有不知道,我們才害怕,而且不知道可能真會出現各種問題。
所以這個才是我們實際與企業級客戶在推的時候遇到的問題,企業級用戶痛點也在這里,因為客戶很多時候就問我,我改一行代碼為什么要花這么長的時間,我跟他說一天為什么花這么長的時間。確實要花這么長時間,因為你系統太復雜了。我們解耦以后可以治這個病,但是整個的過程也會帶來其他的問題。所以我們整個過程需要進行考慮。
我們使用Spring Cloud,可以使我們過程中更加方便。通過適當冗余,使用多個Eureka服務端,這樣就能保證保證服務注冊不會停止。如果我們做Tuxedo的架構話要自己寫,我們使用Eureka就更加方便。
我們還要考慮負載均衡,像Ribbon這種客戶端。我想大家做過SOA開發,對這種策略都不難進行,就是有所反饋。比如說我們就講,我壞了應該怎樣重啟,要加權、隨機要重啟,這臺壞掉了我看另外一臺機器有幾個,跑在另外一臺機器上,自己寫這個很痛苦的。這些如果使用了開箱即用的東西會整體地加快我們的速度。
除此以外還有很多,我再列舉一個配置中心。我為什么提它呢。我們講三架馬車,最終一架是DevOps,像Spring Cloud也好,我們推DevOps時,我們推薦使用一套的部署機制,你不同的環境可以通過不同的配置來實現,我們認為Spring Cloud是它對DevOps的一種微服務發布方式,我們通過整體的具體實踐進行結合使得發布更加方便和順暢,更多地是與DevOps進行結合。
有這樣的東西開箱即用,對于微服務,我們就很容易寫我們的SQL語句,實現業務邏輯,就會非常簡單,實際在使用的時候,尤其是容器化的過程中IP會變來變去,這些問題都會帶來困難的點。但是想想你要從零開始創建這些東西,它的成本是值得的。雖然有些人說你沒辦法做這些東西,但是你看看傳統企業痛苦的程度。
DevOps助力全生命周期的高可用性我們講DevOps能夠在其中起到橋梁和紐帶的作用,輔助我們三架馬車,容器化的服務能夠更好的落地實踐。具體地有哪些點,我列出了這樣一些點。
環境一致性我們強調開發和測試環境、生產環境的一致性。因為開發環境,經常會有不同環境的開發,可能會帶來很多的問題。測試環境的話,由于測試和開發環境的不同也會帶來問題,比如說你測試的代碼和開發的版本不一樣,這些不必要的消費都會帶來不必要的時間。
所以這些都是需要我們考慮的,另外我們引入安全掃描的機制。因為2015年左右我看過一個研究,對于Docker Hub上面的鏡像進行分析,大概有30%-40%的鏡像是不安全的。
從今年開始Docker也是在最貴的那版里面引入鏡像掃描的機制,同時CoreOS也提出了Clair,所以建議大家有空回去下一個,像Clair這樣的東西對你的鏡像掃描一下。
2014年的Heartbleed大家印象很深刻,那個心臟流血的,那個一直在流血,心臟就會失血而死亡,你可能就要搭橋,所有的買單都是企業級的客戶來做,它要為你對安全的忽視來買單,這一切有可能是我們不能承受的,因為它在心臟上。我建議大家一定要下這樣的東西看一下到底有多少的CVE。
然后生產環境保持一致性,這是理想的,但至少要達到 Infrastructure as Code。這考慮到什么呢,如果你的生產環境的一個節點突然壞掉怎么辦?尤其是那些年久失修的系統,客戶說給你拿一個機器給我立即換上,這是很簡單的事情,那有太多的手工作業,你把這些手工作業全部都變成代碼放到你的SVN或Git上,一定要這樣做,我們在推這樣的實踐過程中也碰到很多的慣性的阻力,但是我們認為這樣的實踐很重要。
可定制流水線
我們講可定制的流水線是非常重要的,安全檢查也非常重要??梢远ㄖ频?,可以提高我們CI/CD的流水線??梢允褂瞄_源的工具,也可以使用商用的工具。根據DORA調查,你使用可定制的話可以帶來更好的效果。
監控,可以使得彈性擴容更加容易。
我們的一些客戶,我們平時的業務量跟波峰的業務量相比是1%甚至更多,這種情況下怎么辦?
彈性擴容需求下的高可用性我們講的三架馬車每塊需要做什么事情,在容器化的基礎之上進行解耦和優化,同時DevOps要監控、判斷,同時最重要的一點,我們要強調一下DevOps我們提倡的理念是Fail Fast,我個人認為這不是為了讓我們die fast,你要做好我們的Plan B,我們recover plan,如果一旦失敗了怎么辦,如果事前不想好那真的有可能die fast。
所以我們提倡跟客戶說你要Fail Fast,要戴好安全帶,這點非常重要。根據DORA的調查,2017比2016年相比,我們的速度得到了明顯的提高,但是那些低績效的企業,他們在MTTR的修復時間比去年還要惡劣,這為什么?快了但是沒考慮穩。
我們使用K8S能夠很容易的進行橫向擴展。具體的策略,通過確定交易的指標和資源使用情況,確認什么時候進行水平擴容,取一下業務日志和系統日志進行監控和計算然后告訴K8S擴容它就擴容,就是這么簡單,但是實際應用的時候有很多的項,你在這個過程要保證安全,穩定地擴容。
我們通過應用的多重啟動,來保證應用的可靠。Front office和back office 進行前端的業務和后端的審批,這都非常常見,大部分都執行這樣的做法。
另外,我們過去傳統來做,可以看到整體的集群非常復雜,你有文件集群、應用集群、認證集群、RAC集群。而且這些資源相互之間協調非常痛苦,如果你出了問題了,依然有很大程度的可用性。
但全壞掉了,我們通過什么辦法。通過共享存儲和網絡結合起來,跟容災備份中心結合起來,它的數據一旦過去之后,另外一套系統結合起來,可以使它能夠保證數據中心級別的可用性。
應用級別可用性,節點級別的可用性以及數據中心級別的可用性,我們都能達到。同時,這種傳統的問題點,客戶也問過我這個問題,他說,我加一個node,你們為什么花我這么多錢。
有一次,我們跟他說應用級別的資源不夠了,加一個resource吧,他的文件集群依然有resource,你告訴我應用集群不夠了,你用它的不好嗎。我說,作為一個工程師來說,這個很難。他說我不管為什么難,我只看到我的系統,它依然有一部分是閑的,你沒有做到。它做不到并不表示其他做不到,比如K8S就可以做到。
案例 2這是一個典型的案例,是跟我們通信領域的一個客戶做的在PaaS平臺上運行微服務的架構。我們也實現了多Kubernetes集群的狀態下,我們的雙中心的這樣一個應用。雙中心雙活,整體的話與剛才那個例子相比是有優點的。同時我們講我們實現了按需擴容,怎樣進行按需擴容,其實就是監控,監控的過程中注意安全,我們定期對客戶安全進行掃描。希望大家注重安全,不要認為官方鏡像的就很可靠。
我們會根據我們業務的,比如說我們達到300單/每秒業務的要求就會擴容。你CPU連續超過一段時間都超過了75%,那好生成一個Pod。很簡單,所有這一切源于需求。我們剛剛提到了517電信日,訂單的業務量增加126倍;京東618訂單量也相當于平時10倍,這些都是給我們傳統方式帶來挑戰的。像剛才金融的方式,就很難解決這個問題。
我們可以看到在應用級別的可用性,以及節點級別的可用性和數據中心的可用性,我們都可以以簡單的例子進行分享。其實我們與電信客戶做了很多的設計,跟金融的也有很多,今天舉出這兩個例子,主要是讓大家進行對比。很多時候,我們在進行一個轉型,轉型的過程中怎樣進行參照和思考,這是我今天給大家帶來的分享的主要內容。
轉載網址:https://mp.weixin.qq.com/s/7L...
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/33018.html
摘要:本文是網易容器云平臺的微服務化實踐系列文章的第一篇。網易容器云平臺的前身是網易應用自動部署平臺,它能夠利用云提供的基礎設施,實現包括構建和部署一體化在內的整個應用生命周期管理。目前網易云容器服務團隊以的方式管理著微服務,每周構建部署次數。 此文已由作者馮常健授權網易云社區發布。 歡迎訪問網易云社區,了解更多網易技術產品運營經驗。 摘要:網易云容器平臺期望能給實施了微服務架構的團隊提供完...
摘要:王磊此次演講的題目為容器新技術架構下的運維實踐,詳細為大家講解了在基于構建容器的過程中,如何以應用為中心,通過新的技術工具對服務節點集群平臺等多個方面進行管理運維,提高系統的自動化運維能力。 2018年11月16-17日,運維&容器技術盛會 CNUTCon 全球運維技術大會在上?!す獯髸怪行某晒εe辦。時速云聯合創始人兼 CTO 王磊受邀參加此次大會,并發表主題演講。王磊此次演講的題目...
摘要:由于,容器任務被簡化,包括部署操作水平自動伸縮滾動更新金絲雀部署和管理監視資源應用健康檢查調試應用等。支持和培訓當企業準備應用容器化戰略時,管理平臺提供商是否向企業保證的支持以及培訓在所有可用的選擇中,只有少數的一些公司,如支持了這些選項。 作為時下最火熱的熱點詞匯:Kubernetes,其擁有成熟的社區,大公司的背景等等獲得了大部分人的認可,很多公司都在準備啟用Kubernetes,...
摘要:此文已由作者劉超授權網易云社區發布。五更加適合微服務和的設計好了,說了本身,接下來說說的理念設計,為什么這么適合微服務。相關閱讀為什么天然適合微服務為什么天然適合微服務為什么天然適合微服務文章來源網易云社區 此文已由作者劉超授權網易云社區發布。 歡迎訪問網易云社區,了解更多網易技術產品運營經驗 四、Kubernetes 本身就是微服務架構 基于上面這十個設計要點,我們再回來看 Kube...
摘要:華為云華為云在云原生這場游戲中,最具競爭力的玩家之一。年,金山云在云原生領域推出了三款重磅產品星曜裸金屬服務器云服務器和云盤。在線上智博會上,浪潮云發布了經過全新迭代升級的浪潮云,進一步提升平臺云原生服務能力。面對數字時代復雜系統的不確定性,傳統的 IT 應用架構研發交付周期長、維護成本高、創新升級難,煙囪式架構,開放性差、組件復用度低,這些都成為了企業業務快速增長的瓶頸。而云原生以其敏捷、...
閱讀 1890·2021-11-11 16:55
閱讀 2094·2021-10-08 10:13
閱讀 751·2019-08-30 11:01
閱讀 2161·2019-08-29 13:19
閱讀 3288·2019-08-28 18:18
閱讀 2626·2019-08-26 13:26
閱讀 585·2019-08-26 11:40
閱讀 1877·2019-08-23 17:17