摘要:王磊此次演講的題目為容器新技術(shù)架構(gòu)下的運(yùn)維實(shí)踐,詳細(xì)為大家講解了在基于構(gòu)建容器的過程中,如何以應(yīng)用為中心,通過新的技術(shù)工具對服務(wù)節(jié)點(diǎn)集群平臺等多個方面進(jìn)行管理運(yùn)維,提高系統(tǒng)的自動化運(yùn)維能力。
2018年11月16-17日,運(yùn)維&容器技術(shù)盛會 CNUTCon 全球運(yùn)維技術(shù)大會在上海·光大會展中心成功舉辦。時速云聯(lián)合創(chuàng)始人兼 CTO 王磊受邀參加此次大會,并發(fā)表主題演講。
王磊此次演講的題目為《容器PaaS 新技術(shù)架構(gòu)下的運(yùn)維實(shí)踐》,詳細(xì)為大家講解了在基于 Docker +Kubernetes 構(gòu)建容器 PaaS 的過程中,如何以應(yīng)用為中心,通過新的技術(shù)、工具對服務(wù)、節(jié)點(diǎn)、集群、平臺等多個方面進(jìn)行管理運(yùn)維,提高系統(tǒng)的自動化運(yùn)維能力。同時結(jié)合基于容器PaaS 構(gòu)建 DevOps、微服務(wù)產(chǎn)品的實(shí)踐經(jīng)驗(yàn),分享如何在簡化DevOps 工具和微服務(wù)框架本身的同時,提高其可用性和簡化運(yùn)維管理的成本。
王磊認(rèn)為,隨著容器技術(shù)的普及落地,容器 PaaS 平臺成為了企業(yè)云計(jì)算戰(zhàn)略或云平臺建設(shè)中不可或缺的部分;同時,容器技術(shù)也推動了DevOps 和微服務(wù)的逐步標(biāo)準(zhǔn)化和深入發(fā)展,容器 PaaS已經(jīng)成為這些新理念、新技術(shù)、新框架的理想支撐平臺。但在容器 PaaS 新技術(shù)架構(gòu)落地過程中,企業(yè)和運(yùn)維人員還面臨著如下挑戰(zhàn):
新技術(shù)、新理念帶來的學(xué)習(xí)成本
技術(shù)生態(tài)的飛速發(fā)展帶來的復(fù)雜性以及如何保證其穩(wěn)定性
管理高密度、快速變化的運(yùn)行時環(huán)境的復(fù)雜性
如何在新技術(shù)架構(gòu)下提高自由度和創(chuàng)新能力
如何進(jìn)行跨中心的開發(fā)協(xié)作 – DevOps
微服務(wù)架構(gòu)下的平臺支撐及運(yùn)維
我們先來看一下基于 Kubernetes 的容器 PaaS 平臺有哪些運(yùn)維的主要方式,這里從用戶服務(wù)、節(jié)點(diǎn)、集群、平臺自身運(yùn)維幾個角度分別介紹。
用戶服務(wù)運(yùn)維的手段,主要包含以下幾點(diǎn):
所在節(jié)點(diǎn)故障,自動遷移 - 設(shè)置合適的驅(qū)趕時間
設(shè)置探針,防止容器中服務(wù)無響應(yīng)時帶來的故障
合理設(shè)置探針各項(xiàng)參數(shù),滾動升級時保障服務(wù)不中斷
使用PodDisruptionBudget服務(wù)可用性、PodSecurityPolicy安全性、定義 PriorityClass優(yōu)先級
通過服務(wù)分布及各項(xiàng)資源使用情況,打散熱點(diǎn)進(jìn)行重新調(diào)度
根據(jù)服務(wù)的狀態(tài)、重啟次數(shù)等數(shù)據(jù)及持續(xù)時間告警
根據(jù)服務(wù)日志匹配策略、頻率告警
結(jié)合 ConfigMap與 gitlab的配置版本控制
把調(diào)試工具交給用戶
服務(wù)操作審計(jì)、事件統(tǒng)一管理
同時對于數(shù)據(jù)中間件的支撐,可以通過 CRD 和自定義 operator 的方式來對不同的中間件集群進(jìn)行部署運(yùn)維等操作。包括集群的創(chuàng)建維護(hù),數(shù)據(jù)的備份恢復(fù),存儲的擴(kuò)容等,都可以通過不同的 CRD 及 controller 的方式進(jìn)行實(shí)現(xiàn),既要保證服務(wù)的可用性,又要保證數(shù)據(jù)的安全性。
集群節(jié)點(diǎn)的運(yùn)維,可以從以下幾點(diǎn)考慮并靈活運(yùn)用:
主要資源指標(biāo)監(jiān)控、告警
Node affinity /taint
鏡像、容器gc 策略
擴(kuò)展節(jié)點(diǎn)設(shè)備類型- ListAndWatch / Allocate
節(jié)點(diǎn)維護(hù)狀態(tài)
時間同步
節(jié)點(diǎn)故障、自定義 agent 上報(bào)異常情況
節(jié)點(diǎn)資源不足時的處理
驅(qū)趕策略 節(jié)點(diǎn) OOM 行為 最佳實(shí)踐(預(yù)留資源、服務(wù)QoS、DaemonSet)
對于 Kubernetes 集群的運(yùn)維,主要從集群高可用、聯(lián)邦集群、資源管理、配額管理,集群的運(yùn)維工具、清理工具等方面進(jìn)行了介紹。同時,在不同的底層 IaaS 平臺基礎(chǔ)上,還可以充分發(fā)揮 IaaS 的一些能力來簡化或者改善容器 PaaS 的運(yùn)維工作。隨著 Kubernetes 自身的快速迭代,升級也就成了不得不考慮的一方面,目前我們提供兩種升級路徑,in-place或者 data migration,分別適合小版本升級和跨度較大的版本升級。
同時,對于整個平臺的監(jiān)控、運(yùn)維,我們開發(fā)了一個獨(dú)立的、易于部署的監(jiān)控平臺,用來對開發(fā)測試鏡像倉庫,生產(chǎn)鏡像倉庫、PaaS 平臺、各類 API 服務(wù)、K8s 集群及其核心組件、各節(jié)點(diǎn)組件等進(jìn)行統(tǒng)一狀態(tài)收集,可以監(jiān)控相關(guān)服務(wù)的狀態(tài),也可以對歷史狀態(tài)和異常情況進(jìn)行回溯,從整體上考量每個組件的服務(wù)質(zhì)量。
對于平臺的運(yùn)維,當(dāng)然也要考慮到對數(shù)據(jù)的備份和恢復(fù),以便在某些場景下對數(shù)據(jù)進(jìn)行回滾操作。我們的容器 PaaS 上也提供了平臺、集群相關(guān)的數(shù)據(jù)定時備份及恢復(fù)管理,可以把平臺的 MySQL 數(shù)據(jù)及每個集群的 etcd 數(shù)據(jù)進(jìn)行統(tǒng)一管理,也允許接入自定義備份源,實(shí)現(xiàn)對數(shù)據(jù)的統(tǒng)一管理。
接下來,介紹一下我們?nèi)绾位?Kubernetes 構(gòu)建自己的 DevOps 平臺。首先說一下時速云對自己的 DevOps 平臺的期望:
可以更簡單的同其它 DevOps 或者第三方工具集成
用戶的 DevOps 需求比較多樣,需要有更好的定制能力
更容易安裝、運(yùn)維、擴(kuò)展和伸縮
減少客戶和公司內(nèi)部的學(xué)習(xí)成本
同 PaaS 平臺保持一致的用戶體驗(yàn)和數(shù)據(jù)一致性,充分發(fā)揮 PaaS 平臺已有的能力
幫助自己的 PaaS 和微服務(wù)治理產(chǎn)品實(shí)現(xiàn)更好的 DevOps 能力
整體 DevOps 平臺的基本架構(gòu)如下,通過自定義 CRD 和 operator 來對構(gòu)建任務(wù)進(jìn)行管理,日志的收集、監(jiān)控告警、節(jié)點(diǎn)管理、構(gòu)建資源的伸縮、配額管理、權(quán)限控制都可以同PaaS 層的能力相一致,同時可以利用 PaaS 上的 Pod、Job、CronJob、Volume、ConfigMap、Secret 等諸多資源的能力,在持續(xù)集成、持續(xù)交付、持續(xù)部署等方面進(jìn)行創(chuàng)新。未來 PaaS 層的新功能、功能改善,都可以直接適用于 DevOps 平臺,大大降低了 DevOps 的開發(fā)和運(yùn)維成本。
接著,我們來看一下如何在 DevOps平臺上實(shí)現(xiàn) CI/CD的一些例子:
實(shí)現(xiàn) docker 鏡像的構(gòu)建
如何對構(gòu)建中的產(chǎn)出物進(jìn)行管理(war 包、jar 包等)
實(shí)現(xiàn) Gitlab/Jenkins/Sonar 等工具的集成
人工審核任務(wù)
實(shí)現(xiàn) Gitlab/Harbor/Jira 等工具的集成
最后,再分享一下如何在容器 PaaS 的新技術(shù)平臺上更好的支撐位服務(wù)治理框架。主要包括如何對跨部門、跨中心的微服務(wù)協(xié)同開發(fā)進(jìn)行支撐,如何減少微服務(wù)框架和 PaaS 平臺之間的能力沖突,使彼此更好的融合。
在 Spring Cloud 和 K8s融合方面,可以使用 Spring Cloud開源的依賴項(xiàng)目,使用 K8s自身的服務(wù)發(fā)現(xiàn)、配置管理等相關(guān)能力;同時為了方便管理運(yùn)維,我們將 Zuul 的路由配置使用數(shù)據(jù)庫進(jìn)行持久化,將 Zipkin 的調(diào)用鏈數(shù)據(jù)和 Hystrix 的熔斷監(jiān)控?cái)?shù)據(jù)分別進(jìn)行了持久化,以便隨時對歷史數(shù)據(jù)進(jìn)行回溯;也可以直接在微服務(wù)治理平臺上動態(tài)配置熔斷策略或者開啟降級操作。
在 Dubbo 和 K8s 融合方面,我們在 K8s 上進(jìn)行了擴(kuò)展,并對 Dubbo 的依賴包進(jìn)行定制,替換了 zookeeper,使用 k8s 作為服務(wù)發(fā)現(xiàn)和注冊中心,并支持 dubbo consumer 和 provider 之間通過 K8s 的 service 或者 pod ip 進(jìn)行通信,用戶可以根據(jù)自己的需求選擇使用服務(wù)端負(fù)載均衡還是 Dubbo 的客戶端負(fù)載均衡。
綜上,我們一直致力于打造具備可靠、簡單、自動化、集成擴(kuò)展、協(xié)作等特點(diǎn)的容器PaaS、DevOps 和微服務(wù)治理平臺,希望可以讓用戶更快捷、安全的進(jìn)行云原生應(yīng)用的實(shí)踐與創(chuàng)新,未來我們也會繼續(xù)在自動化、智能化運(yùn)維以及引入適合于 容器 PaaS 的 ChatOps 上繼續(xù)自己的努力。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/32759.html
摘要:在谷歌不是這樣,谷歌不會把特定的應(yīng)用裝在某臺服務(wù)器上,業(yè)務(wù)應(yīng)用和服務(wù)器的強(qiáng)綁定對于谷歌這種量級的數(shù)據(jù)中心的維護(hù)難度太高了。但是金融機(jī)構(gòu)的數(shù)據(jù)中心規(guī)模不像谷歌這么大,所以能做到業(yè)務(wù)應(yīng)用和硬件的強(qiáng)綁定。 復(fù)雜的基礎(chǔ)IT架構(gòu)是傳統(tǒng)金融的現(xiàn)狀,如何快速響應(yīng)用戶需求,加快新業(yè)務(wù)上線速度,縮短產(chǎn)品的迭代周期? 數(shù)人云在容器落地金融云的2年實(shí)踐中,實(shí)現(xiàn)金融核心業(yè)務(wù)技術(shù)WebLogic、J2EE、Or...
摘要:年對于中國保險(xiǎn)來說,是非常特殊的一年。從保險(xiǎn)業(yè)確定改革開放至今,已經(jīng)過去了整整三十年。太平集團(tuán)是國內(nèi)第一家在境外上市的中資保險(xiǎn)企業(yè),也是唯一一家管理總部設(shè)立在香港的中管金融保險(xiǎn)集團(tuán)。2018 年對于中國保險(xiǎn)來說,是非常特殊的一年。從保險(xiǎn)業(yè)確定改革開放至今,已經(jīng)過去了整整三十年。在這個行業(yè)三十而立的今天,回溯過往的三十年,中國的保險(xiǎn)業(yè)經(jīng)歷了緩慢發(fā)展期、平穩(wěn)期、復(fù)蘇期到快速發(fā)展期。經(jīng)濟(jì)轉(zhuǎn)型和互聯(lián)...
摘要:具體技術(shù)細(xì)節(jié)的補(bǔ)充中國人壽兩朵云的最底層的容器調(diào)度與管理都是使用了平臺。決定采納容器擁抱,對整個中國人壽而言都是一次重大的變革。對中國人壽這樣的傳統(tǒng)金融企業(yè)而言,上一個并不容易。 6月28日,Rancher Labs在北京舉辦了Container Day 2018容器技術(shù)大會。在大會上,Rancher Labs CEO及聯(lián)合創(chuàng)始人梁勝博士、中國人壽研發(fā)中心開發(fā)五部副總經(jīng)理王川、技術(shù)處高...
摘要:是宜信公司大數(shù)據(jù)創(chuàng)新中心開發(fā)的開源平臺。為宜信大數(shù)據(jù)創(chuàng)新中心各個團(tuán)隊(duì)提供了統(tǒng)一的測試和生產(chǎn)環(huán)境,簡化了服務(wù)的部署與上線流程,也降低了運(yùn)維人員對系統(tǒng)管理的復(fù)雜度。基于容器技術(shù),面向多樣化的技術(shù)棧,并且天然隔離系統(tǒng)和應(yīng)用的依賴。 LAIN是宜信公司大數(shù)據(jù)創(chuàng)新中心開發(fā)的開源PaaS平臺。在金融的場景下,LAIN 是為解放各個團(tuán)隊(duì)和業(yè)務(wù)線的生產(chǎn)力而設(shè)計(jì)的一個云平臺。LAIN 為宜信大數(shù)據(jù)創(chuàng)新中...
摘要:分享實(shí)錄云計(jì)算技術(shù)源于互聯(lián)網(wǎng)公司,現(xiàn)在云計(jì)算已經(jīng)是下一代企業(yè)級的發(fā)展趨勢。如何做云計(jì)算一直是云計(jì)算技術(shù)的領(lǐng)導(dǎo)者。互聯(lián)網(wǎng)公司的快速發(fā)展,已經(jīng)印證了云計(jì)算技術(shù)和云原生應(yīng)用相比傳統(tǒng)構(gòu)架的巨大優(yōu)勢。 今天小數(shù)又給大家?guī)硪黄韶洕M滿的分享——來自KVM社區(qū)線上群分享的實(shí)錄,分享嘉賓是數(shù)人云CEO王璞,題目是《云計(jì)算與 Cloud Native》。這是數(shù)人云在KVM社區(qū)群分享的第一彈,之后還有數(shù)...
閱讀 3273·2021-10-11 10:59
閱讀 2840·2021-10-11 10:58
閱讀 2249·2021-09-04 16:45
閱讀 2726·2019-08-30 15:44
閱讀 680·2019-08-30 15:44
閱讀 3207·2019-08-30 10:51
閱讀 1602·2019-08-29 18:46
閱讀 2760·2019-08-29 13:57