摘要:這里我想從我在谷歌內部使用容器,并基于容器研發大規模生產平臺的經驗中談談現有和谷歌容器環境的差別,并通過的實際案例落地經驗總結下自身所帶來的一些謊言和誤區。
我與容器的緣分起源于我在 Google 內部研發容器集群管理系: Cluster Management。谷歌內部一切皆容器,搜索、視頻、大數據、內部工具等核心業務都以容器的方式運行在容器編排系統 Borg 上。2014年,隨著公司內部的“Ursquake” (注:Urs 是負責基礎設施的高級副總裁),我轉投到了公有云 Google Cloud Platform 的建設當中。2014年3月份,在由各部門基礎設計技術帶頭人參加的谷歌內部的云峰會中,我做為早期參與者之一加入到了 Kubernetes 的項目中。
從2015年回國創業至今,我親身感受到了國內對于 Docker 的追捧熱度。如今,Docker已經迅速在國內形成了“要是不知道 Docker 都不好意思和人打招呼”的火熱勢態;在互聯網巨頭和獨角獸企業中,甚有從“誰在用 Docker”轉變為“誰沒用 Docker”之勢。
Caicloud 基于 Kubernetes 開源技術,力爭為企業提供 Gifee(Google’s Infrastructure for Everyone Else)的體驗。目前已經成功落地于多家國內大型企業,其中不乏傳統國有企業。在不少案例中,我們都發現一個明顯的趨勢:很多企業一開始受到 Docker 現象的鼓吹,認為 Docker 是萬靈藥,然而在自己嘗試進行開發、生產使用時才發現 Docker 帶來的不僅僅是“坑”,更多的是局限和對已有流程的顛覆。這里我想從我在谷歌內部使用容器,并基于容器研發大規模生產平臺的經驗中談談現有 Docker 和谷歌容器環境的差別,并通過 Caicloud 的實際案例落地經驗總結下 Docker 自身所帶來的一些“謊言”和誤區。希望能拋磚引玉,并在產品上填補空白,實現 Gifee。
Docker的謊言這里用“謊言”略有夸大其詞之嫌,Docker 也確實為軟件開發帶來了巨大的好處。而我想表達的是人們對于 Docker 的一些常見預期在現實使用中并非像理論中那般完美。
Docker達到了環境一致性幾乎所有的 Docker 介紹或教程中提到的前幾個 Docker 帶來的好處之一,必有“環境一致性”。然而這句話表述的并不準確,“環境”是一個模糊和相對的概念。Docker 實現的是鏡像內部的小環境一致性,它保證了一個應用程序在一臺機器上使用 Jetty 9, 在另一臺機器上也使用Jetty 9(通過封裝軟件中間件如 Jetty 9)。然而大中型企業用戶很快意識到,真正的難點在于如何保證“大環境”一致,即整個業務系統中眾多容器、組件、服務之間如何配置、互聯、依賴,如何保證開發、測試、生產環境能相互轉化、克隆等。這些環境、配置在容器概念之上,是容器自身無法解決的,只能依賴集群層面的管理工具。
Docker幫助了微服務微服務與 Docker 是兩個完全獨立的維度,微服務所帶來的好處完全不依賴于你是否使用 Docker,同時微服務所帶來的問題 Docker 也無法解決。例如,如今大家都流行將原來的巨石型應用進行微服務細粒度切分,而第一個難點就是切分的粒度。雖然不乏最佳實踐和 Rule of Thumb, 但總的邏輯是切分的粒度越細,軟件開發靈敏度越高。然而帶來的問題是管理成本的增加:更多的模塊如何進行各自的配置,更多的 API 通信、互聯如何管理,更多的二進制(容器)如何發布。這些問題都是 Docker 自身不能解決的,也必須通過第三方工具來進行彌補(例如 Kubernetes 的 Pod 機制就是谷歌基于內部的經驗教訓設計的一個解決方案)。
Docker實現了以應用為中心Docker 的大火也讓”App Centric”, “Cloud Native”煥發了青春,Docker 確實在為實現這兩者的道路上提供了便利,但Docker本身還遠遠不能和這兩個詞劃等號。Docker 對應用雖然進行了封裝,但是應用的開發者在實踐中還遠無法做到只要關心到 Docker 這一層即可。首先我們還是要關注操作系統,是否有合適的內核,是否有合適的 API 支持。其實我們甚至要關心硬件,是 x86 架構還是 power pc 架構。此外,我們還需要關心引擎,是 Docker 還是 Rocket 還是 runC。最后,開發、運維者還要關心平臺,是 Kubernetes 還是 Mesos 來進行生產集群管理,并需要針對具體的底層平臺做完全針對該平臺的部署、配置(甚至需要修改應用、框架等)。而這些都不是應用、業務所應該關心的范疇。
Docker實現了DevopsDocker 有很多開發、發布敏捷性方面的亮點,然而不少企業用戶認為 Docker自身就邁向了 Devops,而殘酷的現實是他們往往在真正開始使用后很快發現 Docker 帶來了額外的負擔,例如基于 Docker 的發布流程應該是怎么樣,應用程序打包的最佳實踐應如何(如何避免打出一個上G的包),Docker 的鏡像倉庫該如何管理(如何有效利用存儲空間、識別 Dockerhub 里的惡意鏡像)。總之,Docker 畢竟給系統中引入了新的一層東西,業務出了問題,到底是應用的問題還是 Docker 的問題?最后(among many others),Docker 自身主要是進程級別的,而對于復合型、集群化的場景(翻譯:任何一個認真的生產場景)則需要第三方的工具和系統來補足。在機器層面,如何做到跨主機的通信、數據的遷移、跨主機的任務調度;在應用層面,如何做到用多個 Docker 鏡像/容器構造成一個復合性應用(Codis 就是一個很好的例子)。當然,Docker 的安全性也是經久不衰、流行的議題。
一個好漢三個幫還是要說明上述的論點旨在讓企業用戶認識到 Docker 自身不是萬靈藥,但是我們也不可否認 Docker 對于軟件開發、發布和計算上所帶來的變革性優勢。如何基于 Docker 自身的優勢更上一層樓,我認為需要順應“社會專業化分工”,讓專業的人做專業的事,通過第三方工具一起打造一個完善的生態系統。
谷歌在十年間打造了三個集群管理系統:Borg、Omega、Kubernetes,原因就是基于它領先于外界多年的容器使用經驗,它清楚地意識到容器自身的局限性(只是應用運行的一個“載體”,和其他的載體諸入虛擬機、物理機在這個角度上甚至沒有本質區別)。在雖有 Mesos 這一開源項目的情況下,谷歌還是在2014年決定大力推廣 Kubernetes 項目(內部代號為 “Project 7”),是出于幾點深思熟慮。這些出發點也在 Kubernetes 在國外眾多知名企業(如 ebay 等互聯網巨頭,或高盛、 Bloomberg 等金融巨頭)和 Caicloud 在國內一些大型甚至傳統國有企業的成功落地中得到了驗證。
谷歌有著更多年的大規模生產級別容器管理經驗,這里說的“大規模”是百個數據中心、百萬臺機器、億萬個容器,且這個“經驗”既有成功也有教訓。例如通過設計 Borg 我們清楚地意識到配置管理的重要性,聲明性管理的重要性,為每個服務分配獨立IP地址來避免端口沖突的重要性等。通過 Omega 也意識到了可插拔調度器的重要性,模塊化系統的重要性,以及對于任務的完成時間的不可控性等。因此 Kubernetes 希望能夠將谷歌內部多年容器管理的理念、經驗、教訓以開源項目的形式傳遞給大家,而這個經驗是獨一無二的。
另外與 Mesos 的關注點不同(資源分配),Kubernetes 是完全原生態面向服務和集群化容器應用的(Mesos 面向的是“框架”),它旨在提供更多便捷的容器管理工具、機制和功能。因此除了常見的任務調度、服務發現、健康檢查和自動修復,它還提供了獨特的功能,諸如容器組管理,秘密管理,服務賬戶管理,配置管理,守護進程管理,寵物應用管理等,都是谷歌在內部形形色色應用、業務類型管理中所提煉出來的重要功能。
打造活躍、健康的開源社區:Kubernetes 是當前最活躍的開源社區,在 github 上已有1萬4千多顆星(相比于其他容器集群項目的數千顆星)。谷歌做開源社區也有重要意義:雖然在市場端不同的廠商可以通過花樣繁多的市場手法和資金投入包裝自己的產品領先度,開源社區的健壯程度卻是無法用錢或市場廣告買來的。谷歌通過打造開源社區可以更客觀地展現自己在基礎設施、容器、集群管理方面的技術優勢。當然或許有誤區認為項目不活躍是因為軟件“成熟”,項目活躍是因為項目不成熟。然而谷歌內部的代碼庫每天仍有近萬個新的 issues 被開啟,絕不是因為谷歌10多年的業務系統不成熟,而更多的是創新性的一種表現(大部分 issues 是在不斷迭代更強大的新功能——在保證穩定的基礎上)。由于當今互聯網業務千變萬化,創新層出不窮,任何系統都需要不斷的迭代,如果一個項目因達到“成熟”而活躍度下降,這只是該項目遭到冷落的表現。
現在的空白和未來的趨勢無論是 Docker 還是開源第三方集群管理工具,如要到達 Gifee 都還有很長的路要走。這里我僅僅拋磚引玉列舉一些空白和我們希望和正在努力的方向。
發布管理遠大于 CI/CD
如今談到發布,大家想到的就是持續集成(CI)和持續發布(CD)。然而我們在谷歌內部實踐的發布管理系統還包括很多其他的方方面面,例如:
如何將鏡像的構建與代碼庫的分支構建相整合
如何做微服務架構中的聯合發布(最重要的是保證新老版本的API能夠平滑兼容)
如何做版本管理(哪個鏡像版本運行在哪個數據中心上)
如何做灰度發布(根據不同的時間節點、步調來有策略的調整新版本的上線比率,自動比對新舊版本的用戶行為等)
Devops 包含方方面面,其中諸多實踐都是 Docker 自身層面所不能企及的,以谷歌為例:
配置管理:要做到真正的大環境一致,必須將配置完全與代碼分離,這里的配置遠不僅僅是服務之間的 IP 地址(通過 DNS 服務發現可以解決),還包括不同環境下對于不同服務、應用的配置參數等。對于這些狀態、配置、數據、文件的維護則需要額外的配置管理系統。
分布式測試:測試是 Devops 中不可或缺的一環,但是在大規模應用系統中,如何有效地、智能地快速自動運行系統測試則需要額外的系統;在谷歌內部我們構建了分布式測試系統,能夠基于 Borg,有選擇地識別出收到某個 commit 影響的測試集進行高效自動化測試。
智能預警:Docker 或容器只是應用運行的載體,而 Docker 自身失效后需要第三方系統來檢測并預警。谷歌打造了復雜、靈活的預警系統,可以支持自定義的預警規則和報警行為。
智能故障定位:微服務架構的分布式天性將系統問題調試變得更加復雜,一個用戶的請求在系統內部要遍歷多個服務模塊,而在出現問題時如何幫助系統管理員自動定位故障也需要額外的工具和系統來完成。
集群管理遠大于服務管理最后想澄清的一個名詞是”集群管理“。現在當人們談及“集群管理”時,容易直接和 Kubernetes,Mesos 等劃等號。然而集群管理在谷歌內部是一個非常龐大的組織,Borg 只能算作任務管理或應用管理,除此之外一個真正的集群管理系統還需要涉及到機器管理、網絡管理、安全管理等諸多方面:
機器管理:如何自動配置、安裝機器,如何自動進行機器層面的問題檢查與修復
網絡管理:如何與 SDN 聯動
安全管理:如何在容器的基礎上做應用、業務層面的安全檢測
本文作者:
才云科技 CEO 張鑫
曾為美國谷歌軟件工程師,從事谷歌核心技術底層系統研發。 2012年至2014年,作為主要技術人員從事谷歌數據中心(IDC)集群管理系統(Cluster Management)的研發,該集群系統自動管理和維護95%以上的谷歌集群機器;帶頭開發的自動故障應對系統將谷歌集群的故障率大大降低,為谷歌節省了每年千萬美元的運維成本;作為核心技術人員參與了谷歌云計算平臺的系統到產品的全棧式開發;開發的圖形化應用部署(Click-to-deploy)、部署經理(Deployment Manager)等產品上線后即獲得用戶廣泛使用;設計了谷歌倡導的新一代“云服務”(Managed Cloud)的設計,此理念獲得了美國IBM,VMWare,Redhat等云計算巨頭公司一致響應。
于2012獲美國頂級計算機學府Carnegie Mellon University (CMU)大學計算機博士學位,發表國際學術論文數十篇,成為分布式系統和網絡安全方向的學術專家,曾為美國個性醫療初創公司SMART-MD, AllPancreas提供應用軟件平臺構架、安全技術咨詢和基于云平臺的系統開發。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/26659.html
摘要:盤點云計算的優勢,較低的托管成本較低的基礎架構復雜性較高的可擴展性這些都是實實在在的好處。好雨,讓云落地,提供以應用為中心的云計算產品和服務。 盤點云計算的優勢,較低的托管成本、較低的基礎架構復雜性、較高的可擴展性……這些都是實實在在的好處。不過對于企業來說,選擇云計算最關鍵的驅動在于產品速度,換句話說,利用適當的云計算產品和技術,我們可以在最短時間內把理念變成用戶需要的實際產品。 過...
摘要:采訪過程中發現,華為竟然與在容器方面合作的這么深入,在公司剛剛成立幾個月之后,雙方就開始討論能不能在容器技術上做一些合作。但是在容器方面和華為雙方還是找到了一個很好的契合點容器應用平臺。容器這個詞在IT圈里,可謂是無人不知無人不曉,也可以稱其為技術界的熱詞,或者說是技術大咖們的談資。在IT媒體圈里摸爬滾打十幾年的我,長期以來也一直從事著IT前沿技術的跟蹤和報道,相對來說,對容器這個詞接觸的還...
摘要:時速云進入的是一個非常新正在快速崛起的新興市場以為代表的容器云市場。同時,時速云的這種新的云服務模式,也正在被部分傳統行業所追隨。黃啟功表示對于在企業級市場的應用,是極具爆發力的。 幾乎每個新興的市場都會很快被這個時代所擁抱,但是大多數不久就會被嗤之以鼻,除非是能夠真的把準它的命脈,俘獲它的芳心。以Docker為代表的容器技術在這個千帆競發的市場下脫穎而出,并且從2014年發展 至今絲毫沒...
摘要:新一代也有輕量的特性,介紹谷歌的輕量特性,應用要具有彈性要分布發布,再一個容錯性強易于維護,也要對計算資源故障進行容錯。 5月18日,第八屆中國云計算大會在北京國家會議中心召開。作為領先的云計算創新技術實踐者,數人云CEO王璞博士應邀出席并在全體大會上進行主題為中美容器之融合與變革的分享,以下是演講實錄: 容器VS虛擬化 showImg(https://segmentfault.com...
摘要:此次合作達成之后,用戶可以直接從購買和容器管理平臺的技術支持服務。此次與的戰略合作,平臺的原生體驗將進一步擴展,涵蓋的企業級安全管理和編排能力,所有這些都將得到的全面支持。 2013年3月,Docker公司發布第一代Docker Hub——發布和使用Docker容器鏡像的官方平臺;2014年6月,Docker 1.0正式發布;而今天,Docker容器鏡像拉取數已超20億次,這是IT發展...
閱讀 1606·2021-11-04 16:11
閱讀 3320·2021-09-09 11:33
閱讀 1568·2019-08-30 15:54
閱讀 624·2019-08-30 15:44
閱讀 3182·2019-08-30 15:43
閱讀 2564·2019-08-30 13:06
閱讀 1704·2019-08-29 17:00
閱讀 905·2019-08-29 15:33