摘要:大部分小企業的運維就是加一些腳本就可以搞定了。極端大型的企業,比如,比如騰訊,百度等,都有一套非常完善和復雜的運維平臺。做一個這樣的運維平臺是不容易的。
這是一個未經驗證的假設,just a dump of my current thought。
大部分小企業的運維就是 ssh 加一些 fabric 腳本就可以搞定了。極端大型的企業,比如 google twitter,比如騰訊 SNG,百度等,都有一套非常完善和復雜的運維平臺。我認為,這里存在一個潛在的市場機會,那就是對于那些中型企業(比如機器數量大于100,小于1000),他們的集群規模已經使得手工加腳本管理變得有些痛苦,但是還不足夠痛苦到老板愿意花錢雇一個全職的運維開發的團隊的地步。如果我們可以把 google 規模的運維平臺,讓這些中型企業“低成本”的方式接入,收取小于一個全職運維開發團隊工資的費用,那么就可以有利可圖。
假設一:google式的集群管理平臺比中型公司自己拿開源方案攢出來的要好用
一鍵式發布。全景式儀表盤。各種自動故障替換。
提供強大功能的同時,不帶來特別高的管理復雜性(出問題了調試定位困難),也不帶來特別高的學習使用成本。
做一個這樣的運維平臺是不容易的。
假設二:可以低成本的接入
如果接入意味著每一個功能都需要運維寫一堆腳本,設置開發要按照集群管理方式進行源代碼的改造,那么就不能叫低成本接入。如果監控告警需要按照規矩在代碼里埋特定的上報代碼,需要配置一堆復雜的參數,那么也不能叫低成本接入。
關鍵技術一:統一的版本交付方式
運維平臺無非就是干這么幾件事情,配置文件修改,進程起停,以及監控告警。進程起停最困難的一個步驟是讓把進程需要的版本包安裝好。在沒有 docker 之前,這是一件非常困難的事情。一個進程有無數的依賴包,python/ruby/java 這個級別的,也有操作系統級別的 deb/rpm。docker 使得版本交付變成了集裝箱的模式,一個容器把所有的依賴包都包含進去了。進程拉起變成了一個很容易標準化的操作。
關鍵技術二:動態服務路由托管技術
運維里最困難的就是不同ip之間的服務依賴管理。當一個ip要被下掉的時候,一堆相關聯的依賴服務需要更新配置文件。smartstack 是 airbnb 開源的動態路由托管方案,可以讓兩個ip之間不再緊耦合的綁定在一起。一個ip要下掉,只需要在動態路由里做一下替換就可以了。詳情可以看他們的博客:http://nerds.airbnb.com/smartstack-service-discovery-cloud/
如果你認為這種做法是劍走偏鋒,只適合小公司那你就錯了。google開源的容器管理方案用的是同樣的技術:https://github.com/GoogleCloudPlatform/kubernetes/blob/master/docs/ser...
當進程和端口全部托管給運維平臺之后,運維平臺可以拿這個把整個發布變更的自動化體系都建立起來。
關鍵技術三:通用監控平臺
以 datadog 為代表的新一代監控公司,提供了靈活schema的時間序列采集存儲和告警方案。一套監控平臺,可以給你的cpu使用率告警,也可以給你的網站的訪問量異常下跌告警。無論業務領域如何,通用監控平臺提供的多維度,多值列的采集存儲方案,可以讓你只要把數據報上來就可以把一切監控好。
底層的核心技術是一個 data pipeline,加上一個基于 lucene/elasticsearch 的時間序列數據庫。監控是最容易被中型公司外包出去的業務,所以這方面的創業公司也最多。但是中國的國情是網絡傳輸成本大于計算成本,所以如何在客戶計算中心內完成采集,計算存儲,而不是把源數據都發過來是一個關鍵問題。
關鍵技術四:通用異常檢測
傳統的監控平臺需要運維配置各種閾值。理想中的智能數據中心,用戶只需要把數據源指定好。剩下的采集,上報存儲,異常檢測都是自動的。根據各種算法,利用數據的相關性和周期性自動給出異常告警,無需運維再去配置閾值。
總結:
當市場不再被幾個巨型巨頭占據,一批中型公司崛起的時候,當這些中型公司的架構開始向 micro-service,scale out 的方向發展的時候,當 docker 等技術讓“低成本”標準化接入變成可能的時候,這三個條件將迸發出一個運維平臺服務(ops platform as a service)的市場。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/7933.html
摘要:賀祥龍按照用戶規模體量上云需求技術能力,將云服務用戶歸結為小型中型大型和超大型四類。賀祥龍表示,這是缺人的第一類用戶,這類用戶多為典型的初創公司,技術能力弱,用云量小,最缺的就是人和工具。借云轉型已成為當下多數企業實現IT部署升級的選擇。但當前云計算產業始終面臨著一種矛盾:大量產業機會與云服務商對于產業的理解及實際交付能力之間的差距。這種gap(鴻溝)的存在,讓用戶在面對云市場中大而美的概念...
摘要:相信在分級分權的時代訴求下,聆客企業服務的多租戶多層級模式將大有可為。 聆客企業協作平臺(BingoLink,下簡稱聆客)是品高云旗下面向生態型組織的云端協作與開放平臺產品。聆客作為SaaS化的企業協作移動平臺,在當前在云計算時代的公私混合架構下,各企業客戶以獨立租戶模式存在于平臺之上,使用個性化的系統,業務數據相互獨立隔離、獨立管理。 但對于大型集團企業而言,集團總部與旗下子公司存在...
摘要:一些領先的云服務商開始意識到,用戶之所以需要云計算是因為其的形態與傳統架構在本質上不同,便宜資源雖然很好,然而并不能帶來更多的價值,企業用戶更需要云服務提供商真正的服務能力?,F如今,采用云計算已經不是孤注一擲的選擇。 CIO們開始意識到混合云將是一種兩全其美的選擇。通過混合云,他們不僅可以在私有云上存儲和共享數據及應用從而削減成本,還可以在公有云上靈活開發新應用,并將大量用于大數據分析的非結...
摘要:但是,隨著目前云服務器成本降低,動不動就是內存起步,而且更有是運維管理的方便,我們會選擇類似寶塔面板這樣的客戶端管理。目前,雙十一活動大促期間,我們也可以看到寶塔面板專業版和企業版在促銷優惠。以前我們在選擇云服務器、VPS主機的時候由于配置比較低,而且成本高,所以我們一般采用編譯配置服務器WEB環境,或者用LNMP一鍵包的方式搭配的。但是,隨著目前云服務器成本降低,動不動就是2GB、4GB內...
摘要:阿里云成為唯一入選的中國產品。在阿里云的眾多產品中,和共同構成了服務能力的核心。作為大數據能力賦能的重要手段,出現在了等阿里云專有云解決方案中。利用云計算技術,互聯網公司得以快速的將自身的大數據處理能力對外賦能。 1.前言 本文基于Now Tech: Cloud Data Warehouse, Q1 2018 (Published: by Noel Yuhanna, March 13,...
閱讀 819·2021-11-18 10:02
閱讀 2535·2021-11-11 16:54
閱讀 2759·2021-09-02 09:45
閱讀 661·2019-08-30 12:52
閱讀 2789·2019-08-29 14:04
閱讀 2755·2019-08-29 12:39
閱讀 457·2019-08-29 12:27
閱讀 1893·2019-08-26 13:23