国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

淺談運(yùn)維數(shù)字化轉(zhuǎn)型

IT那活兒 / 2892人閱讀
淺談運(yùn)維數(shù)字化轉(zhuǎn)型

點(diǎn)擊上方“IT那活兒”,關(guān)注后了解更多精彩內(nèi)容!!!




01




為什么運(yùn)維工作要做數(shù)字化轉(zhuǎn)型?


相信在IT運(yùn)維領(lǐng)域干過一段時(shí)間的同學(xué),對(duì)于運(yùn)維工作的內(nèi)容都耳熟能詳了,每天從早忙到晚,經(jīng)常加班加點(diǎn)。例行巡檢、安裝部署、風(fēng)險(xiǎn)評(píng)估、故障處置、性能優(yōu)化、安全加固、資產(chǎn)盤點(diǎn)、日志分析、安全審計(jì)等等。
但一到寫工作匯報(bào)的時(shí)候就抓耳撓腮,因?yàn)橄氩黄鹱约旱降赘闪松赌苣玫贸鍪值某煽儭_@算是做運(yùn)維同學(xué)的心病:工作沒有量化輸出,我做了那么多,你卻看不見
運(yùn)維工作重要嗎?絕大多數(shù)人都知道非常重要。畢竟一次意料之外的故障或訪問風(fēng)暴帶來危害可能是災(zāi)難級(jí)的。
疫情時(shí)代好幾個(gè)城市的健康碼平臺(tái)故障上了微博熱搜,不少相關(guān)行業(yè)干運(yùn)維的同學(xué)都心有惶惶,擔(dān)心自家的家底是否能經(jīng)得起如此考驗(yàn)。
做運(yùn)維顯然不能靠天吃飯,除了把應(yīng)急預(yù)案做足,我們也需要知道何時(shí)該觸發(fā)預(yù)案執(zhí)行。如果不能提前把自家平臺(tái)的底給摸透,出了問題真的是哭都來不及了。
所以,平臺(tái)業(yè)務(wù)能力數(shù)字化評(píng)估是預(yù)案執(zhí)行的前提

運(yùn)維自動(dòng)化已經(jīng)做了多年,通過平臺(tái)實(shí)現(xiàn)了很多運(yùn)維動(dòng)作的自動(dòng)化。確實(shí)有不少原本需要人工投入的工作交給了機(jī)器定時(shí)執(zhí)行,或根據(jù)規(guī)則算法等方式實(shí)現(xiàn)自動(dòng)執(zhí)行。
但是在跨平臺(tái)或跨系統(tǒng)的環(huán)節(jié),仍需要靠人力實(shí)現(xiàn)流轉(zhuǎn),各平臺(tái)之間的流程打通和數(shù)據(jù)打通仍是困擾運(yùn)維人員的一大難題。
領(lǐng)導(dǎo)在工作群里的指令下達(dá)到平臺(tái)上的任務(wù)執(zhí)行,仍然需要靠人來實(shí)現(xiàn)從自然語言到應(yīng)用程序的轉(zhuǎn)換過程,只能感嘆一句:流程沒有基于數(shù)字化平臺(tái)打通,有人工才有智能




02




運(yùn)維的數(shù)字化轉(zhuǎn)型如何落地?


圍繞著上述這些困擾運(yùn)維團(tuán)隊(duì)的問題,把目光聚焦到數(shù)字化上。我們需要通過數(shù)字化的方式來實(shí)現(xiàn)對(duì)運(yùn)維工作的現(xiàn)狀量化評(píng)估、目標(biāo)量化設(shè)定、過程量化管理、成果量化體現(xiàn)。四步實(shí)現(xiàn)運(yùn)維的數(shù)字化。
第一步,運(yùn)維工作評(píng)估數(shù)字化
我們需要通過對(duì)運(yùn)維對(duì)象做量化評(píng)估來明確下一步工作目標(biāo),也需要通過對(duì)運(yùn)維過程做量化統(tǒng)計(jì)來發(fā)現(xiàn)效率問題。
A、構(gòu)建系統(tǒng)健康評(píng)估體系
在實(shí)施了監(jiān)控管理之后,我們對(duì)于所運(yùn)維目標(biāo)系統(tǒng)(設(shè)備)已具有了較強(qiáng)的性能采集和性能閾值告警的能力。
這個(gè)能力提供我們對(duì)于系統(tǒng)故障發(fā)生后的快速響應(yīng)能力,但仍不足以提前預(yù)知故障的發(fā)生,并且這些性能指標(biāo)往往只預(yù)示某一個(gè)維度的風(fēng)險(xiǎn),而對(duì)于客戶感知到的整體業(yè)務(wù)性能或業(yè)務(wù)可用性,卻缺少關(guān)聯(lián)性支撐。
事實(shí)上,當(dāng)客戶反饋系統(tǒng)存在業(yè)務(wù)緩慢或業(yè)務(wù)辦理不成功等異常時(shí),運(yùn)維人員往往從監(jiān)控指標(biāo)層面是無法發(fā)現(xiàn)問題的所在。
這里面有性能劣化累加的緣故,例如完整流程中一個(gè)單元的微小性能變化也許無法觸發(fā)閾值告警,但存在多個(gè)單元存在性能下降時(shí),帶來的業(yè)務(wù)辦理緩慢的感知卻是惡劣的。
又比如,業(yè)務(wù)日益復(fù)雜帶來流程過長,單點(diǎn)的效率略低,單個(gè)性能數(shù)據(jù)來看甚至無法引起運(yùn)維監(jiān)控的注意,而在對(duì)外的接口側(cè)反饋卻是超時(shí)返回。另外一方面,也有業(yè)務(wù)層面異常與系統(tǒng)層面異常的差異。
運(yùn)維人員往往關(guān)注到的性能指標(biāo)都是偏向底層的Paas層指標(biāo),而客戶關(guān)注的其實(shí)是業(yè)務(wù)層的辦理是否成功、辦理是否迅速等感受。
而在業(yè)務(wù)規(guī)則條件日益復(fù)雜的情況下,因?yàn)槟承I(yè)務(wù)邏輯受限帶來的辦理失敗,已經(jīng)遠(yuǎn)遠(yuǎn)超過系統(tǒng)自身故障(性能)的原因了。
在這樣的形勢下,構(gòu)建一個(gè)覆蓋系統(tǒng)性能指標(biāo)以及業(yè)務(wù)支撐能力指標(biāo)的完整指標(biāo)體系是必須的。
我們可以從單個(gè)重點(diǎn)業(yè)務(wù)辦理的流程維度、應(yīng)用服務(wù)的物理拓?fù)浼軜?gòu)維度、業(yè)務(wù)支撐的整體性能維度來建立這樣一套評(píng)估指標(biāo)體系。
1)業(yè)務(wù)流程維度
業(yè)務(wù)系統(tǒng)平臺(tái)對(duì)外的服務(wù),是由一個(gè)個(gè)的業(yè)務(wù)流程組成的。一線的平臺(tái)使用者對(duì)于系統(tǒng)的最直接感知,也是單筆的業(yè)務(wù)辦理是否順暢。
通過對(duì)核心(重點(diǎn))業(yè)務(wù)進(jìn)行全流程的單元分解,基于單元明確服務(wù)能力指標(biāo),我們可以得到用于標(biāo)識(shí)單個(gè)業(yè)務(wù)的一組運(yùn)行指標(biāo)。這里面包含有單個(gè)服務(wù)的調(diào)用總量、平均調(diào)用耗時(shí)、單位時(shí)間的調(diào)用成功率等。
通過對(duì)這些指標(biāo)做基線沉淀,我們能夠得到一組用于快速發(fā)現(xiàn)該業(yè)務(wù)發(fā)生異常的感應(yīng)器。
例如業(yè)務(wù)正常時(shí)段的調(diào)用量突降或變?yōu)?可能預(yù)示入口網(wǎng)絡(luò)訪問異常;平均調(diào)用耗時(shí)的增加可能是由于近期上線代碼質(zhì)量不過關(guān)導(dǎo)致服務(wù)性能劣化;單位時(shí)間內(nèi)調(diào)用成功率下降的原因可能多種多樣,也許是代碼級(jí)的bug,也許是某些業(yè)務(wù)規(guī)則改變帶來的辦理?xiàng)l件不滿足,需要從業(yè)務(wù)角度切入做進(jìn)一步分析。
這些指標(biāo)數(shù)據(jù)的長期歷史數(shù)據(jù)匯聚,能為運(yùn)維分析提供強(qiáng)有力的數(shù)據(jù)依據(jù)支撐。
2)應(yīng)用拓?fù)渚S度
應(yīng)用拓?fù)涫莻鹘y(tǒng)的Paas層運(yùn)維的納管對(duì)象。運(yùn)維人員對(duì)于這個(gè)維度的指標(biāo)體系是比較熟悉的。
通過對(duì)系統(tǒng)資產(chǎn)的部署關(guān)系、調(diào)用關(guān)系、歸屬關(guān)系的獲取和維護(hù),并對(duì)各層級(jí)的應(yīng)用模塊、設(shè)備模塊、網(wǎng)絡(luò)模塊的性能進(jìn)行指標(biāo)化管理,我們可以得到一座由下而上的異常影響分析金字塔。
目前在我們所運(yùn)維的大多數(shù)現(xiàn)場,或多或少都已實(shí)現(xiàn)了這些指標(biāo)數(shù)據(jù)。
在這座金字塔中,下層的物理設(shè)備故障必然引起部署于其上的應(yīng)用模塊(數(shù)據(jù)模塊)發(fā)生異常,有調(diào)用關(guān)系的某個(gè)模塊發(fā)生故障時(shí),必然會(huì)引起關(guān)聯(lián)模塊的服務(wù)調(diào)用異常。
通過對(duì)這些邏輯關(guān)系的分析,建立層級(jí)之間的模塊指標(biāo)體系的關(guān)聯(lián),運(yùn)維人員可以做健康影響分析,也可應(yīng)用高可用、雙中心、冷熱備等方式實(shí)現(xiàn)對(duì)系統(tǒng)可靠性進(jìn)行優(yōu)化。
3)對(duì)外業(yè)務(wù)支撐能力維度
對(duì)外業(yè)務(wù)支撐能力維度是從系統(tǒng)整體來評(píng)估業(yè)務(wù)支撐能力。
這個(gè)維度是將系統(tǒng)作為一個(gè)整體來看待,關(guān)注點(diǎn)在其對(duì)外提供的能力。例如服務(wù)的并發(fā)提供能力、周期內(nèi)的業(yè)務(wù)容量、數(shù)據(jù)的存儲(chǔ)容量、單位時(shí)間的最大訂單執(zhí)行量等等。
通過這些系統(tǒng)整體指標(biāo),能看到當(dāng)前系統(tǒng)承載容量水位,為及時(shí)擴(kuò)縮容提供數(shù)據(jù)依據(jù),也能為經(jīng)營分析評(píng)估提供業(yè)務(wù)增長或萎縮的數(shù)據(jù)支撐。
通過將業(yè)務(wù)支撐能力指標(biāo)與應(yīng)用拓?fù)浠驑I(yè)務(wù)流程維度指標(biāo)結(jié)合,我們能更快定位到系統(tǒng)的性能瓶頸所在,讓優(yōu)化工作開展更有針對(duì)性。
B、構(gòu)建運(yùn)維效率評(píng)估體系
做了不短時(shí)間的現(xiàn)場運(yùn)維團(tuán)隊(duì),都會(huì)面臨一個(gè)困擾。日常工作按部就班的在做,明確的運(yùn)維范圍都覆蓋到了,系統(tǒng)的穩(wěn)定性也在優(yōu)化工作的推進(jìn)下穩(wěn)步提升。
雖說仍有一些不可預(yù)知的故障發(fā)生,畢竟硬件的突然壞掉或業(yè)務(wù)上了個(gè)bug這種小概率事件無法徹底避免。
那么,運(yùn)維工作的提升是否就到此為止了呢?
很顯然不是的。
隨著業(yè)務(wù)范圍的擴(kuò)展,可以預(yù)見我們所運(yùn)維的系統(tǒng)將日益龐大,業(yè)務(wù)模塊越來越多,系統(tǒng)架構(gòu)也變得更加龐大。更新的技術(shù)也帶來更多的能力,各種開源框架、開源組件層出不窮。
相信任何運(yùn)維團(tuán)隊(duì)都無法靠人力擴(kuò)張來支撐隨之而來的運(yùn)維壓力,人力捉襟見肘是常態(tài)在人力無法擴(kuò)張的時(shí)候,提升效率幾乎是唯一的出路。

在運(yùn)維工作的初始階段,所有的工作都是靠人。巡檢是人工登到一臺(tái)臺(tái)的主機(jī)上去檢查的,數(shù)據(jù)庫是靠DBA一套套裝的。
十多年前,系統(tǒng)仍不算復(fù)雜,業(yè)務(wù)量尚沒有那么大時(shí),我們?cè)?jīng)這樣干過。而現(xiàn)在的設(shè)備翻了100倍還不止,動(dòng)輒數(shù)百套庫的安裝部署。這已經(jīng)不是單憑個(gè)人效率或能力能解決的問題了。
當(dāng)我們想到要提升運(yùn)維工作效率的時(shí)候,首先面對(duì)的問題是如何評(píng)估現(xiàn)在的效率,并且找到現(xiàn)在運(yùn)維工作中嚴(yán)重影響效率的環(huán)節(jié),再有的放矢去優(yōu)化它們。
對(duì)于運(yùn)維工作效率的考量可以從建立任務(wù)跟蹤體系和評(píng)估流程人力占比兩個(gè)方面開展:
1)運(yùn)維任務(wù)跟蹤體系
運(yùn)維工作是可以用任務(wù)的顆粒度進(jìn)行跟蹤的,無論是對(duì)外提供的IT服務(wù),還是對(duì)內(nèi)的日常工作,使用一套優(yōu)秀的任務(wù)系統(tǒng)來登記各項(xiàng)任務(wù)、設(shè)定預(yù)定完成時(shí)間、記錄實(shí)際完成時(shí)間,備注當(dāng)前狀態(tài)及所遇到的問題有有必要的。
結(jié)合流程引擎,我們可以將需要執(zhí)行的運(yùn)維工作拆解為一個(gè)個(gè)的任務(wù)單元,將任務(wù)單元分配給人或自動(dòng)化平臺(tái)來完成
通過接口獲取到任務(wù)單元的執(zhí)行狀態(tài)、執(zhí)行結(jié)果等信息,我們能知道哪些任務(wù)存在時(shí)延,哪些人導(dǎo)致效率瓶頸,甚至是哪些配合工作沒有做好,哪些組織存在配合上的問題。
流程復(fù)雜、耗時(shí)太長的運(yùn)維工作一定是工作優(yōu)化的首要目標(biāo)。
2)運(yùn)維人力投入評(píng)估
如果一項(xiàng)運(yùn)維工作絕大部分都需要靠人才能完成時(shí),這項(xiàng)工作的效率一定是不夠高的,畢竟人的并發(fā)工作能力無法與機(jī)器相比。
當(dāng)人力成為現(xiàn)場運(yùn)維團(tuán)隊(duì)最大的效率瓶頸,無論單個(gè)人的能力有多強(qiáng),是時(shí)候考慮如何提高自動(dòng)化能力在運(yùn)維工作中的占比了。
日常巡檢這樣的工作當(dāng)然應(yīng)該盡量交給監(jiān)控告警系統(tǒng);如果系統(tǒng)具備高可用環(huán)境,那么發(fā)現(xiàn)了故障后的處置,也可以由自動(dòng)化平臺(tái)觸發(fā)自愈流程來完成;還有安裝部署、主機(jī)加固、配置調(diào)參這樣的操作動(dòng)作相對(duì)固定,操作對(duì)象數(shù)量巨大的工作,也應(yīng)轉(zhuǎn)由系統(tǒng)完成,人力在其中只負(fù)責(zé)值守并查看結(jié)果即可。
對(duì)于運(yùn)維效率的評(píng)估中,是否占用更少的人力,提升機(jī)器自動(dòng)化投入占比,是衡量現(xiàn)場運(yùn)維工作成熟度的重要標(biāo)志。

第二步,運(yùn)維工作目標(biāo)數(shù)字化
通過對(duì)運(yùn)維對(duì)象健康狀況的量化評(píng)估,我們得以發(fā)現(xiàn)系統(tǒng)的運(yùn)行狀態(tài)以及薄弱環(huán)節(jié);通過對(duì)運(yùn)維效率的量化評(píng)估,我們也具備了定位流程優(yōu)化及自動(dòng)化改造關(guān)鍵環(huán)節(jié)的能力。
那么,應(yīng)該如何推動(dòng)運(yùn)維工作的進(jìn)一步優(yōu)化呢?
不少的現(xiàn)場運(yùn)維團(tuán)隊(duì)工作開展是事件觸發(fā)的。
一個(gè)告警觸發(fā)了一條任務(wù)工單,由某位運(yùn)維工程師接單后執(zhí)行相應(yīng)的運(yùn)維操作,并通過回單動(dòng)作結(jié)束了這項(xiàng)運(yùn)維工作;領(lǐng)導(dǎo)或客戶的一個(gè)口頭工作安排,也可能是運(yùn)維工作觸發(fā)的起點(diǎn),出個(gè)系統(tǒng)運(yùn)行情況報(bào)表,或者安裝一套庫。
經(jīng)常聽網(wǎng)上有職場人吐槽說上頭動(dòng)動(dòng)嘴,下面跑斷腿,大概就是這一類了。
這些工作當(dāng)然是屬于日常工作的范疇,無論是系統(tǒng)事件還是客戶事件,都構(gòu)成了運(yùn)維工作的一部分。
但,也只包括了一部分。
到了月底年底要做匯報(bào)的時(shí)候,我們顯然不能拿出一張清單來說處理了多少個(gè)系統(tǒng)告警,處理了多少起系統(tǒng)故障,處理了多少次客戶口頭工作安排。
這些不是運(yùn)維工作應(yīng)該展現(xiàn)的成績。或者說,這些只能代表工作的苦勞,卻不是功勞。
運(yùn)維工作在一系列繁雜的事項(xiàng)中,是有一條主線的。
這條主線是要讓我們運(yùn)維的系統(tǒng)運(yùn)行越來越穩(wěn)定、性能越來越強(qiáng)、業(yè)務(wù)越來越高端、承載的客戶越來越多;讓我們運(yùn)維服務(wù)效率越來越高,投入的低效勞動(dòng)越來越少,自動(dòng)化水平越來越高,所面向的客戶越來越滿意。
這個(gè)目標(biāo)是沒有止境的,聽著似乎是一句很空洞的口號(hào),所以如果要實(shí)現(xiàn)它,需要做一層層的拆解。
運(yùn)維工作目標(biāo)的數(shù)字化,以及對(duì)該目標(biāo)分解為各階段的執(zhí)行計(jì)劃和執(zhí)行任務(wù)項(xiàng),是落地目標(biāo)實(shí)現(xiàn)方案的具象。
我們可以通過運(yùn)維工作任務(wù)系統(tǒng),設(shè)定每一年度或時(shí)間階段的運(yùn)維提升目標(biāo)。這個(gè)目標(biāo)可以是面向所運(yùn)維業(yè)務(wù)系統(tǒng)的,也可以是面向運(yùn)維服務(wù)過程的。
A、面向運(yùn)維業(yè)務(wù)系統(tǒng)的優(yōu)化目標(biāo)
1)確保系統(tǒng)運(yùn)行更加健康
這個(gè)目標(biāo)的設(shè)定是與前面所講述的系統(tǒng)健康量化評(píng)估相關(guān)的。
隨著業(yè)務(wù)的發(fā)展壯大,要承載的業(yè)務(wù)量越來越多,業(yè)務(wù)邏輯越來越復(fù)雜,必然帶來系統(tǒng)的壓力日益增長以及對(duì)于單筆業(yè)務(wù)的辦理效率下降。
如同逆水行舟,如果不持續(xù)關(guān)注系統(tǒng)的運(yùn)行狀態(tài),并推動(dòng)關(guān)鍵環(huán)節(jié)的優(yōu)化,則必定會(huì)積重難返。
可以預(yù)見的未來會(huì)出現(xiàn)時(shí)不時(shí)的業(yè)務(wù)辦理流程超長導(dǎo)致超時(shí)失敗,數(shù)據(jù)庫并發(fā)訪問增大導(dǎo)致死鎖或夯住甚至宕機(jī),網(wǎng)絡(luò)流量過大出現(xiàn)阻塞……

各種的異常故障并不是瞬間形成的,而是在一次次微小的變化后積累而成,當(dāng)最后一根稻草輕輕壓下時(shí),已是回天乏術(shù)了。
所以,通過對(duì)業(yè)務(wù)系統(tǒng)各項(xiàng)運(yùn)行指標(biāo)的分析和評(píng)估,確定階段時(shí)間內(nèi)的優(yōu)化指標(biāo)項(xiàng),保障這些指標(biāo)不會(huì)進(jìn)一步劣化,對(duì)存在風(fēng)險(xiǎn)的指標(biāo)進(jìn)行優(yōu)化,更甚至將未來可能的劣化提前進(jìn)行優(yōu)化改造,都成為運(yùn)維工作設(shè)定的重要目標(biāo)。
例如高負(fù)荷系統(tǒng)的擴(kuò)容改造,高水位數(shù)據(jù)存儲(chǔ)的騰挪清理并重新制定生命周期管理規(guī)劃,訪問峰值的負(fù)載均衡調(diào)整等等。
這些工作也許沒有那么緊急,但卻非常重要,這是現(xiàn)場運(yùn)維團(tuán)隊(duì)任務(wù)的重中之重
2)確保系統(tǒng)運(yùn)維向符合業(yè)務(wù)發(fā)展方向演進(jìn)
這個(gè)目標(biāo)的設(shè)定是伴隨著企業(yè)發(fā)展規(guī)劃的。隨著行業(yè)業(yè)務(wù)的發(fā)展,以及業(yè)務(wù)系統(tǒng)所面向客戶的需求提高,系統(tǒng)的能力也被寄予了更高的要求。
例如建立數(shù)據(jù)共享中心必然會(huì)引入一些大數(shù)據(jù)組件,按不同的數(shù)據(jù)應(yīng)用需求來提供數(shù)據(jù)存儲(chǔ)及開放。新引入的開源數(shù)據(jù)組件該如何運(yùn)維則即將成為運(yùn)維團(tuán)隊(duì)所面臨的問題。
又例如客戶需要更快的在線數(shù)據(jù)分析能力,那么引入實(shí)時(shí)計(jì)算的開源架構(gòu)也勢在必行,如何確保計(jì)算過程中不出現(xiàn)異常中斷,或系統(tǒng)異常中斷后如何恢復(fù)不丟失數(shù)據(jù),同樣是運(yùn)維團(tuán)隊(duì)?wèi)?yīng)該參與考慮解決的問題。

這些問題在系統(tǒng)改造或系統(tǒng)建設(shè)階段就應(yīng)該介入,從利于運(yùn)維的角度提出解決方案,并將方案作為階段目標(biāo),并分解出任務(wù)子項(xiàng),與系統(tǒng)建設(shè)團(tuán)隊(duì)一起推動(dòng)落地施行。
例如故障場景的應(yīng)急預(yù)案構(gòu)建,數(shù)據(jù)遷移任務(wù)準(zhǔn)備等等,這樣才不至于在接手系統(tǒng)運(yùn)維時(shí)故障頻發(fā),手忙腳亂。
B、面向運(yùn)維服務(wù)過程的優(yōu)化目標(biāo)
1)運(yùn)維服務(wù)效率提升
運(yùn)維工作的執(zhí)行效率是衡量運(yùn)維服務(wù)水平的重要指標(biāo)體系。這個(gè)效率的評(píng)估是以完成任務(wù)為前提的。
例如50套數(shù)據(jù)庫的裝庫及數(shù)據(jù)遷移工作,兩個(gè)人一個(gè)月完成,投入60個(gè)人日,最終達(dá)到了任務(wù)目標(biāo),但客戶不見得滿意,因?yàn)檫@是以犧牲其他工作的完成為代價(jià)的。
如果投入1個(gè)人半個(gè)月時(shí)間,通過寫腳本、測試腳本并順利執(zhí)行50套庫的安裝遷移工作,雖然整個(gè)安裝庫的過程也耗時(shí)1個(gè)月,但實(shí)際投入的人力其實(shí)只有15人日,并且這套裝庫程序在后續(xù)的同類工作中稍加改造還能繼續(xù)發(fā)揮作用。
那么效率的提升是明顯的。因?yàn)閷?duì)于單個(gè)運(yùn)維人員來說,還能并發(fā)執(zhí)行其他的運(yùn)維工作。
我們可以把常見的運(yùn)維工作場景化,并梳理這些場景的工作流程,基于這些工作場景設(shè)定流程時(shí)長壓降目標(biāo),或人力投入壓降目標(biāo)。
無論是縮短單個(gè)場景的工作時(shí)長,還是減少人力投入,對(duì)于整個(gè)運(yùn)維團(tuán)隊(duì)來說,都是運(yùn)維效率的提升,可以帶來巨大的并發(fā)工作能力增長。
流程的優(yōu)化,可以分拆到各個(gè)步驟環(huán)節(jié),使用自動(dòng)化平臺(tái)能力替代人工執(zhí)行,還可以對(duì)審核環(huán)節(jié)由人工審批轉(zhuǎn)為自動(dòng)審批,甚至優(yōu)化掉一些不合理環(huán)節(jié)。
所有的優(yōu)化方案都可以分拆到一項(xiàng)項(xiàng)子任務(wù)來推動(dòng)實(shí)施,并最終完成一項(xiàng)運(yùn)維服務(wù)工作效率的整體提升。

2)運(yùn)維服務(wù)質(zhì)量提升
面對(duì)客戶,面對(duì)業(yè)務(wù)系統(tǒng),應(yīng)該心存敬畏,如履薄冰。沒有哪家老爺會(huì)愿意自家的長工當(dāng)成了祖宗。
在筆者還是個(gè)運(yùn)維行業(yè)菜鳥的時(shí)候,就曾聽前輩大佬說過這樣一句話:當(dāng)用戶還愿意罵你的時(shí)候,說明他還對(duì)你有所依賴;如果他已經(jīng)懶得罵你時(shí),你就離滾蛋不遠(yuǎn)了。
所以,運(yùn)維服務(wù)應(yīng)該有質(zhì)量標(biāo)準(zhǔn),并且運(yùn)維服務(wù)要把不斷提升質(zhì)量標(biāo)準(zhǔn)作為階段目標(biāo)。
不過,運(yùn)維服務(wù)的質(zhì)量評(píng)估較難通過數(shù)字做客觀量化體現(xiàn),一般現(xiàn)場往往用客戶滿意度或客戶最終的合作伙伴打分來作為相應(yīng)目標(biāo),而這些打分標(biāo)準(zhǔn)或扣分標(biāo)準(zhǔn)也來源于客戶對(duì)于系統(tǒng)運(yùn)行穩(wěn)定性、運(yùn)維支撐情況、事件處置效率的綜合印象。
由于各個(gè)現(xiàn)場存在差異,因此在這里不做贅述了。

第三步,運(yùn)維執(zhí)行過程數(shù)字化
運(yùn)維執(zhí)行過程的數(shù)字化,包括應(yīng)用任務(wù)管理系統(tǒng)將所有的運(yùn)維工作任務(wù)化記載,通過連接自動(dòng)化平臺(tái)實(shí)現(xiàn)部分任務(wù)的自動(dòng)化完成,以虛擬數(shù)字員工跨系統(tǒng)對(duì)接工作流程閉環(huán)。
A、運(yùn)維工作任務(wù)化記載
通過前述的運(yùn)維目標(biāo)評(píng)估和運(yùn)維目標(biāo)設(shè)定,我們已引入了運(yùn)維任務(wù)這個(gè)名詞。
所謂運(yùn)維任務(wù),應(yīng)該是指運(yùn)維過程中的每一個(gè)執(zhí)行環(huán)節(jié)。當(dāng)然,這個(gè)執(zhí)行環(huán)節(jié)可以是大的運(yùn)維場景,也可以是細(xì)小到具體的一項(xiàng)運(yùn)維操作。
例如安全加固這個(gè)事項(xiàng)可以是一個(gè)運(yùn)維任務(wù),其實(shí)這個(gè)任務(wù)里面也可以繼續(xù)拆分為多個(gè)子任務(wù)分派給不同的人執(zhí)行,又或者可以將部分加固操作分配給某個(gè)自動(dòng)化程序來執(zhí)行。
運(yùn)維任務(wù)的設(shè)定,可以更好的對(duì)運(yùn)維過程進(jìn)行把控。
應(yīng)用任務(wù)管理系統(tǒng)從整體目標(biāo)分解到階段計(jì)劃,設(shè)定階段里程碑目標(biāo),再分解到每個(gè)階段需要執(zhí)行的運(yùn)維任務(wù),指定任務(wù)的執(zhí)行人或執(zhí)行程序,設(shè)定計(jì)劃開始時(shí)間和計(jì)劃結(jié)束時(shí)間,預(yù)分配人工工時(shí)占用等等。
以數(shù)字化方式管理運(yùn)維執(zhí)行過程,將運(yùn)維工作的無序轉(zhuǎn)變?yōu)橛行颉?/span>
這里有個(gè)理想與現(xiàn)實(shí)的差異。不少同學(xué)會(huì)認(rèn)為運(yùn)維工作存在很強(qiáng)的不確定性,領(lǐng)導(dǎo)一句話可能就會(huì)完全打亂既定的運(yùn)維工作,又或者一個(gè)突發(fā)的故障事件也會(huì)讓原來正在執(zhí)行的某個(gè)運(yùn)維動(dòng)作不得不暫停下來,畢竟保障系統(tǒng)正常運(yùn)行是第一重要的工作。
基于這種顯示情況,我們提出一個(gè)任務(wù)補(bǔ)登記的流程,由運(yùn)維人員將臨時(shí)安排的工作手工補(bǔ)登記到任務(wù)系統(tǒng)。
通過任務(wù)歷史記錄,管理人員可以回溯獲得以下信息:
1)哪些事件導(dǎo)致了正常安排的運(yùn)維任務(wù)的延期。
2)哪些事件存在周期性觸發(fā),應(yīng)該可以作為計(jì)劃任務(wù)預(yù)先安排。
3)哪些任務(wù)時(shí)間預(yù)估不合理,應(yīng)調(diào)整預(yù)估時(shí)間。
4)哪些任務(wù)存在較大的優(yōu)化空間,應(yīng)推動(dòng)自動(dòng)化平臺(tái)執(zhí)行來提升效率。
5)哪些運(yùn)維人員執(zhí)行任務(wù)存在較大時(shí)延,分析能力因素或其他因素。
通過上述的數(shù)字化轉(zhuǎn)型,將運(yùn)維工作任務(wù)化記載,為運(yùn)維工作的迭代優(yōu)化提供數(shù)據(jù)分析依據(jù)。
B、運(yùn)維動(dòng)作自動(dòng)化執(zhí)行
運(yùn)維動(dòng)作的自動(dòng)化主要由各類自動(dòng)化平臺(tái)承載,通過運(yùn)維工作任務(wù)系統(tǒng)與自動(dòng)化平臺(tái)接口對(duì)接,將配置在自動(dòng)化平臺(tái)的運(yùn)維操作調(diào)度執(zhí)行實(shí)現(xiàn)。
每一個(gè)執(zhí)行動(dòng)作需要采集執(zhí)行時(shí)長信息,反饋到任務(wù)系統(tǒng)用于事后分析,并對(duì)存在執(zhí)行過久的動(dòng)作程序進(jìn)行不斷優(yōu)化,提升執(zhí)行效率。
通過任務(wù)系統(tǒng)將原本散亂在不同自動(dòng)化平臺(tái)的程序、腳本、后臺(tái)定時(shí)任務(wù)整合起來,通過平臺(tái)的任務(wù)流程進(jìn)行串聯(lián)執(zhí)行,并數(shù)字化記錄完整流程的執(zhí)行過程,避免運(yùn)維人員在各種不同平臺(tái)或主機(jī)、數(shù)據(jù)庫檢查執(zhí)行過程和執(zhí)行結(jié)果的繁瑣。

C、數(shù)字員工實(shí)現(xiàn)跨系統(tǒng)連接
數(shù)字員工伴隨著元宇宙的概念,現(xiàn)在著實(shí)是火了。
通過數(shù)字員工鏈接企業(yè)各個(gè)系統(tǒng),在不入侵企業(yè)原有系統(tǒng)基礎(chǔ)上對(duì)各個(gè)數(shù)據(jù)資源快速調(diào)取和處理;擺脫了系統(tǒng)孤立、數(shù)據(jù)孤島的問題,同時(shí)規(guī)避跨系統(tǒng)操作的風(fēng)險(xiǎn)。
如何將數(shù)字員工的理念在實(shí)際工作中落到實(shí)處帶來真實(shí)的效率呢?這里給出一些方案給大家參考。
1)任務(wù)系統(tǒng)以數(shù)字員工身份進(jìn)入工作通訊工具接收工作安排
這個(gè)方案中借鑒了電商系統(tǒng)的智能店小二的能力,打開數(shù)字員工的私聊窗口或在工作群中@數(shù)字員工時(shí),數(shù)字員工回應(yīng)消息并提供自己能提供的服務(wù)清單目錄,客戶可以選擇對(duì)應(yīng)的服務(wù)項(xiàng)目并確認(rèn)執(zhí)行。
通過模擬實(shí)際的運(yùn)維任務(wù)交代、任務(wù)執(zhí)行和任務(wù)反饋的流程,實(shí)現(xiàn)從工作社群到后臺(tái)任務(wù)執(zhí)行的無障礙串聯(lián)。
例如特定需求巡檢、空間清理、進(jìn)程重啟等常規(guī)運(yùn)維操作均可以用這樣的方式執(zhí)行,與數(shù)字員工的交互過程以逐層服務(wù)目錄選擇方式推進(jìn)。
當(dāng)然,也可以通過捕捉自然語言中的關(guān)鍵詞信息智能識(shí)別任務(wù),需要搭配一定的機(jī)器學(xué)習(xí)算法等應(yīng)用,在此不過多展開了。
2)任務(wù)系統(tǒng)以數(shù)字員工身份進(jìn)入OA平臺(tái)對(duì)接工作安排
在企業(yè)內(nèi)部已有OA系統(tǒng)環(huán)境中,可以將任務(wù)系統(tǒng)以數(shù)字員工身份注冊(cè)到OA中
通過OA系統(tǒng)下發(fā)的工作安排通過接口傳遞到任務(wù)系統(tǒng)中。通過對(duì)OA下發(fā)的工作安排的解析(自然語言解析或轉(zhuǎn)排人工),發(fā)起任務(wù)系統(tǒng)中的任務(wù)工單,并在任務(wù)系統(tǒng)中工單完結(jié)后通過接口回傳到OA平臺(tái)繼續(xù)流轉(zhuǎn)。
OA系統(tǒng)中應(yīng)用數(shù)字員工的好處主要是實(shí)現(xiàn)任務(wù)工作的自動(dòng)流轉(zhuǎn)對(duì)接,降低運(yùn)維人員的人工對(duì)接工作量。
對(duì)于一些重復(fù)性的工作安排,甚至可以在任務(wù)系統(tǒng)中部署一些自動(dòng)化環(huán)節(jié)實(shí)現(xiàn)對(duì)文件、數(shù)據(jù)的預(yù)加工處理,甚至某些處理工作都可以全部配置為自動(dòng)化執(zhí)行動(dòng)作,降低人工耗時(shí),提高效率。
例如常見的項(xiàng)目備案、項(xiàng)目合規(guī)審計(jì)等運(yùn)維工作,都可以以數(shù)字員工的形式提供全流程的自動(dòng)化執(zhí)行。
3)監(jiān)控告警平臺(tái)以數(shù)字員工身份進(jìn)入工作通訊工具發(fā)送系統(tǒng)預(yù)警
監(jiān)控告警平臺(tái)常規(guī)的消息推送形式一般是短信、郵件等,通過數(shù)字員工身份注冊(cè)到工作通訊工具后,更加符合日常的工作交互習(xí)慣。避免了運(yùn)維人員從多處接收信息的繁瑣和忙亂。
對(duì)于一些重要預(yù)警信息和預(yù)警恢復(fù)信息直接以數(shù)字員工身份在工作群中反饋,一方面加快了信息的傳遞效率,另一方面也可以提升領(lǐng)導(dǎo)對(duì)運(yùn)維工作的感知。
需要特別注意的是,對(duì)于數(shù)字員工在工作群的告警需要做相應(yīng)的級(jí)別控制和告警合并壓降,避免出現(xiàn)告警風(fēng)暴的現(xiàn)象,影響了故障發(fā)生時(shí)的正常交流,帶來負(fù)面效果。
4)運(yùn)維相關(guān)平臺(tái)以數(shù)字員工身份進(jìn)入任務(wù)系統(tǒng)
自動(dòng)化平臺(tái)具備了越來越多運(yùn)維動(dòng)作的執(zhí)行能力,一些自動(dòng)化運(yùn)維動(dòng)作已經(jīng)可以由事件觸發(fā)。
例如自愈類的切換、重啟等,又例如常規(guī)的備份清理等,都已可自動(dòng)觸發(fā),這些自動(dòng)化工作的執(zhí)行給運(yùn)維帶來了巨大的效率提升,但我們其實(shí)很難對(duì)其收益價(jià)值進(jìn)行評(píng)估。另外,仍有很多能力的執(zhí)行需要人工判斷后再觸發(fā)。
還有不少的企業(yè)內(nèi)部的信息化建設(shè)中,自動(dòng)化能力是根據(jù)不同的需求分散建設(shè)在不同的系統(tǒng)中的,如何講這些自動(dòng)化能力進(jìn)行整合,同樣是運(yùn)維團(tuán)隊(duì)需要考慮的問題。
我們可以將各自動(dòng)化平臺(tái)注冊(cè)為數(shù)字員工接入到任務(wù)系統(tǒng)。在任務(wù)系統(tǒng)中,各自動(dòng)化平臺(tái)可以以任務(wù)流程形式串聯(lián),將一個(gè)個(gè)子任務(wù)組成完整的運(yùn)維工作場景,避免的運(yùn)維場景的零散化。
我們還可以將監(jiān)控告警系統(tǒng)也注冊(cè)為數(shù)字員工接入到任務(wù)系統(tǒng)作為任務(wù)派單者角色,使其與自動(dòng)化操作能力對(duì)接,這樣也避免了監(jiān)控告警平臺(tái)對(duì)接多種不同自動(dòng)化平臺(tái)的改造工作量和繁瑣配置。
最后,通過將各類自動(dòng)化平臺(tái)數(shù)字員工化,我們可以在任務(wù)工時(shí)統(tǒng)計(jì)時(shí)更方便的獲得運(yùn)維工作的人工工時(shí)與機(jī)器工時(shí)的占比,并推動(dòng)更多的運(yùn)維工作自動(dòng)化執(zhí)行。

第四步,運(yùn)維成果體現(xiàn)數(shù)字化
一個(gè)運(yùn)維周期下來,通過上述的現(xiàn)狀量化評(píng)估、目標(biāo)量化設(shè)定、過程量化執(zhí)行,最終仍需要對(duì)整個(gè)運(yùn)維過程的改進(jìn)進(jìn)行再一次的量化評(píng)估。
一方面看初始設(shè)定的數(shù)字化目標(biāo)是否達(dá)成,也為我們的匯報(bào)提供充足素材。另一方面回顧整個(gè)運(yùn)維過程,發(fā)現(xiàn)管理上的薄弱環(huán)節(jié)以及效率瓶頸。
這些數(shù)據(jù)信息,又成為了下一個(gè)運(yùn)維周期的量化目標(biāo)。通過一次又一次的目標(biāo)迭代優(yōu)化,運(yùn)維團(tuán)隊(duì)的工作將更加趨向完善。
至于運(yùn)維成果的數(shù)字化呈現(xiàn)效果,從最早的報(bào)表、可視化展現(xiàn),到現(xiàn)在很多企業(yè)建設(shè)的各類領(lǐng)導(dǎo)駕駛艙或指揮中心大屏等能力,無不酷炫,在此不做展開了。


本文作者:李秋霖

本文來源:IT那活兒(上海新炬王翦團(tuán)隊(duì))


分享

收藏

點(diǎn)贊

在看

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/129661.html

相關(guān)文章

  • 這場金融網(wǎng)絡(luò)盛宴 華為又要秀出哪些前瞻性布局?

    摘要:最新發(fā)布的全球半年度行業(yè)云跟蹤報(bào)告也顯示,年全球四大行業(yè)金融制造醫(yī)療和公共部門的行業(yè)云支出總額將高達(dá)億美元。這樣一來,華為的金融網(wǎng)絡(luò)能夠獲得市場的青睞也就順理成章了。金融業(yè)數(shù)字化轉(zhuǎn)型的加速,使得金融云越來越成為行業(yè)標(biāo)配;但金融云的普及,又讓傳統(tǒng)網(wǎng)絡(luò)技術(shù)架構(gòu)受到了前所未有的沖擊。這樣看來,邏輯就簡單了:金融業(yè)必須先推動(dòng)傳統(tǒng)網(wǎng)絡(luò)技術(shù)架構(gòu)的升級(jí),促進(jìn)金融云的普及應(yīng)用,才能進(jìn)一步實(shí)現(xiàn)自身的數(shù)字化轉(zhuǎn)型...

    crossoverJie 評(píng)論0 收藏0
  • UCloud與云智慧簽署戰(zhàn)略合作協(xié)議,助力行業(yè)數(shù)字化轉(zhuǎn)型

    摘要:未來將攜手云智慧,把雙方合作落到實(shí)處,共同服務(wù)行業(yè)數(shù)字化發(fā)展,實(shí)現(xiàn)共贏。未來,與云智慧將整合各自在云計(jì)算服務(wù)和智能運(yùn)維服務(wù)上的優(yōu)勢,推出更多面向運(yùn)營商政府公共服務(wù)工業(yè)互聯(lián)網(wǎng)及傳統(tǒng)企業(yè)數(shù)字化轉(zhuǎn)型的解決方案,提供更專業(yè)高效的產(chǎn)品和服務(wù)。3月23日,優(yōu)刻得科技股份有限公司(以下簡稱UCloud優(yōu)刻得)與云智慧(北京)科技有限公司(以下簡稱云智慧)簽署戰(zhàn)略合作協(xié)議,雙方將整合各自技術(shù)資源優(yōu)勢,聯(lián)合推...

    Tecode 評(píng)論0 收藏0
  • UCloud優(yōu)刻得參加2022浙江CIO峰會(huì),助推傳統(tǒng)企業(yè)數(shù)字轉(zhuǎn)型

    9月16日,由浙江省企業(yè)信息化促進(jìn)會(huì)主辦的2022浙江CIO峰會(huì)在臺(tái)州市順利舉辦。UCloud優(yōu)刻得作為云計(jì)算領(lǐng)軍企業(yè)受邀出席,并在大會(huì)論壇現(xiàn)場圍繞企業(yè)海量數(shù)據(jù)存儲(chǔ)、多云管理等展開了數(shù)字化轉(zhuǎn)型技術(shù)經(jīng)驗(yàn)分享。浙江CIO峰會(huì)是促進(jìn)會(huì)推動(dòng)全省制造業(yè)企業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的品牌大會(huì)。為響應(yīng)十四五協(xié)同推進(jìn)數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,賦能傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的政策號(hào)召,推動(dòng)大數(shù)據(jù)技術(shù)產(chǎn)業(yè)創(chuàng)新發(fā)展、促進(jìn)數(shù)字技術(shù)與實(shí)體經(jīng)濟(jì)深...

    社區(qū)管理員 評(píng)論0 收藏0
  • BAT數(shù)據(jù)中心建設(shè)背后的“推手” 新華三是怎么做到的?

    摘要:日前,聚焦于的新華三數(shù)據(jù)中心基礎(chǔ)設(shè)施研討會(huì)在福州召開,在此次研討會(huì)上,新華三集團(tuán)全面展現(xiàn)了自身在數(shù)據(jù)中心全生命周期服務(wù)上的綜合實(shí)力。從在我們的生活中,幾乎每天都會(huì)用到百度的搜索引擎,騰訊的微信、QQ,阿里巴巴的淘寶和支付寶,但你有沒有想過,這些工具每天會(huì)被用到多少次?盡管沒有非常精確的統(tǒng)計(jì),數(shù)以億計(jì)肯定只是保守估計(jì)。我們之所以能夠享受這些互聯(lián)網(wǎng)工具帶來的便捷,與其背后所擁有的強(qiáng)大數(shù)據(jù)中心支撐...

    Nino 評(píng)論0 收藏0
  • AIOps 一場顛覆傳統(tǒng)運(yùn)維的盛筵

    摘要:陳旭相信的發(fā)布將開啟人工智能技術(shù)與傳統(tǒng)運(yùn)維碰撞顛覆的新時(shí)代。我卻認(rèn)為是一場顛覆傳統(tǒng)運(yùn)維的盛筵。綜上所述,的確是一場對(duì)于傳統(tǒng)運(yùn)維工具的顛覆革命,每個(gè)企業(yè)都應(yīng)該從現(xiàn)在開始,關(guān)注并嘗試使用智能運(yùn)維平臺(tái)。 顛覆傳統(tǒng)運(yùn)維。是 OneAPM CEO 陳旭經(jīng)常掛在嘴邊的一句話。為什么說 AIOps 將顛覆傳統(tǒng)運(yùn)維?如何才能把人工智能和運(yùn)維管理相結(jié)合并落地?2018年5月,OneAPM 推出了全新的 ...

    XFLY 評(píng)論0 收藏0
  • 華云攜手蘇中建設(shè)集團(tuán)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型 云計(jì)算替代傳統(tǒng)IT模式已成大勢

    摘要:對(duì)于蘇中建設(shè)來說,選用云計(jì)算逐步替代傳統(tǒng)的信息化環(huán)境是必然的選擇。在眾多云計(jì)算廠商中,蘇中集團(tuán)最終選擇牽手大型云計(jì)算服務(wù)提供商華云。隨著云計(jì)算時(shí)代的到來,傳統(tǒng)行業(yè)IT信息化也面臨巨大的機(jī)遇和挑戰(zhàn),過去的IT架構(gòu)也已經(jīng)無法滿足日新月異的新業(yè)務(wù)模式的發(fā)展需求。而云計(jì)算技術(shù),可以很好地解決快速擴(kuò)展、應(yīng)用高可用、數(shù)據(jù)容災(zāi)、安全可靠、數(shù)據(jù)集中共享、軟件集中部署、快速響應(yīng)業(yè)務(wù)對(duì)IT資源需求的問題,云計(jì)算...

    fevin 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<