點擊上方“IT那活兒”公眾號,關注后了解更多內容,不管IT什么活兒,干就完了!!!
本著業務連續性運維,如果不了解業務,那就是聾子的耳朵--白搭。本文給大家帶來筆者日常工作中關于業務相關知識分享,以及在遇到問題后,如何基于平臺沉淀場景的過程。希望對大家的一體化運維有所幫助和啟發。
應急開機是當系統出現異常(例如繳費和開機積壓)終端用戶已正常繳費但仍然未復機情況下,強制生成開機工單給用戶快速開機,恢復用戶服務,以此保證客戶終端使用,避免造成大規模終端用戶投訴的一套程序。
應急進程檢查:應急處理進程重啟和檢查;
應急模式調整:常規應急模式需要根據字典組判斷營業用戶狀態和停機鎖,無條件應急模式不判斷營業用戶狀態和停機鎖直接開機;
應急開機程序啟動:待開機用戶號碼的提取、處理,如提取指定時間段的繳費用戶、指定開機號碼集合、指定時間段服務開通側下發的停機指令用戶;
應急開機數據檢查:檢查應急開機掃描用戶數據及其處理情況。各種業務開機工單指令的執行速度及積壓檢查,含語音、GPRS、VOLTE、非VOLTE、寬帶、和TV、IMS等業務。用戶開機是否成功,涉及MML(HLR)指令、SOAP協議(PROVISION平臺)指令檢查;
應急用戶狀態同步:用戶數據狀態同步,用戶的網絡側狀態、平臺側狀態、營業側狀態、賬務側狀態保持一致;
應急用戶強制信控:強制信控數據的生成,對于應該停機而被開機的用戶重新觸發強制信控進行停機。
以上各環節監控,以前均是通過手工登錄對應主機或者物理庫執行監控腳本的形式進行檢查;監控鏈條長,形式多樣,純手工操作容易形成顧頭不顧尾的局面,導致部分節點遺漏監控,降低應急開機的及時性,使應急開機的效果大打折扣。
系統故障,需要馬上執行應急開機,啟動應急開機程序后,按照常規監控流程檢查了應急數據的處理及下發,以為下發完成后用戶全部開機完成了,但是遺漏了更下游環節的開機工單處理積壓情況,由于工單積壓導致用戶并未全部及時開機完成,類似情況易引起次生故障。
因為手工監控耗時,所以故障處理時第一時間,每個人都只關注自己負責環節的數據處理情況,但是每個人自己所負責的環節數據處理完了不代表整個故障處理完了,不代表用戶服務恢復正常了,因此需要快速掌握從應急程序啟動到最終用戶服務恢復之間所有環節的處理情況。
因此有必要擯棄手工執行監控腳本的方式,引入自動化腳本或者可視化頁面的形式完成監控及流程處理。
自動化運維平臺中的拓撲圖模塊完全具備使用拖拉拽節點的方式組合完整業務流程圖,并在節點上展示監控數據,達到一站式展示應急開機程序啟動后各個環節處理情況的目的。
如下圖,展示的就是自動化運維平臺上應急開機流程圖:
該流程圖把應急開機各個環節全部以節點的形式展示出來,如用戶號碼從提取到處理到工單執行到最終開機,并在節點上以指標和懸浮框的方式把監控數據直觀展示出來,如處理進程的數量、應急模式是常規還是無條件、應急開機數據處理情況及處理量、工單積壓情況及處理量、已開機用戶量及隨機抽查的號碼,均可以在一張流程圖上顯示出來。
啟動應急程序后,不再需要根據應急流程各個環節手工執行相應監控腳本,只需要打開該流程圖即可清晰地看到各個環節處理情況,大幅節約了操作時間,更清晰地知道應急開機整體完成情況。
以平臺為依托,把各環節的固定監控交給平臺,從繁多的手工監控中抽身出來,更多關注業務層面的及時性,有效性,連續性以及故障的前因后果,持續將完整業務流程場景化可視化工作迭代下去。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/129243.html
摘要:開放生態計劃,回饋社會阿里巴巴全球運行指揮中心掌門人沈乘黃首先分享了智能運維在阿里巴巴線上故障管理領域的應用經驗。 摘要: 為響應馬老師家國情懷,世界擔當的號召,開放AI+生態計劃,將讓集團內部服務過程中積累下的技術與經驗更好地回饋社會,任何企業或合作伙伴均可以簡單方便的接入阿里巴巴智能故障管理平臺,通過對接入數據的訓練學習實時提供異常檢測、關聯分析、根因定位的能力,使原有的IT管理模...
摘要:今天,我們邀請阿里高級技術專家力君,為大家分享自動智能的客服調度系統。明確了客服調度的核心問題,也知道了難點,更看到了目前的現狀后,我們決定打造一款自動智能的客服調度系統。 小嘰導讀:提到調度,大家腦海中可能想起的是調度阿里云的海量機器資源,而對于阿里集團客戶體驗事業群(CCO)而言,我們要調度的不是機器,而是客服資源。今天,我們邀請阿里高級技術專家力君,為大家分享自動、智能的客服調度...
摘要:一,智慧園區建設的核心價值,三維可視化應用,未來智慧園區管理發展方向。,應急指揮預案可視化通過對應急預案的資源流程事件預案進行可視化管理,為園區重大危險事故提供高效調度指揮管理手段。獲取智慧園區三維可視化系統源碼 一,智慧園區建設的核心價值 1,三維可視化應用,未來智慧園區管理發展方向。 ?...
摘要:趨勢擴展到機器學習領域已經成為容器編排的事實標準,它的領域也在不斷擴張,未來將成為機器學習技術棧的一部分。比如,發布了開源的,通過添加到集群中,擴展了的,使得機器學習的工作負載在中成為一等公民。 2018年對于微服務來說是非常重要的一年,這一年Service Mesh開始嶄露頭角,解決服務間復雜的通信問題,這一年很多國內互聯網公司已經有了較為成熟的微服務實踐案例,網易云主辦的微服務實踐...
摘要:數字孿生思考未來,實現智能可視。同期將舉行多場高端活動,共商物聯網行業發展大計,集商貿交易展示交流活動宣傳評優推介為一體的國際化盛會。 優锘科技作為互聯網IT可視化管理和物聯網IoT可視化管理領域的領導廠商,2019又將展開新系列市場活動,我們期待與業界專業人士共同探討及交流行業最前沿的技術與趨勢。showImg(https://segmentfault.com/img/bVbstwz...
摘要:明確了客服調度的核心問題,也知道了難點,更看到了目前的現狀后,我們決定打造一款自動智能的客服調度系統。對于社會化的云客服,我們可以做到,比如排隊數超過某值時,自動觸發云客服的應急放班。 背景 為什么客服需要調度?阿里集團客戶體驗事業群(CCO)目前承接了阿里集團以及生態體的客戶服務業務,我們的客戶通過各個渠道來尋求解決各類問題,每天的進線量巨大,而且經常伴隨著突發性進線,比如天貓代金券...
閱讀 1353·2023-01-11 13:20
閱讀 1699·2023-01-11 13:20
閱讀 1211·2023-01-11 13:20
閱讀 1902·2023-01-11 13:20
閱讀 4161·2023-01-11 13:20
閱讀 2748·2023-01-11 13:20
閱讀 1397·2023-01-11 13:20
閱讀 3664·2023-01-11 13:20