摘要:前言告警將重要信息發送給運維或者其他相關人,及時發現并且處理問題。在所有開源監控軟件里面,的告警方式無疑是最棒的。在發生告警之后立即發送郵件和微信消息給用戶,分鐘后還未確認,那么發送短信,分鐘還未確認則打電話給用戶。
1. 前言
告警將重要信息發送給運維「或者其他相關人」,及時發現并且處理問題。在所有開源監控軟件里面,Zabbix 的告警方式無疑是最棒的。告警的方式各式各樣,從 Email 告警到飛信、139/189郵箱、最后到微信甚至電話告警,接入存在各種問題以及困難,有沒有什么軟件能夠將他們All In one呢?OneAlert
2. Zabbix傳統告警方法Email:調用 sendmail 、sendEmail 等腳本通過 SMTP 發送郵件
飛信:飛信已經退出歷史舞臺,不再有人使用
189/139:發送郵箱郵件至郵箱,郵箱將短信轉到用戶手機短信,存在一定的延遲
微信:需要申請一個微信公眾號,并接入API,整個流程比較復雜,而且存在會話時間限制
短信:眾多短信網關收費不同、穩定性也不確定,需要通過API接入
3.傳統告警 VS OneAlert在整個使用過程中,得出了傳統告警方式的不足以及給個了 OneAlert 告警的功能,具體如下:
3.1 傳統告警方式的不足Zabbix 郵件告警經常發不出去
如需短信告警,要么購買短信貓要么購買短信 API,整個流程太麻煩
微信告警需要申請公眾號以及 API 接入,而且會話有時間限制
夜間的告警基本成為一個擺設,試問誰能被微弱的短信聲叫醒
阿里云、騰訊云、Zabbix 各種系統告警都需要多帶帶配置,工作繁瑣
普遍缺少告警分析
139/189 發送告警存在明顯的延遲
3.2 OneAlert告警功能告警 All In One,支持微信、郵箱、短信、APP、電話告警
支持接入 Zabbix、Nagios、阿里云、騰訊云、監控寶等等告警信息
靈活的分配策略,可靈活的分配告警信息發送給相關人員
微信、郵箱、app 等告警方式全部免費
4.接入準備由于 Zabbix 官方已經升級到zabbix-3.0.0alpha,考慮到未來的趨勢,我也迫不及待的升級到了 3.0,除了 Web 風格變化,大部分都差不多。所以本文適用于 Zabbix2.x 與 Zabbix3.x 版本。接下來跟著涼白開將 OneAlert 接入 Zabbix,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
5. OneAlert 后臺操作 5.1 設置提醒郵件,短信,微信,電話提醒,多策略提醒,如下圖,靈活的定義告警規則。在發生告警之后立即發送郵件和微信消息給用戶,10分鐘后還未確認,那么發送短信,30分鐘還未確認則打電話給用戶。
5.2 設置分派策略可以設定做種分派策略,在告警第一時間發送通知給哪些人,如果在 30 分鐘還未處理好,可以將消息發送給上級主管人員,如下圖
5.3 創建應用登陸 OneAlert 后臺,點擊告警 -> 應用 -> 新增應用,集成類型包含阿里、Nagios、騰訊云等多種,我們選擇 Zabbix 最后保存即可。將會生成應用 KEY,Key 在后面將會被用到!
6.安裝onealert agent#cd /usr/local/src/ # wget http://cdn.110monitor.com/open/download/alert-agent-4.0.1-RC2.tar.gz # tar –xvf alert-agent-4.0.1-RC2.tar.gz(注意:參數為-xvf,不是-xzvf) # cp -rp alert-agent /usr/local/zabbix-3.0.0/alertscripts # cd /usr/local/zabbix-3.0.0/alertscripts # cp alert-agent/plugin/zabbix-plugin/110monitor . # chmod +x ./110monitor7. Zabbix 集成OneAlert
以下操作均在 Zabbix Web 后臺完成
7.1 創建 OneAlert 媒介administration->Media Types->create media type,如下圖
7.2 Admin 用戶添加 OneAlert 媒介Administration->Users->Admin->點擊media->Add,輸入如下:send to 為 OneAlert 后臺生成的 key
點擊Configuration->Action->create action
主題為trigger和resolve,意味著告警觸發和恢復都會同步到 110monitor
設置告警內容,注意冒號「:」前的內容不可變更,冒號「:」后的內容可以自行編輯,只能使用以下7調告警信息,否則告警無法發送至 OneAlert 接口
`alarmName:{TRIGGER.NAME}` `entityName:{HOSTNAME}` ` entityId:{IPADDRESS}` `value:{TRIGGER.VALUE}` ` eventId:{EVENT.ID}` `priority:{TRIGGER.SEVERITY}` `alarmContent:{IPADDRESS} ` `{ITEM.NAME}:{ITEM.VALUE}`8. Zabbix + OneAlert 集成測試
來制造一個故障,選定一臺 Zabbix 客戶端,執行如下命令:
# killall zabbix_agentd
等候五分鐘,OneAlert 后臺有如下告警
并且也收到了微信(需要關注公眾號,并且綁定賬號)和短信告警
9. OneAlert 告警分析提供了一份 Zabbix 等開源監控都沒有的告警信息分析,運維能清晰的掌握最近服務器狀態
10. 總結OneAlert與Zabbix的集成就說到這,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
作者:涼白開 網址:http://www.ttlsa.com
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/7926.html
摘要:也有幸和全球說運維負責人李云偉先生進行一次深入溝通。面臨挑戰全球說的應用主要是在線系統和移動為主。是北京科技有限公司旗下產品,中國首個模式的,集成國內外主流監控支撐系統,實現一個平臺上集中處理所有事件,提升可靠性。 客戶背景 「全球說」 Talkmate,是北京酷語時代教育科技有限公司(酷語科技)旗下產品,酷語科技是一家誕生于中國的語言技術公司,致力于為全球用戶提供一個全新的多語言學習...
摘要:告警關聯唯一使監控和報警都步入正軌的好辦法,就是通過告警關聯。企業如果適應了告警關聯,信息告警的圖表盤上確實能減少很多壓力。 上節回顧 對于許多 IT 和運維團隊來說,Nagios 既是一個福音也是一個詛咒。一方面,Naigos 在 IT 應用的工作領域中,給予了你可以實時查看告警數據的可能性;但是另一方面,Nagios 也能夠生成超級多的告警,對于任何一個運維人員或是運維團隊來說都是...
摘要:如何有效處理緊急事件驅動的工作,成為特別是運維主管運維工作的關鍵。通知到位和及時響應。機器學習領域是未來的重要發展方向,目前我們還在摸索中。機器學習告警合并事件單的處理如果告警量很大,告警后續處理和跟蹤往往會依賴于外部團隊部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺[OneAlert創始人,著《云計算與OpenStack》,在IT運營管理、云計算方面從業10多年。 正文 互聯...
摘要:如何有效處理緊急事件驅動的工作,成為特別是運維主管運維工作的關鍵。通知到位和及時響應。機器學習領域是未來的重要發展方向,目前我們還在摸索中。機器學習告警合并事件單的處理如果告警量很大,告警后續處理和跟蹤往往會依賴于外部團隊部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺[OneAlert創始人,著《云計算與OpenStack》,在IT運營管理、云計算方面從業10多年。 正文 互聯...
摘要:作為骨灰級粉絲,一直以來對第三方監控都是拒絕的。例如白屏時間首屏時間腳本錯誤網頁加載就緒時間各種瀏覽器的訪問情況,甚至能了解不同瀏覽器運營商地區用戶的訪問狀況。腳本錯誤在所難免,錯誤進一步導致網站部分功能無法使用。 作為 Zabbix 骨灰級粉絲,一直以來對第三方監控(APM)都是拒絕的。一來覺得收費,二來擔心數據被人所知,三來覺得 Zabbix 牛逼到無可取代。但是,隨著 APM 市...
閱讀 3039·2021-11-02 14:40
閱讀 850·2019-08-30 15:53
閱讀 1269·2019-08-30 15:53
閱讀 3264·2019-08-30 13:53
閱讀 3309·2019-08-29 12:50
閱讀 1138·2019-08-26 13:49
閱讀 1869·2019-08-26 12:20
閱讀 3667·2019-08-26 11:33