摘要:操作數(shù)據(jù)庫(kù)使用這個(gè)驅(qū)動(dòng),直接操作數(shù)據(jù)庫(kù),主要就是查詢(xún)操作。定時(shí)任務(wù)使用一個(gè)多帶帶的線(xiàn)程,每分鐘掃描一次,如果級(jí)別的日志條數(shù)超過(guò)條,就發(fā)郵件通知。日志為這個(gè)小小的腳本配置一下日志,讓日志可以輸出到文件和控制臺(tái)中。
在公司里做的一個(gè)接口系統(tǒng),主要是對(duì)接第三方的系統(tǒng)接口,所以,這個(gè)系統(tǒng)里會(huì)和很多其他公司的項(xiàng)目交互。隨之而來(lái)一個(gè)很蛋疼的問(wèn)題,這么多公司的接口,不同公司接口的穩(wěn)定性差別很大,訪問(wèn)量大的時(shí)候,有的不怎么行的接口就各種出錯(cuò)了。
這個(gè)接口系統(tǒng)剛剛開(kāi)發(fā)不久,整個(gè)系統(tǒng)中,處于比較邊緣的位置,不像其他項(xiàng)目,有日志庫(kù),還有短信告警,一旦出問(wèn)題,很多情況下都是用戶(hù)反饋回來(lái),所以,我的想法是,拿起python,為這個(gè)項(xiàng)目寫(xiě)一個(gè)監(jiān)控。如果在調(diào)用某個(gè)第三方接口的過(guò)程中,大量出錯(cuò)了,說(shuō)明這個(gè)接口有有問(wèn)題了,就可以更快的采取措施。
項(xiàng)目的也是有日志庫(kù)的,所有的info,error日志都是每隔一分鐘掃描入庫(kù),日志庫(kù)是用的mysql,表里有幾個(gè)特別重要的字段:
level 日志級(jí)別
message 日志內(nèi)容
file_name Java代碼文件
log_time 日志時(shí)間
有日志庫(kù),就不用自己去線(xiàn)上環(huán)境掃日志分析了,直接從日志庫(kù)入手。由于日志庫(kù)在線(xiàn)上時(shí)每隔1分鐘掃,那我就去日志庫(kù)每隔2分鐘掃一次,如果掃到有一定數(shù)量的error日志就報(bào)警,如果只有一兩條錯(cuò)誤就可以無(wú)視了,也就是短時(shí)間爆發(fā)大量錯(cuò)誤日志,就可以斷定系統(tǒng)有問(wèn)題了。報(bào)警方式就用發(fā)送郵件,所以,需要做下面幾件事情:
1. 操作MySql。
2. 發(fā)送郵件。
3. 定時(shí)任務(wù)。
4. 日志。
5. 運(yùn)行腳本。
明確了以上幾件事情,就可以動(dòng)手了。
操作數(shù)據(jù)庫(kù)使用MySQLdb這個(gè)驅(qū)動(dòng),直接操作數(shù)據(jù)庫(kù),主要就是查詢(xún)操作。
獲取數(shù)據(jù)庫(kù)的連接:
pythondef get_con(): host = "127.0.0.1" port = 3306 logsdb = "logsdb" user = "root" password = "never tell you" con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8") return con
從日志庫(kù)里獲取數(shù)據(jù),獲取當(dāng)前時(shí)間之前2分鐘的數(shù)據(jù),首先,根據(jù)當(dāng)前時(shí)間進(jìn)行計(jì)算一下時(shí)間。之前,計(jì)算有問(wèn)題,現(xiàn)在已經(jīng)修改,謝謝一樓wade305朋友指正~
pythondef calculate_time(): now = time.mktime(datetime.now().timetuple())-60*2 result = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(now)) return result
然后,根據(jù)時(shí)間和日志級(jí)別去日志庫(kù)查詢(xún)數(shù)據(jù)
pythondef get_data(): select_time = calculate_time() logger.info("select time:"+select_time) sql = "select file_name,message from logsdb.app_logs_record " "where log_time >"+"""+select_time+""" "and level="+""ERROR"" "order by log_time desc" conn = get_con() cursor = conn.cursor() cursor.execute(sql) results = cursor.fetchall() cursor.close() conn.close() return results發(fā)送郵件
使用python發(fā)送郵件比較簡(jiǎn)單,使用標(biāo)準(zhǔn)庫(kù)smtplib就可以
這里使用163郵箱進(jìn)行發(fā)送,你可以使用其他郵箱或者企業(yè)郵箱都行,不過(guò)host和port要設(shè)置正確。
pythondef send_email(content): sender = "sender_monitor@163.com" receiver = ["rec01@163.com", "rec02@163.com"] host = "smtp.163.com" port = 465 msg = MIMEText(content) msg["From"] = "sender_monitor@163.com" msg["To"] = "rec01@163.com,rec02@163.com" msg["Subject"] = "system error warning" try: smtp = smtplib.SMTP_SSL(host, port) smtp.login(sender, "123456") smtp.sendmail(sender, receiver, msg.as_string()) logger.info("send email success") except Exception, e: logger.error(e)定時(shí)任務(wù)
使用一個(gè)多帶帶的線(xiàn)程,每2分鐘掃描一次,如果ERROR級(jí)別的日志條數(shù)超過(guò)5條,就發(fā)郵件通知。
pythondef task(): while True: logger.info("monitor running") results = get_data() if results is not None and len(results) > 5: content = "recharge error:" logger.info("a lot of error,so send mail") for r in results: content += r[1]+" " send_email(content) sleep(2*60)日志
為這個(gè)小小的腳本配置一下日志log.py,讓日志可以輸出到文件和控制臺(tái)中。
python# coding=utf-8 import logging logger = logging.getLogger("mylogger") logger.setLevel(logging.DEBUG) fh = logging.FileHandler("monitor.log") fh.setLevel(logging.INFO) ch = logging.StreamHandler() ch.setLevel(logging.INFO) formatter = logging.Formatter("%(asctime)s - %(name)s - %(levelname)s - %(message)s") fh.setFormatter(formatter) ch.setFormatter(formatter) logger.addHandler(fh) logger.addHandler(ch)
所以,最后,這個(gè)監(jiān)控小程序就是這樣的app_monitor.py
python# coding=utf-8 import threading import MySQLdb from datetime import datetime import time import smtplib from email.mime.text import MIMEText from log import logger def get_con(): host = "127.0.0.1" port = 3306 logsdb = "logsdb" user = "root" password = "never tell you" con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8") return con def calculate_time(): now = time.mktime(datetime.now().timetuple())-60*2 result = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(now)) return result def get_data(): select_time = calculate_time() logger.info("select time:"+select_time) sql = "select file_name,message from logsdb.app_logs_record " "where log_time >"+"""+select_time+""" "and level="+""ERROR"" "order by log_time desc" conn = get_con() cursor = conn.cursor() cursor.execute(sql) results = cursor.fetchall() cursor.close() conn.close() return results def send_email(content): sender = "sender_monitor@163.com" receiver = ["rec01@163.com", "rec02@163.com"] host = "smtp.163.com" port = 465 msg = MIMEText(content) msg["From"] = "sender_monitor@163.com" msg["To"] = "rec01@163.com,rec02@163.com" msg["Subject"] = "system error warning" try: smtp = smtplib.SMTP_SSL(host, port) smtp.login(sender, "123456") smtp.sendmail(sender, receiver, msg.as_string()) logger.info("send email success") except Exception, e: logger.error(e) def task(): while True: logger.info("monitor running") results = get_data() if results is not None and len(results) > 5: content = "recharge error:" logger.info("a lot of error,so send mail") for r in results: content += r[1]+" " send_email(content) time.sleep(2*60) def run_monitor(): monitor = threading.Thread(target=task) monitor.start() if __name__ == "__main__": run_monitor()運(yùn)行腳本
腳本在服務(wù)器上運(yùn)行,使用supervisor進(jìn)行管理。
在服務(wù)器(centos6)上安裝supervisor,然后在/etc/supervisor.conf中加入一下配置
bash[program:app-monitor] command = python /root/monitor/app_monitor.py directory = /root/monitor user = root
然后在終端中運(yùn)行supervisord啟動(dòng)supervisor。
在終端中運(yùn)行supervisorctl,進(jìn)入shell,運(yùn)行status查看腳本的運(yùn)行狀態(tài)。
這個(gè)小監(jiān)控思路很清晰,還可以繼續(xù)修改,比如:監(jiān)控特定的接口,發(fā)送短信通知等等。
因?yàn)橛腥罩編?kù),就少了去線(xiàn)上正式環(huán)境掃描日志的麻煩,所以,如果沒(méi)有日志庫(kù),就要自己上線(xiàn)上環(huán)境掃描,在正式線(xiàn)上環(huán)境一定要小心哇~
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/45318.html
摘要:月日,助力在北京舉辦全球最盛大的年度聚會(huì),國(guó)內(nèi)外頂尖的工程師做了很精彩的分享和互動(dòng),現(xiàn)場(chǎng)多名愛(ài)好者參與了此次技術(shù)主題盛宴。后續(xù)會(huì)有更多現(xiàn)場(chǎng)照片持續(xù)更新 11月15日,SegmentFault 助力PyCon China 在北京舉辦全球 Pythoneer 最盛大的年度聚會(huì),國(guó)內(nèi)外頂尖的Python 工程師做了很精彩的分享和互動(dòng),現(xiàn)場(chǎng)300多名python愛(ài)好者參與了此次技術(shù)主題盛宴。 ...
摘要:本文內(nèi)容整理自我在知乎的回答用寫(xiě)的最佳實(shí)踐是什么,下面的內(nèi)容是對(duì)知乎舊有回答的一個(gè)補(bǔ)充,尤其有一些主要針對(duì)如果想要更多內(nèi)容,可以查看知乎對(duì)于該問(wèn)題的一些回答。主要是針對(duì)提供的內(nèi)容進(jìn)行再提取進(jìn)行展示。 先來(lái)曬個(gè)圖: showImg(https://segmentfault.com/img/bVIDeB?w=1434&h=1430); 對(duì)于一些 Python 的小項(xiàng)目,使用 vim 是一個(gè)...
摘要:本文內(nèi)容整理自我在知乎的回答用寫(xiě)的最佳實(shí)踐是什么,下面的內(nèi)容是對(duì)知乎舊有回答的一個(gè)補(bǔ)充,尤其有一些主要針對(duì)如果想要更多內(nèi)容,可以查看知乎對(duì)于該問(wèn)題的一些回答。主要是針對(duì)提供的內(nèi)容進(jìn)行再提取進(jìn)行展示。 先來(lái)曬個(gè)圖: showImg(https://segmentfault.com/img/bVIDeB?w=1434&h=1430); 對(duì)于一些 Python 的小項(xiàng)目,使用 vim 是一個(gè)...
摘要:前提好幾周沒(méi)更新博客了,對(duì)不斷支持我博客的童鞋們說(shuō)聲抱歉了。熟悉我的人都知道我寫(xiě)博客的時(shí)間比較早,而且堅(jiān)持的時(shí)間也比較久,一直到現(xiàn)在也是一直保持著更新?tīng)顟B(tài)。 showImg(https://segmentfault.com/img/remote/1460000014076586?w=1920&h=1080); 前提 好幾周沒(méi)更新博客了,對(duì)不斷支持我博客的童鞋們說(shuō)聲:抱歉了!。自己這段時(shí)...
閱讀 640·2021-08-17 10:15
閱讀 1724·2021-07-30 14:57
閱讀 1978·2019-08-30 15:55
閱讀 2820·2019-08-30 15:55
閱讀 2708·2019-08-30 15:44
閱讀 670·2019-08-30 14:13
閱讀 2386·2019-08-30 13:55
閱讀 2592·2019-08-26 13:56