摘要:問題搭建完監控集群后發現沒有相關的數據源碼版本搭建參考定位過程是否沒有記錄容易搜索到因為的高占用需要實際上并非如此不帶任何參數情況下本地啟動在瀏覽器中打開可以看到中帶有是否寫入了打開
問題
搭建完cAdvisor InfluxDB Grafana監控集群后, 發現沒有tcp相關的數據.
https://github.com/google/cad...
git commit hash:9db8c7dee20a0c41627b208977ab192a0411bf93
https://botleg.com/stories/mo...
定位過程 是否cadvisor沒有記錄tcp state?容易搜索到, 因為cadvisor的高cpu占用, 需要--disable_metrics=""
https://github.com/google/cad...
實際上并非如此.
不帶任何參數情況下, 本地啟動cadvisor.
~/gopath/src/github.com/google/cadvisor(master*) ? sudo ./cadvisor -logtostderr
在瀏覽器中打開 http://127.0.0.1:8080/containers/ 可以看到response中, 帶有TcpState.
打開influx db shell
InfluxDB shell 0.9.6.1 > show databases name: databases --------------- name _internal mydb cadvisor > use cadvisor Using database cadvisor > show tag keys name: cpu_usage_system ---------------------- tagKey container_name machine
可以看到, 這些tagKey對應grafana中的select column.
那么, 是否cadvisor沒有寫入influxdb呢?
cadvisor/storage/influxdb/influxdb.go:174
func (self *influxdbStorage) containerStatsToPoints( cInfo *info.ContainerInfo, stats *info.ContainerStats, ) (points []*influxdb.Point) { // CPU usage: Total usage in nanoseconds points = append(points, makePoint(serCpuUsageTotal, stats.Cpu.Usage.Total)) // CPU usage: Time spend in system space (in nanoseconds) points = append(points, makePoint(serCpuUsageSystem, stats.Cpu.Usage.System)) // CPU usage: Time spent in user space (in nanoseconds) points = append(points, makePoint(serCpuUsageUser, stats.Cpu.Usage.User)) // CPU usage per CPU for i := 0; i < len(stats.Cpu.Usage.PerCpu); i++ { point := makePoint(serCpuUsagePerCpu, stats.Cpu.Usage.PerCpu[i]) tags := map[string]string{"instance": fmt.Sprintf("%v", i)} addTagsToPoint(point, tags) points = append(points, point) } // Load Average points = append(points, makePoint(serLoadAverage, stats.Cpu.LoadAverage)) // Memory Usage points = append(points, makePoint(serMemoryUsage, stats.Memory.Usage)) // Working Set Size points = append(points, makePoint(serMemoryWorkingSet, stats.Memory.WorkingSet)) // Network Stats points = append(points, makePoint(serRxBytes, stats.Network.RxBytes)) points = append(points, makePoint(serRxErrors, stats.Network.RxErrors)) points = append(points, makePoint(serTxBytes, stats.Network.TxBytes)) points = append(points, makePoint(serTxErrors, stats.Network.TxErrors)) self.tagPoints(cInfo, stats, points) return points }結論
需要修改cadvisor代碼, 將自己需要的metrics加上.
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/27795.html
摘要:是一個時序數據庫,專門用于存儲時序相關數據,很適合存儲的數據。容器監控數據存儲配置和運行是一個開源的分布式時序數據庫,使用語言開發。的特色功能作為時序數據庫,相比傳統數據庫它有很多特色功能,比如獨有的一些特色函數和連續查詢功能。 本文已獲得原作者__七把刀__授權。 隨著線上服務的全面 docker 化,對 docker 容器的監控就很重要了。SA 的監控系統是物理機的監控,在一個物理...
摘要:是一個時序數據庫,專門用于存儲時序相關數據,很適合存儲的數據。容器監控數據存儲配置和運行是一個開源的分布式時序數據庫,使用語言開發。的特色功能作為時序數據庫,相比傳統數據庫它有很多特色功能,比如獨有的一些特色函數和連續查詢功能。 本文已獲得原作者__七把刀__授權。 隨著線上服務的全面 docker 化,對 docker 容器的監控就很重要了。SA 的監控系統是物理機的監控,在一個物理...
摘要:本文已獲得原作者霸都民工哥授權。對于容器的監控方案可謂多種多樣,本身自帶命令。今天民工哥要介紹的是一款開源方案。所以我們要使用將這些實時監控到的信息存放起來。 本文已獲得原作者霸都民工哥授權。 showImg(https://segmentfault.com/img/bVbdbrr?w=709&h=300); 為什么需要監控?? 對于一個物理機上運行多個容器應用時,容器的運行情況如:C...
摘要:本文已獲得原作者霸都民工哥授權。對于容器的監控方案可謂多種多樣,本身自帶命令。今天民工哥要介紹的是一款開源方案。所以我們要使用將這些實時監控到的信息存放起來。 本文已獲得原作者霸都民工哥授權。 showImg(https://segmentfault.com/img/bVbdbrr?w=709&h=300); 為什么需要監控?? 對于一個物理機上運行多個容器應用時,容器的運行情況如:C...
showImg(https://segmentfault.com/img/remote/1460000014421849); 概述 一個宿主機上可以運行多個容器化應用,容器化應用運行于宿主機上,我們需要知道該容器的運行情況,包括 CPU使用率、內存占用、網絡狀況以及磁盤空間等等一系列信息,而且這些信息隨時間變化,我們稱其為時序數據,本文將實操 如何搭建一個可視化的監控中心 來收集這些承載著具體應...
閱讀 3244·2021-11-22 12:07
閱讀 1885·2021-10-12 10:11
閱讀 1048·2019-08-30 15:44
閱讀 2948·2019-08-30 12:45
閱讀 2201·2019-08-29 16:41
閱讀 1645·2019-08-29 16:35
閱讀 2632·2019-08-29 12:57
閱讀 1156·2019-08-26 13:51