摘要:我們的目的,就像是荒島余生一樣找到一個信念,在最殘酷的環境中,生存下去。這樣,會有很多地方會發生。監控值排查問題也是有過程的。比如飽和度一般指資源已完全使用,新請求在特定里排隊。
xin片之爭,已經暴露了中國xin的問題,我等碼農束手無策;而在操作系統方面,成果也是乏善可陳;現如今酷炫的Web監控工具,讓很多研發喪失了真正處理問題的能力。
越接近底層,就越接近真相,在計算機的世界,同樣適用。
我們的目的,就像是《荒島余生》一樣:找到一個信念,在最殘酷的環境中,生存下去。說的比較隱晦,其實就是:你換公司了,而你的新公司比較推崇devops,你要自己面對問題。
吹的那么高大上,一副拯救世界的感覺,但本系列的文章知識并不深,很多已經在大學里的操作系統見過了,雖然照讀課本的叫獸并不能讓你勾起絲毫興趣。
如果本系列能夠勾起你的些許興趣,就算目的達到了。本來是想要聊仔細點,但由于時間有限,又不是寫書,原理性的東西就不多說了。
內容文章將會嘗試單純的Cpu、Mem、Net、Disk、IO問題排查,然后組合各種元素,解決一些棘手問題,就是一些常用命令的組合。當然我們是java系的,所以會多一些java方面的討論。如果你不了解行文風格,可以先讀讀:《Java堆外內存排查小結--小姐姐味道》
為什么Linux系統會出現這樣那樣的問題呢?主要的原因就是計算機的各個部件的速度不均衡。Cpu在等cache line,cache 在等內存,內存在等設備。就像在連續17公里高速下坡路口設個收費站一樣,一不小心就車毀人亡。
設備五花八門,通常我們接觸的設備,就是硬盤和網卡。整個業務系統和操作系統充斥著各種各樣的緩沖區,CPU要通過中斷負責他們之間的協調。這樣,會有很多地方會發生bottleneck。
監控值排查問題也是有過程的。通常,關注一個硬件資源,比如CPU,我們關注以下基本要素:
1) 利用率 一般是瞬時值,屬于采樣范圍,用來判斷有沒有峰值。比如cpu utilization
2) 飽和度 一般指資源已完全使用,新請求在特定queue里排隊。比如cpu load過高
3) 錯誤信息 硬件或者驅動錯誤,比如dmesg命令顯示的OOM
4) 聯想信息 對引起的原因進行猜測,并用更多的工具驗證猜想。比如系統響應慢猜測大量用到了swap
監控值只是一種表象,具體引起的原因才是重點。我們通常希望純粹的資源限制所引起的故障,這種問題都比較好定位。大多數情況下都沒那么幸運,所以廣度上的信息共享能幫助很多。過程如下:
1) 信息收集 問題起始時間,上下文
2) 改動集合 問題發生前所有變更列表
3) 問題抽象 將描述抽象成具體的資源問題
4) 問題排查 將信息整理完畢,就可以進行真正的荒野之旅了
本測試用來決定你是不是本文目標受眾,如果無法回答以下問題,建議先看一點基本的Linux知識,這將會節省你的時間,因為文章不會對此提太多。
io wait 是什么意思?
swap是什么分區,怎么關閉?
/tmp目錄有什么特殊性?
管道是什么東東?
Linux發行版接下來熱熱身,瞧瞧Linux有什么發行版。
將常用腳本加入到PATH中
有些命令組合不好記,頻繁輸入也覺得煩,可以將這些過程整理成腳本,扔到path中。
還記得第一次安裝jdk,添加的環境變量么?Linux和它類似,不過它有多種shell。
通常我們用的叫bash,平常說的shell腳本就是bash腳本。但也有很多其他好用的shell,比如csh、ksh、zsh等。
查看/etc/shells文件看一下你安裝過的shell
[root@localhost ~]$ cat /etc/shells /bin/sh /bin/bash /bin/zsh /sbin/nologin /bin/dash
在個人領域,zsh配合oh-my-zsh(推薦)達到最佳,但服務器一般不會去改你的shell,通過一個環境變量,能夠看到你當前所使用的shell終端。
[root@localhost ~]$ echo $SHELL /bin/bash
針對于bash,我們的配置就在用戶目錄下的.bashrc文件中。
在用戶目錄下創建.bin目錄
mkdir ~/.bin
將目錄加入到環境變量PATH中
echo "export PATH=$PATH:~/.bin/" >> ~/.bashrc
在.bin創建一個文件xjj,內容為
echo "pleasant taste"
cat > ~/.bin/xjj <給xjj增加可執行權限
chmod a+x ~/.bin/xjj這樣,使用你的用戶,在任何地方,都可以執行xjj了
[root@localhost ~]$ xjj pleasant taste真是令人愉悅的味道~
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/8093.html
摘要:替換模式以上是命令的常用匹配模式,但它還有一個強大的替換模式,意思就是查找替換其中的某些值,并輸出結果。看兩個命令的語法好玩由于正則的關系,很多字符需要轉義。注意前半部分的范圍是不能使用這種方式的。sed命令應用廣泛,使用簡單,是快速文本處理的利器。它其實沒多少技巧,背誦、使用是最合適的學習渠道,屬于硬技能。但它又很復雜,因為高級功能太多。本篇不去關注sed的高級功能,僅對常用的一些操作,進...
摘要:比如面向連接的功能包發送接收數量包發送接收速率錯誤計數連接重連次數調用延遲連接狀態等。你要處理的,就是心跳超時的邏輯,比如延遲重連。發生異常后,可以根據不同的類型選擇斷線重連比如一些二進制協議的編解碼紊亂問題,或者調度到其他節點。 在java界,netty無疑是開發網絡應用的拿手菜。你不需要太多關注復雜的nio模型和底層網絡的細節,使用其豐富的接口,可以很容易的實現復雜的通訊功能。 和...
摘要:比如面向連接的功能包發送接收數量包發送接收速率錯誤計數連接重連次數調用延遲連接狀態等。你要處理的,就是心跳超時的邏輯,比如延遲重連。發生異常后,可以根據不同的類型選擇斷線重連比如一些二進制協議的編解碼紊亂問題,或者調度到其他節點。 在java界,netty無疑是開發網絡應用的拿手菜。你不需要太多關注復雜的nio模型和底層網絡的細節,使用其豐富的接口,可以很容易的實現復雜的通訊功能。 和...
閱讀 1600·2021-09-23 11:21
閱讀 2357·2021-09-07 10:13
閱讀 843·2021-09-02 10:19
閱讀 1140·2019-08-30 15:44
閱讀 1732·2019-08-30 13:18
閱讀 1920·2019-08-30 11:15
閱讀 1115·2019-08-29 17:17
閱讀 2024·2019-08-29 15:31