strace是一個可用于診斷、調試和分析的Linux用戶空間跟蹤器。我們用它來監控用戶空間進程和內核的交互,比如系統調用、信號傳遞、進程狀態變更等。
在日常運維中,strace作為一種動態跟蹤工具,能夠幫助運維高效地定位進程和服務故障。可以使用strace分析程序hang住或者程序崩潰的原因,其跟蹤程序執行過程中產生的系統調用及接收到的信號,幫助我們分析程序或命令執行中遇到的異常情況,使用strace跟蹤掛死程序,如果最后一行系統調用顯示完整,程序在邏輯代碼處掛死;如果最后一行系統調用顯示不完整,程序在該系統調用處掛死。
-c 統計每一系統調用的所執行的時間,次數和出錯的次數等. -d 輸出strace關于標準錯誤的調試信息. -f 跟蹤由fork調用所產生的子進程. -ff 如果提供-ofilename,則所有進程的跟蹤結果輸出到相應的filename.pid中,pid是各進程的進程號. -F 嘗試跟蹤vfork調用.在-f時,vfork不被跟蹤. -h 輸出簡要的幫助信息. -i 輸出系統調用的入口指針. -q 禁止輸出關于脫離的消息. -r 打印出相對時間關于,,每一個系統調用. -t 在輸出中的每一行前加上時間信息. -tt 在輸出中的每一行前加上時間信息,微秒級. -ttt 微秒級輸出,以秒了表示時間. -T 顯示每一調用所耗的時間. -v 輸出所有的系統調用.一些調用關于環境變量,狀態,輸入輸出等調用由于使用頻繁,默認不輸出. -V 輸出strace的版本信息. -x 以十六進制形式輸出非標準字符串 -xx 所有字符串以十六進制形式輸出. -a column 設置返回值的輸出位置.默認為40. -e expr 指定一個表達式,用來控制如何跟蹤.格式如下: [qualifier=][!]value1[,value2]... qualifier只能是trace,abbrev,verbose,raw,signal,read,write其中之一.value是用來限定的符號或數字.默認的qualifier是trace.感嘆號是否定符號.例如: -eopen等價于 -etrace=open,表示只跟蹤open調用.而-etrace!=open表示跟蹤除了open以外的其他調用.有兩個特殊的符號all 和none. 注意有些shell使用!來執行歷史記錄里的命令,所以要使用. -e trace=set 只跟蹤指定的系統調用.例如:-etrace=open,close,rean,write表示只跟蹤這四個系統調用.默認的為set=all. -e trace=file 只跟蹤有關文件操作的系統調用. -e trace=process 只跟蹤有關進程控制的系統調用. -e trace=network 跟蹤與網絡有關的所有系統調用. -e strace=signal 跟蹤所有與系統信號有關的系統調用 -e trace=ipc 跟蹤所有與進程通訊有關的系統調用 -e abbrev=set 設定strace輸出的系統調用的結果集.-v等與abbrev=none.默認為abbrev=all. -e raw=set 將指 定的系統調用的參數以十六進制顯示. -e signal=set 指定跟蹤的系統信號.默認為all.如signal=!SIGIO(或者signal=!io),表示不跟蹤SIGIO信號. -e read=set 輸出從指定文件中讀出的數據.例如: -e read=3,5 -e write=set 輸出寫入到指定文件中的數據. -o filename 將strace的輸出寫入文件filename -p pid 跟蹤指定的進程pid. -s strsize 指定輸出的字符串的最大長度.默認為32.文件名一直全部輸出. -u username 以username的UID和GID執行被跟蹤的命令 |
通用的完整用法:
strace -o output.txt -T -tt -e trace=all -p 29626 |
上面的含義是跟蹤29626進程的所有系統調用(-etrace=all),并統計系統調用的花費時間,以及開始時間(并以可視化的時分秒格式顯示),最后將記錄結果存在output.txt文件里面。
在給新主機10.230.19.132/133及數據庫添加MEM監控時,需要先在主機上安裝agent,在132執行./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin時一直卡住不動,既沒有報錯也沒有彈出如下的選擇命令:
Language Selection Please select the installation language [1] English - English [2] Japanese - 日本語 Please choose an option [1] : |
[mysql@onlinec]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/132.log 2>&1 |
futex(0x39dbf923c4, FUTEX_WAKE_PRIVATE,2147483647) = 0 open("/etc/resolv.conf", O_RDONLY) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=94, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "# Generated byNetworkManager na"..., 4096) = 94 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 open("/etc/hosts", O_RDONLY|O_CLOEXEC) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=187, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "27.0.0.1 localhost.localdomai"..., 4096) = 187 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 socket(PF_INET, SOCK_STREAM|SOCK_CLOEXEC,IPPROTO_TCP) = 7 setsockopt(7, SOL_TCP, TCP_NODELAY, [1], 4) = 0 setsockopt(7, SOL_SOCKET, SO_KEEPALIVE, [1], 4) =0 connect(7, {sa_family=AF_INET,sin_port=htons(6010), sin_addr=inet_addr("27.0.0.1")}, 16 |
[mysql@onlinecs_m]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/133.log 2>&1 |
poll([{fd=7, events=POLLIN|POLLOUT}], 1, 5000) = 1([{fd=7, revents=POLLOUT}]) sendto(7,"K3571 |