strace是一個(gè)可用于診斷、調(diào)試和分析的Linux用戶空間跟蹤器。我們用它來(lái)監(jiān)控用戶空間進(jìn)程和內(nèi)核的交互,比如系統(tǒng)調(diào)用、信號(hào)傳遞、進(jìn)程狀態(tài)變更等。
在日常運(yùn)維中,strace作為一種動(dòng)態(tài)跟蹤工具,能夠幫助運(yùn)維高效地定位進(jìn)程和服務(wù)故障??梢允褂胹trace分析程序hang住或者程序崩潰的原因,其跟蹤程序執(zhí)行過(guò)程中產(chǎn)生的系統(tǒng)調(diào)用及接收到的信號(hào),幫助我們分析程序或命令執(zhí)行中遇到的異常情況,使用strace跟蹤掛死程序,如果最后一行系統(tǒng)調(diào)用顯示完整,程序在邏輯代碼處掛死;如果最后一行系統(tǒng)調(diào)用顯示不完整,程序在該系統(tǒng)調(diào)用處掛死。
-c 統(tǒng)計(jì)每一系統(tǒng)調(diào)用的所執(zhí)行的時(shí)間,次數(shù)和出錯(cuò)的次數(shù)等. -d 輸出strace關(guān)于標(biāo)準(zhǔn)錯(cuò)誤的調(diào)試信息. -f 跟蹤由fork調(diào)用所產(chǎn)生的子進(jìn)程. -ff 如果提供-ofilename,則所有進(jìn)程的跟蹤結(jié)果輸出到相應(yīng)的filename.pid中,pid是各進(jìn)程的進(jìn)程號(hào). -F 嘗試跟蹤vfork調(diào)用.在-f時(shí),vfork不被跟蹤. -h 輸出簡(jiǎn)要的幫助信息. -i 輸出系統(tǒng)調(diào)用的入口指針. -q 禁止輸出關(guān)于脫離的消息. -r 打印出相對(duì)時(shí)間關(guān)于,,每一個(gè)系統(tǒng)調(diào)用. -t 在輸出中的每一行前加上時(shí)間信息. -tt 在輸出中的每一行前加上時(shí)間信息,微秒級(jí). -ttt 微秒級(jí)輸出,以秒了表示時(shí)間. -T 顯示每一調(diào)用所耗的時(shí)間. -v 輸出所有的系統(tǒng)調(diào)用.一些調(diào)用關(guān)于環(huán)境變量,狀態(tài),輸入輸出等調(diào)用由于使用頻繁,默認(rèn)不輸出. -V 輸出strace的版本信息. -x 以十六進(jìn)制形式輸出非標(biāo)準(zhǔn)字符串 -xx 所有字符串以十六進(jìn)制形式輸出. -a column 設(shè)置返回值的輸出位置.默認(rèn)為40. -e expr 指定一個(gè)表達(dá)式,用來(lái)控制如何跟蹤.格式如下: [qualifier=][!]value1[,value2]... qualifier只能是trace,abbrev,verbose,raw,signal,read,write其中之一.value是用來(lái)限定的符號(hào)或數(shù)字.默認(rèn)的qualifier是trace.感嘆號(hào)是否定符號(hào).例如: -eopen等價(jià)于 -etrace=open,表示只跟蹤open調(diào)用.而-etrace!=open表示跟蹤除了open以外的其他調(diào)用.有兩個(gè)特殊的符號(hào)all 和none. 注意有些shell使用!來(lái)執(zhí)行歷史記錄里的命令,所以要使用. -e trace=set 只跟蹤指定的系統(tǒng)調(diào)用.例如:-etrace=open,close,rean,write表示只跟蹤這四個(gè)系統(tǒng)調(diào)用.默認(rèn)的為set=all. -e trace=file 只跟蹤有關(guān)文件操作的系統(tǒng)調(diào)用. -e trace=process 只跟蹤有關(guān)進(jìn)程控制的系統(tǒng)調(diào)用. -e trace=network 跟蹤與網(wǎng)絡(luò)有關(guān)的所有系統(tǒng)調(diào)用. -e strace=signal 跟蹤所有與系統(tǒng)信號(hào)有關(guān)的系統(tǒng)調(diào)用 -e trace=ipc 跟蹤所有與進(jìn)程通訊有關(guān)的系統(tǒng)調(diào)用 -e abbrev=set 設(shè)定strace輸出的系統(tǒng)調(diào)用的結(jié)果集.-v等與abbrev=none.默認(rèn)為abbrev=all. -e raw=set 將指 定的系統(tǒng)調(diào)用的參數(shù)以十六進(jìn)制顯示. -e signal=set 指定跟蹤的系統(tǒng)信號(hào).默認(rèn)為all.如signal=!SIGIO(或者signal=!io),表示不跟蹤SIGIO信號(hào). -e read=set 輸出從指定文件中讀出的數(shù)據(jù).例如: -e read=3,5 -e write=set 輸出寫(xiě)入到指定文件中的數(shù)據(jù). -o filename 將strace的輸出寫(xiě)入文件filename -p pid 跟蹤指定的進(jìn)程pid. -s strsize 指定輸出的字符串的最大長(zhǎng)度.默認(rèn)為32.文件名一直全部輸出. -u username 以u(píng)sername的UID和GID執(zhí)行被跟蹤的命令 |
通用的完整用法:
strace -o output.txt -T -tt -e trace=all -p 29626 |
上面的含義是跟蹤29626進(jìn)程的所有系統(tǒng)調(diào)用(-etrace=all),并統(tǒng)計(jì)系統(tǒng)調(diào)用的花費(fèi)時(shí)間,以及開(kāi)始時(shí)間(并以可視化的時(shí)分秒格式顯示),最后將記錄結(jié)果存在output.txt文件里面。
在給新主機(jī)10.230.19.132/133及數(shù)據(jù)庫(kù)添加MEM監(jiān)控時(shí),需要先在主機(jī)上安裝agent,在132執(zhí)行./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin時(shí)一直卡住不動(dòng),既沒(méi)有報(bào)錯(cuò)也沒(méi)有彈出如下的選擇命令:
Language Selection Please select the installation language [1] English - English [2] Japanese - 日本語(yǔ) Please choose an option [1] : |
[mysql@onlinec]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/132.log 2>&1 |
futex(0x39dbf923c4, FUTEX_WAKE_PRIVATE,2147483647) = 0 open("/etc/resolv.conf", O_RDONLY) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=94, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "# Generated byNetworkManager na"..., 4096) = 94 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 open("/etc/hosts", O_RDONLY|O_CLOEXEC) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=187, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "27.0.0.1 localhost.localdomai"..., 4096) = 187 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 socket(PF_INET, SOCK_STREAM|SOCK_CLOEXEC,IPPROTO_TCP) = 7 setsockopt(7, SOL_TCP, TCP_NODELAY, [1], 4) = 0 setsockopt(7, SOL_SOCKET, SO_KEEPALIVE, [1], 4) =0 connect(7, {sa_family=AF_INET,sin_port=htons(6010), sin_addr=inet_addr("27.0.0.1")}, 16 |
[mysql@onlinecs_m]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/133.log 2>&1 |
poll([{fd=7, events=POLLIN|POLLOUT}], 1, 5000) = 1([{fd=7, revents=POLLOUT}]) sendto(7,"K3571 |