技术解析
一台服务器 cpu 占用比较高,top 看 8 个核有 6 个 100%us,按 cpu 排序看不出来 ps aux --sort=-%cpu | awk 'NR==1{print $2,$3,$11}NR>1{if($3!=0.0) print $2,$3,$11}'结果是: PID %CPU COMMAND 14110 594 [kmpathd] 1240 45.3 java 1394 3.0 ps 百度了下 kmpathd 说是搞 raid 的,但是这个虚拟机没做 raid 查看流量也是正常的,strace 发现 epoll_wait100 了,有没有可能中毒了呢? Process 14110 attached - interrupt to quit ^CProcess 14110 detached % time seconds usecs/call calls errors syscall
100.00 0.355946 5393 66 epoll_wait 0.00 0.000000 0 18 clock_gettime
100.00 0.355946