我所知道的精细到每个进程的监控都仅仅反映实时情况;
而可以看到历大带宽服务器史数据的都只有综合的图表,没有细分到进程、用户的,比如整个机器的 CPU/内存 /磁盘读写使用情况。
所以想请教一下,想可回溯地统计精细到进程、用户等的信息怎么做到。
进程级流量监控没看到比较好的
我用 Prometheus 和 granfana 做过,自己写 exporter 而已,不难。
cpu 内存磁盘最容易。其中 tcp 流量监控复杂一些,要用内核的新一些的特性才比较容易做。
哦,忘了说,据我所知,市面上没有现成开源的,所以我才自己弄的。
tcp 流量监控能到进程级别吗
嗯,用的是 tcp_info 这个结构,原理和 netflix tcptop 差不多。不是非常准确,但是够用了。
也许我那天可以问上面,是否可以把这个 exporter 开源,也算解决痛点填补空白了。
哦,还有变通的一招。
把进程容器化,然后用 cadvisor。(这货非常吃 CPU 慎用)
grafana + influxdb + telegraf
专业的工具还是有蛮多的嘛。。。老兄多去试一下。。