技术解析

求助 Linux 下数据提取收集问题。
0
2021-06-23 14:19:53
idczone

请教一个问题,meclog 得到数据文件格式如下:
app10:
app11:
        Hardware event. This is not a software error.
        MCE 0
        CPU 0 BANK 9
        MISC 90841000100128c ADDR c2e60a000
        ...
app20:
app30:
        Hardware event. This is not a software error.
        MCE 0
        CPU 0 BANK 9
        MISC 90841000100128c ADDR c2e60a000
        ....
有什么方法,可以提取出有数据内容的主机,创建文本名为主机名,写入对应的数据。
求助有没有好的思路,谢谢各位!


假设机器名是 app 开头的从 10-30,假设有内容主机数据行数都一样,可以这样写:
i in app{10..30};
do
j=`grep $i meclog -A1|grep -v app|wc -l`
if [ "$j" == 1 ]
then
touch $i
grep $i meclog -A4|grep -v $i >$i
fi
done

上面是笨法子,
如果主机名比较随意,内容也比较随意,那就更笨的法子,先筛选出来所有的主机名,记录行号,根据行号信息判断是否有内容,有的话 touch 文件,然后 sed 打印对应行号内容写入文件。
请大神给出好更加优化的法子

shell 不太会写
这样可不可以,先用正则匹配
^.+:\n(\S+\n)*(\S+\n)替换成$2
然后一行行读,读到空行就新起文件

这正则我看看,不是很懂。。

我试试,感谢回复!

把类似于 xxx 冒号换行后面跟着非空字符的分组,替换成最后一组。
就是去掉无效行

perl -ne 'if(/^(\S+):/) {open(FILE, ">", $1);}else {print FILE;};' meclog

提取很准确,十分感谢! perl 很好用,想学习下有什么好的建议吗。。



数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服