次の入力があります。
Sep 23 13:43 192.168.6.200
Sep 23 13:44 192.168.6.166
Sep 23 13:45 192.168.6.200
Sep 23 13:46 192.168.6.166
Sep 23 13:47 192.168.6.200
Sep 23 13:48 192.168.6.166
Sep 23 13:49 192.168.6.176
Sep 23 13:49 192.168.6.200
Sep 23 13:50 192.168.6.166
Sep 23 13:51 192.168.6.176
Sep 23 13:51 192.168.6.200
Sep 23 13:52 192.168.6.166
Sep 23 13:54 192.168.6.166
Sep 23 13:54 192.168.6.176
Sep 23 13:56 192.168.6.176
Sep 23 13:57 192.168.6.166
次の出力が必要です。
Sep 23 13:43 192.168.6.200
Sep 23 13:51 192.168.6.200
Sep 23 13:44 192.168.6.166
Sep 23 13:57 192.168.6.166
Sep 23 13:49 192.168.6.176
Sep 23 13:56 192.168.6.176
だから私が生成したOpenWrtルーターのDHCPログがあります。 (私は「5m」のdhcpリースでdhcpサーバーを設定しました):
logread | fgrep DHCPACK | awk '{print $1" "$2" "$3" "$8}' | sed 's/:[0-9][0-9] / /g' | sort -u
しかし、言及すべき入力は言及された出力ですが、どうすればよいですか? Perlの専門家はいますか? :\ :D
答え1
awkは(最大)fgrepとsedの親セットなので、3つすべてを呼び出す必要はありません。
logread | awk '
/DHCPACK/ {
sub(/:..$/,"",$3)
t = $1 " " $2 " " $3
if (!($8 in first)) first[$8] = t
last[$8] = t
}
END {
for (i in first) {
print first[i], i
print last[i], i
print ""
}
}'
特別な順序で表示されませんが。 IPアドレスがログに最初に表示される順序で表示されるようにするには、次のように変更できます。
logread | awk '
/DHCPACK/ {
sub(/:..$/,"",$3)
t = $1 " " $2 " " $3
if (!($8 in first)) {
first[$8] = t
ip[n++] = $8
}
last[$8] = t
}
END {
for (i = 0; i < n; i++) {
print first[ip[i]], i
print last[ip[i]], i
print ""
}
}'
答え2
クイックハッキング:
for ip in $(cut -d" " -f 4 < INPUT_FILE.txt | sort -u); do
grep "$ip" INPUT_FILE.txt | head -n1
grep "$ip" INPUT_FILE.txt | tail -n1
echo
done
ただし、ログファイルを3回繰り返すので、それほど高速ではありません。そして出力はあなたの例とは異なる順番になっています。それがあなたにとって重要かどうかはわかりません。
答え3
コメント付きのPerlバージョン。
#! /usr/bin/perl
use strict;
use Date::Parse;
use Date::Format;
my $format = '%b %d %R';
my %IP=();
# read the input file, convert date/time to a time_t timestamp,
# and store it into a hash of arrays (HoA) 'man perldsc' for details
while(<>) {
chomp;
my($month, $day, $time, $ip) = split ;
my $time_t = str2time("$month $day $time");
push @{ $IP{$ip} }, $time_t;
};
# NOTE: hashes are inherently unsorted. replace "keys %IP" below
# with an IP sort function if you need the IPs sorted - e.g.
# http://www.perlmonks.org/?node_id=37889
# print the first and last time stamp seen, converting
# back to the same time format as the input.
foreach my $key (keys %IP) {
# sort the array held in $IP{$key} just in case the input
# lines are out of order
sort @{ $IP{$key} } ;
my $first = $IP{$key}[0];
my $last = $IP{$key}[scalar @{ $IP{$key} }-1];
# print the first and last time seen
# note: if an IP was seen only once, first and last will be the same.
# easy enough to add an if or unless here if you want to exclude
# IPs where first == last.
print time2str($format,$first) . " $key\n";
print time2str($format,$last) . " $key\n\n";
}
grep、awk、およびsedの後にログをパイピングするのではなく、rawログをこのログにパイピングするには、次のように変更します。
- 次に
while(<>) {
追加してください。next unless /DHCPACK/;
行を
split
次に変更します。my ($month,$day,$year,undef,undef,undef,undef,$IP) = split;
答え4
仮説クレイグ正確で入力が時系列になっている場合は、awk
次の慣用スクリプトを使用できます。
解析.awk
!start[$4] { start[$4] = $1" "$2" "$3 }
{ end[$4] = $1" "$2" "$3 }
END {
for (ip in start)
print start[ip], ip, "\n" end[ip], ip, "\n"
}
次のように実行します。
logread | awk -f parse.awk
出力:
Sep 23 13:43 192.168.6.200
Sep 23 13:51 192.168.6.200
Sep 23 13:44 192.168.6.166
Sep 23 13:57 192.168.6.166
Sep 23 13:49 192.168.6.176
Sep 23 13:56 192.168.6.176