nmap出力をgrepする方法は?

nmap出力をgrepする方法は?

私は巨大なscan.gnmapファイルを持っています:

Host: 1.1.1.1 ()    Status: Up
Host: 1.1.1.1 ()    Ports: 80/open/tcp//http//nginx/, 443/open/tcp//ssl|http//nginx/    Ignored State: filtered (4998)
Host: 2.2.2.2 (foo.com) Status: Up
Host: 2.2.2.2 (foo.com) Ports: 80/open/tcp//http//awselb|2.0/, 443/open/tcp//ssl|http//Apache httpd 2.4.41 (() PHP|5.3.29)/ Ignored State: filtered (4998)
Host: 3.3.3.3 (bar.com) Status: Up
Host: 3.3.3.3 (bar.com) Ports: 25/open/tcp//smtp?///    Ignored State: filtered (4999)
Host: 4.4.4.4 ()    Status: Up
Host: 4.4.4.4 ()    Ports: 80/open/tcp//http//Microsoft-Azure-Application-Gateway|v2/, 443/open/tcp//ssl|https//Microsoft-Azure-Application-Gateway|v2/ Ignored State: filtered (4998)
Host: 5.5.5.5 (foobar.com)  Status: Up
Host: 5.5.5.5 (foobar.com)  Ports: 80/open/tcp//http?///, 443/open/tcp//ssl|https?///   Ignored State: filtered (4998)
Host: 6.6.6.6 ()    Status: Up
Host: 6.6.6.6 ()    Ports: 80/open/tcp//http//Microsoft IIS httpd 10.0/, 443/open/tcp//ssl|http//Microsoft IIS httpd 10.0/, 454/open/tcp//ssl|upnp//Microsoft IIS httpd/, 1221/open/tcp//http//Microsoft HTTPAPI httpd 2.0 (SSDP|UPnP)/, 4022/open/tcp//dnox?///, 4024/open/tcp//tnp1-port?///, 7654/open/tcp//unknown///   Ignored State: filtered (4993)

ポート番号の追加中にすべてのHTTPサービス(ポート1221、454、および443のサービスを含む)を抽出しようとしましたが、失敗しました。

$ awk '/open/{print $2" "$5}' scan.gnmap | sed -e 's/\// /g' | awk '/http/{print $1":"$2}'

1.1.1.1:80
2.2.2.2:80
4.4.4.4:80
5.5.5.5:80
6.6.6.6:80

すべてのHTTPホスト:ポートの組み合わせを抽出する最も簡単な方法は何ですか?

答え1

POSIX awk を使用した要件の可能な説明は次のとおりです。

$ cat tst.awk
BEGIN { OFS=":" }
{ ip = $2 }
sub(/^([^[:space:]]+[[:space:]]+){3}Ports:[[:space:]]+/,"") {
    n = split($0,f,/\/[^,]+(,[[:space:]]*|[[:space:]]*$)/)
    for (i=1; i<n; i++) {
        port = f[i]
        if ( !seen[ip,port]++ ) {
            print ip, port
        }
    }
}

$ awk -f tst.awk file
1.1.1.1:80
1.1.1.1:443
2.2.2.2:80
2.2.2.2:443
3.3.3.3:25
4.4.4.4:80
4.4.4.4:443
5.5.5.5:80
5.5.5.5:443
6.6.6.6:80
6.6.6.6:443
6.6.6.6:454
6.6.6.6:1221
6.6.6.6:4022
6.6.6.6:4024
6.6.6.6:7654

awkが文字クラスをサポートしておらず、POSIXと互換性がない場合は、すべてをおよびに[[:space:]]変更してください[ \t][^[:space:]][^ \t]

答え2

#!/usr/bin/perl
use strict;

while(<>) {
  next unless m/^Host: ([0-9.]+) .* Ports: (.*)(?:\s+Ignored.*)?/;
  # $1 and $2 are the values from the capture groups in the previous regex
  my ($ip, $ports) = ($1, $2);

  # split $ports into array @ports
  my @ports = split /,\s+/, $ports;

  # iterate over the array and output the IP and port number only when http appears
  foreach (@ports) {
    next unless s=^(\d+)\/.*http.*=$1=;
    printf "%s: %s\n", $ip, $_;
  };
}

たとえば、別の名前で保存し、grep-http-ports.pl次のように実行しますchmod +x grep-http-ports.pl

$ ./grep-http-ports.pl scan.gnmap 
1.1.1.1: 80
1.1.1.1: 443
2.2.2.2: 80
2.2.2.2: 443
4.4.4.4: 80
4.4.4.4: 443
5.5.5.5: 80
5.5.5.5: 443
6.6.6.6: 80
6.6.6.6: 443
6.6.6.6: 454
6.6.6.6: 1221

コロンの後のスペースは:オプションです。私の考えでは、彼らはそれを「人が読めるように」します。ただし、気に入らない場合や、別のスクリプトを使用してさらに処理するための出力である場合は、printfフォーマット文字列を編集して削除するだけです。


ホスト名も抽出するには、次のように簡単に実行できます。

#!/usr/bin/perl
use strict;

while(<>) {
  next unless m/^Host: ([0-9.]+) \(([^)]*)\).* Ports: (.*)(?:\s+Ignored.*)?/;
  my ($ip, $host, $ports) = ($1, $2, $3);

  my @ports = split /,\s+/, $ports;

  foreach (@ports) {
    next unless s=^(\d+)\/.*http.*=$1=;
    printf "%s:%s:%s\n", $ip, $host, $_;
  };
}
1.1.1.1::80
1.1.1.1::443
2.2.2.2:foo.com:80
2.2.2.2:foo.com:443
4.4.4.4::80
4.4.4.4::443
5.5.5.5:foobar.com:80
5.5.5.5:foobar.com:443
6.6.6.6::80
6.6.6.6::443
6.6.6.6::454
6.6.6.6::1221

または、各IPアドレスとポート番号をカンマとスペースで区切って1行に入力します。

#!/usr/bin/perl
use strict;

while(<>) {
  next unless m/^Host: ([0-9.]+) .* Ports: (.*)(?:\s+Ignored.*)?/;
  my ($ip, $ports) = ($1, $2);

  next unless $ports =~ m/http/;
  my @ports = split /,\s+/, $ports;

  my @http = ();
  foreach (@ports) {
    next unless s=(\d+)\/.*http.*=$1=;
    push @http, $_;
  };

  printf "%s: %s\n", $ip, join(", ", @http);
}
$ ./grep-http-ports2.pl scan.gnmap 
1.1.1.1: 80, 443
2.2.2.2: 80, 443
4.4.4.4: 80, 443
5.5.5.5: 80, 443
6.6.6.6: 80, 443, 454, 1221

同様に、コロンとコンマの後のスペースはオプションです。必要に応じてprintfフォーマット文字列と文字列を編集します。join

関連情報