AWKを使用してnginxサーバーブロックをどのように抽出できますか?入力する
server { # php/fastcgi
listen 80;
server_name domain1.com www.domain1.com;
access_log logs/domain1.access.log main;
root html;
location ~ \.php$ {
fastcgi_pass 127.0.0.1:1025;
}
}
server { # simple reverse-proxy
listen 80;
server_name domain2.com www.domain2.com;
access_log logs/domain2.access.log main;
# serve static files
location ~ ^/(images|javascript|js|css|flash|media|static)/ {
root /var/www/virtual/big.server.com/htdocs;
expires 30d;
}
# pass requests for dynamic content to rails/turbogears/zope, et al
location / {
proxy_pass http://127.0.0.1:8080;
}
}
どのように必要な値を一致させ、各サーバーブロックの行を印刷できますか?{}
例えば
Listen | root | server_nameの値を取得する必要があります。希望の出力は
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
答え1
各行にはスペースで区切られた複数の値が含まれる可能性があるため、使用するのはawk
少し面倒です。これは確かにawkで可能ですが、Perlのようなものを使用する方が簡単です。
$ perl -lne '
if(/(^| )server / || eof){
print join " ",@ll if $ll[0];
@ll=();
}
/^(listen|root|server_name)\s+(\S[^;]+)/ && push @ll,$2' file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
これは-lne
、「入力ファイルを1行ずつ読み取り()、末尾の改行を削除し、各呼び出しに改行を-n
追加し()、各行に提供されているスクリプトを実行することを意味します。print
-l
-e
パスワード:
if(/(^| )server / || eof){
server
:現在の行にスペースで囲まれた単語がある場合、または行の先頭に単語が含まれている場合は、このセクションが実行されます。print join " ",@ll if $ll[0];
:現在の配列に格納されている項目がある場合@ll
(したがって配列の最初の要素が定義されている場合$ll[0]
)、空白で連結された配列の内容を印刷します。@ll=();
:次のサーバーの情報を取得できるように配列を消去します。/^(listen|root|server_name)\s+(\S[^;]+)/ && push @ll,$2'
:この行がキーワードで始まり、1つ以上の空白文字がある場合、空白ではなく最初の文字と行の終わり;
までできるだけ多くの非文字を見つけてこの文字を追加します。$2
に転送されます。@ll
awkで実行する(醜い)方法は次のとおりです。
$ awk '
(/ server\s*\{/){
if(out){
print out
}
out=""
}
($1=="listen" || $1=="root" || $1=="server_name"){
gsub(";","");
$1="";
gsub(/^ */,"");
out ? out=out" "$0 : out=$0
}
END{print out}' file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
答え2
入力データに値のペアのラベル(または名前とも呼ばれます)がある場合は、まず下()のようなマッピング配列を作成してから、任意の条件f[]
で必要な順序で印刷することをお勧めします。ラベルを使用すると、単に配列値にアクセスできます。
たとえば、POSIX awkを使用すると、次のようになります。
$ cat tst.awk
(NR > 1) && ($1 == "server") { prt() }
{
tag = $1
sub(/[[:space:]]*[^[:space:]]+[[:space:]]+/,"")
sub(/;$/,"")
f[tag] = $0
}
END { prt() }
function prt() {
print f["listen"], f["server_name"], f["root"]
delete f
}
$ awk -f tst.awk file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
文字クラスをサポートしていないPOSIX以外のawkが見つかった場合は、次のよう[:space:]
に置き換えます\t
(たとえば、空白文字の後にバックスラッシュが続く場合などt
)。
特定の問題の出力を取得するより短い方法がありますが、上記の方法を使用すると、これらのフィールドと必要な他のフィールドを印刷、テスト、並べ替え、修正するなどの柔軟性を得ることができます。