ウェブログファイルから文字列を抽出する

Question 1

awkを使用することをお勧めします。

awk '{print $1,$4,$5;}' test.log

awk空白で各行を分割すると$1、、$2...などのフィールドを呼び出し、最初、4番目、5番目のフィールドを印刷して$4日付$5スタンプを設定できます。

Answer

awkを使用することをお勧めします。

awk '{print $1,$4,$5;}' test.log

awk空白で各行を分割すると$1、、$2...などのフィールドを呼び出し、最初、4番目、5番目のフィールドを印刷して$4日付$5スタンプを設定できます。

Question 2

RE置換は、、...に対応する値と間に値が割り当てられているsed場合に使用されます。\1\2

sed 's/\([0-9\.]\) - - \[\(.*\)\] "GET .*/\1, \2/' test.log

（もちろん括弧内のより正確なパターンに置き換えることができます）

Answer

RE置換は、、...に対応する値と間に値が割り当てられているsed場合に使用されます。\1\2

sed 's/\([0-9\.]\) - - \[\(.*\)\] "GET .*/\1, \2/' test.log

（もちろん括弧内のより正確なパターンに置き換えることができます）

Question 3

Unixコマンドでは、次のコマンドを使用できますsed

sed -e 's/\(\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1,3\}\).*\[\(.*\)\].*/\1\t\3/' test.log

fileinputしかし、ログファイルが非常に大きい場合は、ライブラリやジェネレータを使用して大容量ファイルの処理をより効率的に処理できるため、Pythonを使用する方が良いと思います。

Answer

Unixコマンドでは、次のコマンドを使用できますsed

sed -e 's/\(\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1,3\}\).*\[\(.*\)\].*/\1\t\3/' test.log

fileinputしかし、ログファイルが非常に大きい場合は、ライブラリやジェネレータを使用して大容量ファイルの処理をより効率的に処理できるため、Pythonを使用する方が良いと思います。

関連情報