共通文字列を表示する2つの連続した行の位置を置き換えます。

Question 1

awkの無差別代入方法：常に行を保存し、フィールド1で一致する後続の行を昇格します。

100万行（1つのスワップを使用）でテストしましたが、5.5秒で実行されたため、ランタイムは1分余りになります。参照ファイルは必要ありません。

テスト行を含むHereDocを含むスクリプト。

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; } 
$2 != k { print x; k = $2; x = $0; next; } 
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) -
}

    [ x ] && time awkPairs <<'[][]'
WT 1 One x1
WT 2 Two x2
WT 3 Three_1 x3
WT 3 Three_2 y3
WT 4 Four x4 
WT 5 Five_1 x5
WT 5 Five_2 y5
[][]

（短期）テストの実行。

$ ./awkPairs
WT 1 One x1
WT 2 Two x2
WT 3 Three_2 y3
WT 3 Three_1 x3
WT 4 Four x4
WT 5 Five_2 y5
WT 5 Five_1 x5

real    0m0.009s
user    0m0.004s
sys     0m0.006s

すべてのテスト資料スクリプトを削除しました。単一の引数（入力ファイル名）またはリダイレクトまたはパイプされた標準入力を使用して呼び出すことができます。出力は常にstdoutに移動します。

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; }
$2 != k { print x; k = $2; x = $0; next; }
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) "${1:--}"
}

    awkPairs "${1}"

したがって、次のいずれかの方法で呼び出すことができます。

./awkPairs myData.txt
./awkPairs < myData.txt
cat myData.txt | ./awkPairs

Answer

awkの無差別代入方法：常に行を保存し、フィールド1で一致する後続の行を昇格します。

100万行（1つのスワップを使用）でテストしましたが、5.5秒で実行されたため、ランタイムは1分余りになります。参照ファイルは必要ありません。

テスト行を含むHereDocを含むスクリプト。

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; } 
$2 != k { print x; k = $2; x = $0; next; } 
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) -
}

    [ x ] && time awkPairs <<'[][]'
WT 1 One x1
WT 2 Two x2
WT 3 Three_1 x3
WT 3 Three_2 y3
WT 4 Four x4 
WT 5 Five_1 x5
WT 5 Five_2 y5
[][]

（短期）テストの実行。

$ ./awkPairs
WT 1 One x1
WT 2 Two x2
WT 3 Three_2 y3
WT 3 Three_1 x3
WT 4 Four x4
WT 5 Five_2 y5
WT 5 Five_1 x5

real    0m0.009s
user    0m0.004s
sys     0m0.006s

すべてのテスト資料スクリプトを削除しました。単一の引数（入力ファイル名）またはリダイレクトまたはパイプされた標準入力を使用して呼び出すことができます。出力は常にstdoutに移動します。

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; }
$2 != k { print x; k = $2; x = $0; next; }
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) "${1:--}"
}

    awkPairs "${1}"

したがって、次のいずれかの方法で呼び出すことができます。

./awkPairs myData.txt
./awkPairs < myData.txt
cat myData.txt | ./awkPairs

Question 2

GNU sedは拡張正規表現モードにあります-E（正規表現をあまり騒々しくしません）。パターン空間に2行を格納し、2行の最初のフィールドを比較します。一致する場合は、パターン空間で置き換えられた行を印刷し、次の行を読みます。

sed -Ee '
  $!N
  s/^(\S+\s+(\S+)\s.*)\n(\S+\s+\2\s.*)/\3\n\1/
  t;P;D
' file

注：これは「ファイル」に先行スペースがないと想定しています。

Answer

GNU sedは拡張正規表現モードにあります-E（正規表現をあまり騒々しくしません）。パターン空間に2行を格納し、2行の最初のフィールドを比較します。一致する場合は、パターン空間で置き換えられた行を印刷し、次の行を読みます。

sed -Ee '
  $!N
  s/^(\S+\s+(\S+)\s.*)\n(\S+\s+\2\s.*)/\3\n\1/
  t;P;D
' file

注：これは「ファイル」に先行スペースがないと想定しています。

Question 3

家だけ右置き換える必要がある行の数（つまり、同じ2番目のフィールドに3つ以上の連続行ではない）、ファイルには少なくとも2行が含まれています。

function possibly_swap() {
        if (stringa == stringb) {
                # The two previous lines needs swapping.
                t = linea
                linea = lineb
                lineb = t
        }
}

FNR >= 3 {
        possibly_swap()

        # Output the 2nd previous line (possibly swapped now).
        print lineb
}

{
        # Push new data.

        stringb = stringa
        lineb = linea

        stringa = $2
        linea = $0
}

END {
        # We may need to output the last two
        # lines swapped...
        possibly_swap()

        print lineb
        print linea
}

プログラムは2つのawk変数セットをstringa使用stringbします。変数には、入力行の最後の2行の2番目のフィールドである文字列が含まれます。変数には対応する内容が含まれています。linealinebstringlineいっぱいワイヤー。

コード全体で使用されるサフィックスの合計は、前の行とその前の行（「前の2行目」）にa対応します。b

上記のコードを独自のファイル（ここでは）に入れ、以下のように他のファイル（ここでは）script.awkで実行できます。file

awk -f script.awk file

"one-liner"と同じコード：

awk 'FNR>=3{if(sa==sb){t=la;la=lb;lb=t}print lb}{sb=sa;lb=la;sa=$2;la=$0}END{if(sa==sb){print la;print lb}else{print lb;print la}}' file

Answer