ファイルから長い文字列を削除する

Question 1

コーディング規則が良いと仮定すると、特定のサイズより大きい行を削除します。

shopt -s extglob nullglob
sed -i.bak -r '/.{10000}/d' **/*.php

@wildcardの場合：

find . -name '*.php' -print0 | while IFS= read -rd "" file; do
    before=$(wc -l < "$file")
    after=$(sed -r '/.{10000}/d' "$file" | wc -l)
    case $(( diff = before - after )) in
        0) :;;  # no-op
        *) echo "will remove $diff lines from $file";;
    esac
done

Answer

コーディング規則が良いと仮定すると、特定のサイズより大きい行を削除します。

shopt -s extglob nullglob
sed -i.bak -r '/.{10000}/d' **/*.php

@wildcardの場合：

find . -name '*.php' -print0 | while IFS= read -rd "" file; do
    before=$(wc -l < "$file")
    after=$(sed -r '/.{10000}/d' "$file" | wc -l)
    case $(( diff = before - after )) in
        0) :;;  # no-op
        *) echo "will remove $diff lines from $file";;
    esac
done

Question 2

fgrepまたはを試してくださいgrep -F。これにより、パターンが固定文字列として解釈されます。

また、その単一の文字列をファイルに（それ自体で）置き、それを使用してgrep -f filenameファイルを指定することもできます。ただし、まだフラグが必要です-F。

他のオプションを参照してくださいman grep。便利なオプションがいくつかあります。

特定のパターンに一致する行を削除するさまざまな方法については、次を参照してください。https://stackoverflow.com/a/5413132/5419599。

1つのアプローチは次のとおりです。

このテキスト行を別のファイルに入れます。これを「スキーマファイル」と呼びます。
走るgrep -lrFf patternfile . > filelist
filelistこの行を削除するには編集してください。./patternfile
走るfor i in $(cat filelist) ; do grep -vf patternfile $i > temp && chmod --reference=$i temp && mv temp $i ; done

ステップ2では、grepオプションは次のとおりです。-l一致するファイルを一覧表示し、一致するパターン-rで-F固定文字列を使用し、-f一致patternfileする> filelistファイルのリストを含むファイルを作成します。

ステップ4では、フラグをgrep使用して印刷します。-vいいえ行を一致させ、chmod権限の問題がないことを確認し、mvファイルを所定の位置に戻します。

もっと良い方法があるかもしれませんが、これだけで十分だと思います。

編集：rootとして実行すると、ルートがこれらのファイルをすべて所有しているわけではありません。ステップ4の次のリビジョンを実行します。

for i in $(cat filelist) ; do grep -vf patternfile $i > temp && chown --reference=$i temp && chmod --reference=$i temp && mv temp $i ; done

すべてのファイルの所有者の場合、最初の4つのステップは問題ありません。

Answer