SEDを使用したファイル名の一部の抽出

Question

あなたは間違いなく正しいです。私の意見は次のとおりです。

find . -iname '*.txt'txt大文字と小文字を無視し、拡張子が./wibble/wobble/wubble.Txtのファイル名を見つけます。

sed -e 's/.*_\([0-9]\{4\}_[0-9|A-z]*\).*/\1./i'最後のアンダースコアシーケンスを探して、その後に4桁の数字、アンダースコア、オプションで文字、数字、パイプ、およびファイルパスのその他の文字シーケンスが続きます。これらのシーケンスを見つけたら、他のすべての項目を捨て、文字の前半と余分な_文字.を捨て、それ以外の場合はファイル名を変更せずに残します。

sort -大文字と小文字を考慮してファイル名をソートします（ロケールソートアルゴリズムは最初のインスタンスで大文字と小文字を無視できます）。

uniq -ui大文字と小文字の違いを無視し、何度も表示される名前を拒否します。

tr -d '\n'改行文字を削除して、すべてのファイル名を1つに連結します。

このコードは脆弱に見えます！同じ名前のファイルがあると予想してsub/dir/pics_2023_happyxmas!/company/party/photos.txttxt2023_happyxmas.拡張子を持つ別のファイルを追加すると、結果変数に異なるコンポーネントが提供される可能性がありますusername。ただし、.文字を使用して区別することはできます。

一致が許可される文字は、localeスクリプトが実行される環境によって異なります。

txt名前にアンダースコアのない拡張子を持つ別のファイルを追加すると、.パーティション名を使用する機能が中断されます。

プログラムが制御された環境で実行されている場合は問題ありませんが、sed予想されるパターンと一致しない行が見つかった場合は、そのまま渡すのではなく拒否します。

Answer 1