最初の行のインデントに基づいて複数行の先行スペースを削除する方法は？

Question 1

Gnu sed: 先行スペースを保持に保存し、各行からこの数の先行スペースを削除します。行が示されているとおりに並べられているとします。

sed -Ee '
  1{h;s/\S.*//;x;}
  G;s/^(\s*)(.*)\n\1$/\2/
' file

awk '
NR==1 {
  l0=length()
  $1=$1
  re = "^\\s{" l0-length() "}"
}
sub(re, "")+1
' file

perl -lpe '
  $x //= do{/^\s*/g;+pos;};
  $_ = substr($_,$x);
' file

Answer

Gnu sed: 先行スペースを保持に保存し、各行からこの数の先行スペースを削除します。行が示されているとおりに並べられているとします。

sed -Ee '
  1{h;s/\S.*//;x;}
  G;s/^(\s*)(.*)\n\1$/\2/
' file

awk '
NR==1 {
  l0=length()
  $1=$1
  re = "^\\s{" l0-length() "}"
}
sub(re, "")+1
' file

perl -lpe '
  $x //= do{/^\s*/g;+pos;};
  $_ = substr($_,$x);
' file

Question 2

調査をしなければなりませんでした。アーク(1)より早く。少なくとも最初の行の先頭のスペースの数を格納し、各行の書式を指定する小さなプログラムを作成できます。

$ awk '
    NR==1 && match($0, /^ */) {p=RLENGTH+1};
    {print(substr($0,p))}
' lines | column -x | expand -t 8
30 .md           8 .png          4 .yml          1 .css          1 .gitignore
 1 .ico          1 .sh           1 .txt

Answer

調査をしなければなりませんでした。アーク(1)より早く。少なくとも最初の行の先頭のスペースの数を格納し、各行の書式を指定する小さなプログラムを作成できます。

$ awk '
    NR==1 && match($0, /^ */) {p=RLENGTH+1};
    {print(substr($0,p))}
' lines | column -x | expand -t 8
30 .md           8 .png          4 .yml          1 .css          1 .gitignore
 1 .ico          1 .sh           1 .txt

Question 3

なぜ最初の行に制限するのですか？ギガバイト単位のデータを処理する必要がない場合（すべてのデータをメモリに保存することは問題です）、最長の最初のフィールドを保存してそれを使用して残りの形式を指定できます。

$ cat lines 
      4 .yml
      1 .sh
      1 .ico
      1 .gitignore
      1 .css
     30 .md
      1 .txt
      8 .png

そして：

$ awk -v l=0 '{ 
                if(length($1)>l){
                    l=length($1)
                } 
                a[$2]=$1
              }
              END{
                for(line in a){
                    printf "%"l"s %s\n",a[line],line
                }
             }' lines 
 8 .png
 1 .ico
 1 .txt
 1 .css
 1 .sh
30 .md
 1 .gitignore
 4 .yml

だから：

$ awk -v l=0 '{ if(length($1)>l){l=length($1)} a[$2]=$1}END{for(line in a){printf "%"l"s %s\n",a[line],line}}' lines | 
    column -x | expand -t 8
 8 .png          1 .ico          1 .txt          1 .css          1 .sh
30 .md           1 .gitignore    4 .yml

これが必要なく、最初の行にのみ興味がある場合は、次のように単純化できます。

$ perl -pe '/^(\s+)/; $l//=$1; s/^$l//' lines | column -x | expand -t 8
30 .md           4 .yml          1 .sh           1 .ico          1 .gitignore
 1 .css          1 .txt          8 .png

Answer