
ファイルがあります:-
start apple
1 a
2 b
3 c
start orange
4 a
5 b
start mango
1 a
start a/b/c
5 z
end
4 b
end
6 c
end
start banana
3 c
end
4 d
5 e
end
私は出力を次のようにしたい:-
1 apple/a
2 apple/b
3 apple/c
4 apple/orange/a
5 apple/orange/b
1 apple/orange/mango/a
5 apple/orange/mango/a/b/c/z
4 apple/orange/mango/b
6 apple/orange/c
3 apple/banana/c
4 apple/d
5 apple/e
私は数字の階層を把握する最速の方法が欲しい。
答え1
一般的なawk
作業:
awk '$1 == "start" {d[++n] = $2; next}
$1 == "end" {n--; next}
{
printf "%s ", $1
for(i=1;i<=n;i++) printf "%s/",d[i]
print $2
}'
(Solarisでは、/usr/xpg4/bin/awk
またはこれが必要になる場合がありますnawk
)。
次の方法で行うこともできますsed
。
sed '/^start /{s///;x;G;s/\n//;s:$:|:;h;d;}
/^end/{g;s:[^|]*|$::;h;d;}
G;s/ \(.*\)\n\(.*\)/ \2\1/;y:|:/:'
(これはパスに|
文字がないと仮定します。)
答え2
これが私がPythonでやる方法です。
スクリプトは標準出力を読み取り、stdin
標準出力として印刷します。また、入力が特定の形式と一致すると予想します。行がこの形式と一致しない場合は、スクリプトを調整する必要があります。
#!/usr/bin/python
import fileinput
hierarchy = []
for line in fileinput.input():
parts = line.rstrip().split(' ')
if parts[0] == 'start':
hierarchy.append(parts[1])
elif parts[0] == 'end':
hierarchy.pop()
else:
print parts[0] + ' ' + '/'.join(hierarchy)+'/'+ parts[1]