私は持っていますテキストファイル良い:
1_01 { ; quite good spirals
reset=2000 type=mandel passes=1
corners=-0.6014129278/-0.5990935452/0.427747516/0.429487053
params=0/0 float=y maxiter=1000 inside=0 outside=15
distest=1/10/320/200
}
1_02 { ; stringy one, with dist estimator
reset=2000 type=mandel passes=1
corners=-1.9228429644992/-1.9228427944992/-6.3749991620026e-008/6.375000\
8379971e-008 params=0/0 float=y maxiter=1000 inside=0 outside=15
distest=1/20/320/200
}
1_03 { ; OK, bit dull, not zoomed in far
reset=2000 type=mandel passes=1
corners=0.3734922373/0.3820837907/-0.243292645/-0.23684898
params=0/0 float=y maxiter=1000 inside=0 outside=15
distest=1/10/320/200
}
1_04 { ; a mess, needs dist est
reset=2000 type=mandel passes=1
corners=-1.862224008886682/-1.86222400040936/-3.214020831358832e-009/3.1\
43970347410528e-009 params=0/0 float=y maxiter=1000 inside=0
outside=15 distest=1/10/320/200
}
次のようなファイルと行に分けたい。
1_01 { ; quite good spirals
reset=2000
type=mandel
passes=1
corners=-0.6014129278/-0.5990935452/0.427747516/0.429487053
params=0/0
float=y
maxiter=1000
inside=0
outside=15
distest=1/10/320/200
}
これでbashスクリプトを作成しました。
#!/usr/bin/env bash
# chmod +x s.sh
# ./s.sh
for f in *.txt;
do
echo " found "$f " file ";
#split -l 7 $f;
awk '/{/{n++}{print > n".p" }' $f
echo $f "- split when { is found and add p extension " ;
rm $f;
echo " input file " $f " is removed " ;
done
for f in *.p;
do
echo " in "$f " file replace space with newline and add par extension"
# tr '{}' '()' < infile > outfile
tr ' ' '\n' < $f >$f"ar"
rm $f;
done
for f in *.par;
do
echo "remove blank= empty lines"
sed -i '/^$/d' $f
done
うまくいきますが、もっとうまくできますか?
答え1
修正する: gawk
(v.3.1.8) および (v.1.3.3) でmawk
簡略化されテストされた。
このawkスクリプトは、ユーザーが必要とする操作を実行する必要があります。正規表現フィールド区切り文字とレコード区切り文字をサポートする他のawk実装と連携できます。
#!/usr/bin/awk -f
BEGIN {
RS="}\n\n?"
ORS="}\n"
FS="\n"
OFS="\n"
}
{
# compress whitespace in first field
gsub(/[ \t\n]+/," ",$1)
# split remaining fields on whitespace
for (i=2;i<=NF;i++) {
gsub(/[ \t\n]+/,"\n",$i)
}
# remove double-newlines resulting from trailing whitespace
gsub("\n\n+","\n",$0)
print > NR".par"
}
入力でテストしますfile.txt
。
$ ./split.awk file.txt
それから
$ cat 1.par
1_01 { ; quite good spirals
reset=2000
type=mandel
passes=1
corners=-0.6014129278/-0.5990935452/0.427747516/0.429487053
params=0/0
float=y
maxiter=1000
inside=0
outside=15
distest=1/10/320/200
}
そして
$ cat 3.par
1_03 { ; OK, bit dull, not zoomed in far
reset=2000
type=mandel
passes=1
corners=0.3734922373/0.3820837907/-0.243292645/-0.23684898
params=0/0
float=y
maxiter=1000
inside=0
outside=15
distest=1/10/320/200
}
答え2
サンプルデータを./file
以下のように入れた。
cat >file <<\IN
# all of your example
IN
その後、次のことを行いました。
sed -n 's|\([^ ]*\) *{.*|/\1 {/,/}/w file.\1.par|p' file |
sed -e 's/ */ /g;s/^ //;s/ $//;/./!d;/{/!y/ /\n/' -f - file
1つのプロセスを使用してsed
内部ファイルからデータを切り取り、それをsed
2番目sed
のプロセスで使用できるスクリプトとして編集します。
最後に実行されたスクリプトは次のとおりです。
/1_01 {/,/}/w file.1_01.par
/1_02 {/,/}/w file.1_02.par
/1_03 {/,/}/w file.1_03.par
/1_04 {/,/}/w file.1_04.par
...しかし、ただ実行されます後ろに2番目はsed
各行に対して実行されます。文書...
... -e 's/ */ /g;s/^ //;s/ $//;/./!d;/{/!y/ /\n/' ...
...最初に一連の空白を単一の空白に圧縮し、先行または末尾の空白がまだ存在する場合は削除し、出力から空白行を完全に削除してから、最後にすべての空白を行ごとに一致\n
しないewline文字に変換するします{
。
(section heading) *{.*
したがって、2番目の意識に一致するすべての行番号とすべての後続の行(sed
w
入力に表示される次の行を含む)に対して、元の入力ファイルは影響を受けません。}
file.(section heading)
走ってからそうでした…
cat <./file.1_01.par
...そして...
1_01 { ; quite good spirals
reset=2000
type=mandel
passes=1
corners=-0.6014129278/-0.5990935452/0.427747516/0.429487053
params=0/0
float=y
maxiter=1000
inside=0
outside=15
distest=1/10/320/200
}
実行するには、sed ...
これらの2行をターミナルにコピーして貼り付けて、次に置き換えます。文書適切な名前。
私も試しました協会あなたの質問に...
sed -n 's|.\([^ ]*\) {.*|/\1 {/,/^}$/w \1.par|p' <<-IN |\
sed -e 's/.//;/{/!y/ /\n/' -f - all.par
$(curl -s 'http://www.calresco.org/pic3/calres3.par' |
tr -s '\r\n ' '\n ' |tee all.par)
IN
すべての.par
機能を独自のファイルに分割し、DOS行の終わりを処理します。
ls -C
a46.par bugeyed.par flocks.par iconw2b.par manchaos.par swirl5.par
aciddrop.par burr.par galaxy.par juliland.par mandelzm.par trific.par
all.par complex.par highrise.par lace.par redgiant.par
angfish.par eyeeye.par iconvolc.par lavaflow.par scythe.par
それらはすべて関数名にちなんで命名されました。
cat galaxy.par
galaxy {;Chris Lucas
reset=1950
type=julia
center-mag=+0.03023290053994965/+0.26628255550711930/42.69126/1/67.5
params=-0.1582146627566066/0.6550294654497986
float=y
maxiter=30000
colors=000000GFF<28>x11z00z10<29>zx0zz0zz1<29>zzxzzzzzz<61>zV1zU0zU0zT0<\
28>z10z00z00y00<30>c00b11a11`22_22<25>FFF
}
答え3
csplitを試してください:入力ファイル== frac.txt
、出力ファイル== frac[nn]
(ここでファイル#00が空なのでnn> 00)
csplit -f frac frac.txt /^1/ {*}
答え4
行フォーマットを個別に実行できますsed
。
sed -i 's/^\s*\|\s*$//g ; s/\s\s*/ /g ; /[{}]/!s/ /\n/g ; /^\s*$/d' *.txt