Unixファイルのテキスト処理

Unixファイルのテキスト処理

Unixフラットファイルに次のデータがあり、最初の2つの列の重複値を抑制し、次のように変換しようとしています。

1:x:4:3:2:y
1:x:7:9:l:z
1:0:3:j:k:m
2:9:r:s:6:u
2:m:y:5:7:9
2:u:7:9:7:6
3:a:b:c:d:e
3:a:b:d:e:f
3:a:b:n:r:s

到着する:

1:x:4:3:2:y
 : :7:9:l:z
 :0:3:j:k:m
2:9:r:s:6:u
 :m:y:5:7:9
 :u:7:9:7:6
3:a:b:c:d:e
 : :b:d:e:f
 : :b:n:r:s

答え1

直接使用awk:

$ awk -F':' '++a[$1] > 1{ $1=" " }++b[$2] > 1{ $2=" " }1' OFS=':' inp_file
1:x:4:3:2:y
 : :7:9:l:z
 :0:3:j:k:m
2:9:r:s:6:u
 :m:y:5:7:9
 :u:7:9:7:6
3:a:b:c:d:e
 : :b:d:e:f
 : :b:n:r:s

答え2

@Nagaがコメントで述べたように、Rubyスクリプトが許可されています。ここで私は解決策を思い出しました。

ルビースクリプト

#!/usr/bin/env ruby
# Frozen_String_Literal: false
$-v = nil
d, $-s, i, $,, $; = [], ?\s.freeze, '', ?:.freeze, ?:.freeze
::FILENAME = $*[0] || abort("Pass the filename as Argument.\nExample:\n\t#{File.basename($0)} hello.rb")

puts IO.readlines(File.join(Dir.pwd, FILENAME)).map! { |x|
    c = x.tap(&:strip!).split
    d.clear && i.replace(c[0].to_s) if i != c[0]
    a = c.first(2).map { |y| d.find { |z| z.include?(y) } ? $-s : y }.join << $, << c.drop(2).join unless c.empty?
    d << c.first(2).join
    a
} rescue exit!

走る

ruby scriptname.rb inputfile.txt

出力

[inputfile.txtに質問と同じデータが含まれていると仮定]

1:x:4:3:2:y
 : :7:9:l:z
 :0:3:j:k:m
2:9:r:s:6:u
 :m:y:5:7:9
 :u:7:9:7:6
3:a:b:c:d:e
 : :b:d:e:f
 : :b:n:r:s

役に立ったことを願っています!

関連情報