次の行で構成されるテキスト入力ファイルがあります。
352|C|PAID|7036|VOICE|01-FEB-12
各行を(パイプライン)文字のフィールドに分割し、|
ラベルを使用して各フィールドを出力する必要があります。つまり、次の形式の行を生成する必要があります。
{ "IMSI":"352", "Status":"C", "ServiceType":"PAID", "Number":"7036", "ConnectionType":"VOICE", "ActivationDate":"01-FEB-12" }
どうすればいいですか?
答え1
これを完全にシェルで実行するには、次の手順を実行します。
while IFS="|" read -r im st se nu co ac
do
printf '{ "%s":"%s", "%s":"%s", "%s":"%s", "%s":"%s", "%s":"%s", "%s":"%s" }\n' \
IMSI "$im" \
Status "$st" \
ServiceType "$se" \
Number "$nu" \
ConnectionType "$co" \
ActivationData "$ac"
done < input > output
答え2
少しPythonに置き換えてください。
#!/usr/bin/env python
import csv
import json
import sys
from collections import OrderedDict
keys = ['IMSI', 'Status', 'ServiceType', 'Number', 'ConnectionType', 'ActivationData']
with open(sys.argv[1], 'rt') as csvfile:
reader = csv.reader(csvfile, delimiter='|')
for row in reader:
print json.dumps(OrderedDict(zip(keys, row)))
出力:
{"IMSI": "352", "Status": "C", "ServiceType": "PAID", "Number": "7036", "ConnectionType": "VOICE", "ActivationData": "01-FEB-12"}