2つのファイルの各列を比較し、一致しない列を示すいくつかのIDを持つ他のファイルに対応する違いを作成する必要があります。一致しない列を指摘することが私の主な問題の説明です。たとえば、次のようなファイルがあります。
File 1
1|piyush|bangalore|dev
1|piyush|bangalore|QA
2|pankaj|bangalore|dev
3|rohit|delhi|QA
File 2
1|piyush|bangalore|QA
1|piyush|bangalore|QA
2|pankaj|bangalore|dev
3|rohit|bangalore|dev
予想される出力ファイルは次のとおりです。
File 1
1|piyush|bangalore|**dev**
File 2
1|piyush|bangalore|**QA**
File 1
3|rohit|**delhi**|**QA**
File 2
3|rohit|**bangalore**|**dev**
一致しない列と一致しない行を表示できるように機能を実装したいと思います。頑張った
diff File1 File2 > Diff_File
ただし、これは一致しないレコードまたは行のみを提供します。また、一致しない列を指摘する方法もありません。私が最初に遭遇したシェルスクリプトまたはawkコマンドを使用できる場合は、助けてください。よろしくお願いします。
答え1
Python3.xソリューション:
diff_marked.pyスクリプト:
import sys
file1_name = sys.argv[1]
file2_name = sys.argv[2]
with open(file1_name, 'r') as f1, open(file2_name, 'r') as f2:
f1_lines = f1.readlines() # list of lines of File1
f2_lines = f2.readlines() # list of lines of File2
for k,l in enumerate(f1_lines):
f1_fields = l.strip().split('|') # splitting a line into fields by separator '|'
if k < len(f2_lines) and f2_lines[k]:
has_diff = False
f2_fields = f2_lines[k].strip().split('|')
for i,f in enumerate(f1_fields):
if f != f2_fields[i]: # comparing respective lines 'field-by-field' between two files
f1_fields[i] = '**' + f + '**' # wrapping differing fields
f2_fields[i] = '**' + f2_fields[i] + '**'
has_diff = True
if has_diff:
print(f1.name) # print file name
print('|'.join(f1_fields))
print(f2.name)
print('|'.join(f2_fields))
使用法:(他のPythonバージョンがある可能性があります。現在のケースはテストされています。Python 3.5)
python3.5 diff_marked.py File1 File2 > diff_output
diff_output
コンテンツ:
File1
1|piyush|bangalore|**dev**
File2
1|piyush|bangalore|**QA**
File1
3|rohit|**delhi**|**QA**
File2
3|rohit|**bangalore**|**dev**