パイプで区切られたデータファイルがあります(以下の3行の例を参照)。
私が望むのは、フィールドを「削除」して変数に入れることだけです。事前定義された長さがあります。ファイルを次のSQLスクリプトに変換したいと思います。
入力する:
| 416|CAWNBORE LIMITED |CAWNBORE | 8| 0| 0|00.00 | 0| 0|********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* | 0| 0| 0| 0| 0|
| 431|MAIN HOLDINGS LIMITED |MAINHOLDINGSCHA | 8| 0| 0|00.00 | 0| 0|********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* |********NO ADDRESS DETAILS******* | 0| 19650509| 0| 0| 0|
| 432|DUBLIN NORTH CITY MILLING COMPANY LIMITED |DUBLINNORTHCITY | 8| 0| 1|00.00 | 18750125| 19830124|113 PHIBSBORO ROAD |DUBLIN | | | 216410| 19901106| 0| 20030124| 0|
デフォルトではパイプを削除します。データをカンマで区切り、SQL文字列INSERT INTO .... VALUES(data_in_here comma Split);
希望の出力:
INSERT INTO tbcrocompany (id_company, nm_company, id_keyword, cd_status, dt_company_status, cd_type, cd_principle_obj, dt_register, dt_last_ar, ad_line_1, ad_line_2, ad_line_3, ad_line_4, cd_town_number, dt_dissolved, dt_bond_expiry, dt_next_ar, dt_last_accounts) VALUES (416,'CAWNBORE LI|MITED','CAWNBORE',8,0,0, '00.00', 0, 0, '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', 0, 0, 0, 0, 0);
INSERT INTO tbcrocompany (id_company, nm_company, id_keyword, cd_status, dt_company_status, cd_type, cd_principle_obj, dt_register, dt_last_ar, ad_line_1, ad_line_2, ad_line_3, ad_line_4, cd_town_number, dt_dissolved, dt_bond_expiry, dt_next_ar, dt_last_accounts) VALUES (431,'MAIN HOLDIN|GS LIMITED','MAINHOLDINGSCHA',8,0,0, '00.00', 0, 0, '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', '********NO ADDRESS DETAILS*******', 0, 19650509, 0, 0, 0);
INSERT INTO tbcrocompany (id_company, nm_company, id_keyword, cd_status, dt_company_status, cd_type, cd_principle_obj, dt_register, dt_last_ar, ad_line_1, ad_line_2, ad_line_3, ad_line_4, cd_town_number, dt_dissolved, dt_bond_expiry, dt_next_ar, dt_last_accounts) VALUES (432,'DUBLIN NORTH CITY MILLING COMPANY LIMITED','DUBLINNORTHCITY',8,0,1, '00.00', 18750125, 19830124, '113 PHIBSBORO ROAD', 'DUBLIN', '', '', 216410, 19901106, 0, 20030124, 0);
答え1
データがファイルにあると仮定するとdata
機能します。合理的な入力(例:データに改行なし|
):
sed -e 's/^ *| *//' -e 's/ *$//' -e 's/ *| */|/g' data |
while IFS='|' read -r f1 f2 f3 f4 f5 f6
do
# INSERT INTO mt (F1, F2, F3, F4, F5, F6) VALUES ( 16524,01,'10/17/2012','3930621977','XXNPUES ', 'S1');
echo "INSERT INTO mt (F1, F2, F3, F4, F5, F6) VALUES ($f1,$f2,'$f3','$f4','$f5','$f6');"
done
最初の行は、データ入力から先行および末尾のスペースを削除し、最初のスペースを削除することによって|
行わ| 416|CABlah |Somewhere else |
れます416|CABlah|Somewhere else|
。ユースケースに合わない場合は、式を完全に変更または削除できます。
答え2
perl
以下はタスクを実行するスクリプトです。$tablename
文字列と配列のみを変更すると、@fields
他のテーブルと連携するように簡単に変更できます@types
。
入力ファイルの最初の行にフィールド名(多くのCSVファイルで一般的)が含まれている場合、このスクリプトは大幅に短縮されます。配列@types
はまだ手動で作成する必要があります。それ以外の場合、スクリプトはどのフィールドが文字列で、どのフィールドが数値であるかを知ることはできません。 OTOH、入力ファイルにこのような最初の行がある場合、Text::CSV
またはDBD::CSV
モジュールを使用するようにスクリプトを作成できます。
コマンドラインで指定されたすべてのファイル名および/または標準入力から入力を受け取ります。
#! /usr/bin/perl
use strict;
my $tablename = 'tbcrocompany';
# field names array. This will be used later to construct
# the %fields hash, and to print the field names in the
# INSERT statement.
my @fields = qw(id_company nm_company id_keyword cd_status
dt_company_status cd_type cd_principle_obj dt_register
dt_last_ar ad_line_1 ad_line_2 ad_line_3 ad_line_4
cd_town_number dt_dissolved dt_bond_expiry dt_next_ar
dt_last_accounts);
# fields can be string (s) or number (n)
my @types = qw(n s s n n n n n n s s s s n n n n n);
# initialise the field types hash.
my %types=();
my $fieldnum=0;
foreach my $f (@fields) {
$types{$f} = $types[$fieldnum++];
}
while (<>) {
my %fields=();
# remove leading '|' from line
s/^\|//;
# split each input line by '|'
my @row = split(/\|/);
# add each element of @row to the appropriate record in the %fields hash
my $fieldnum=0;
foreach my $f (@fields) {
$fields{$f} = $row[$fieldnum++];
# strip leading and trailing spaces from field value
$fields{$f} =~ s/^\s*|\s*$//g;
}
# construct the VALUES( ... ) section of the output line,
# with quotes for string values but not for numbers.
my @values = ();
foreach my $f (@fields) {
if ($types{$f} eq 's') {
push @values, "'$fields{$f}'"
} else {
push @values, $fields{$f}
};
}
# and, finally, output the line.
print "INSERT INTO $tablename (", join(', ',@fields),
") VALUES (", join(", ",@values), ";\n";
}