問題があります。次の内容を含む test.txt ファイルがあります。
dn: serv=CSPS,mscId=167e48dc2b7a42d4acce611c8b477262,ou=multiSCs,dc=three
structuralObjectClass: CP1
objectClass: CP1
objectClass: CUDBServiceAuxiliary
objectClass: CP2
objectClass: CP3
objectClass: CP4
objectClass: CP5
objectClass: CP6
UNKNLOCDATECS:: FQsJ
UNKNLOCDATEPS:: FgMe
ISTTIMESTAMP:: FgMIDyI7
CSULTIME:: HgMWCzYo
CSLOCTIME:: AQQWBA0R
PSULTIME:: HgMWDBco
PSLOCTIME:: HgMWDBco
SCHAR:: AgA=
ICS: 1
CAT: 10
DBSG: 1
OFA: 1
SOCB: 1
PWD: 0000
PWDC: 0
SOCFB: 0
CSULTIME:: および CSLOCTIME:: テキストが見つかるたびに、このテキストの後ろの値を次の関数で置き換えて、対応するタイムスタンプを認識された形式にデコードしたいと思います(1つのファイルスキャンでこれら2つの値を置き換えることができる場合は、効果が良いです)8GBファイルについて話していますが、どちらの場合も機能は同じです。
base64 -d | hexdump -v -e '1/1 "%02d" ' | awk 'BEGIN {FS = ""} {print "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'
Unixでこれら2つの値をエコーすると:
For CSULTIME the result would be 2022-03-30 11:54:40: echo -n "HgMWCzYo" | base64 -d | hexdump -v -e '1/1 "%02d" ' | awk 'BEGIN {FS = ""} {print "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'
For CSLOCTIME the result would be 2022-04-01 04:13:17: echo -n "AQQWBA0R" | base64 -d | hexdump -v -e '1/1 "%02d" ' | awk 'BEGIN {FS = ""} {print "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'
したがって、ファイルは次のCSULTIMEとCSLOCTIMEの値で終わります。
dn: serv=CSPS,mscId=167e48dc2b7a42d4acce611c8b477262,ou=multiSCs,dc=three
structuralObjectClass: CP1
objectClass: CP1
objectClass: CUDBServiceAuxiliary
objectClass: CP2
objectClass: CP3
objectClass: CP4
objectClass: CP5
objectClass: CP6
UNKNLOCDATECS:: FQsJ
UNKNLOCDATEPS:: FgMe
ISTTIMESTAMP:: FgMIDyI7
CSULTIME:: 2022-03-30 11:54:40
CSLOCTIME:: 2022-04-01 04:13:17
PSULTIME:: HgMWDBco
PSLOCTIME:: HgMWDBco
SCHAR:: AgA=
ICS: 1
CAT: 10
DBSG: 1
OFA: 1
SOCB: 1
PWD: 0000
PWDC: 0
SOCFB: 0
私が試したsedの組み合わせが動作しないので、私は完全に迷子になりました。
よろしくお願いします! ! ! !
答え1
私は次のことをします:
perl -MMIME::Base64 -pe 's{^[^:]*TIME:\K: (\S+)}{
my ($d, $m, $y, @t) = unpack "C*", decode_base64 $1;
sprintf "20%02d-%02d-%02d %02d:%02d:%02d", $y, $m, $d, @t}e'
答え2
次のアプローチを使用できます。まず、Base64デコード用のデバイスを設定し、次にGNU sedを使用してエンコードされたデータを処理します。
#------------------
# base64 in sed
#------------------
set -u
#> present century
century=$(date '+%C')
#> format string printf
fmt='%s%s\n'
#> bit, sextet, & octet regex
bit='[01]'
sextet="${bit}{6}"
octet="${bit}{8}"; byte=$octet
#> base64 charset
b64='/[:alnum:]+'
declare -a b64_chars=({A..Z} {a..z} {0..9} + /)
#> user-defined helper function(s)
oneLine() {
# collapse stdin into one line
paste -sd'\0' -
}
esc_rhs() {
# make stdin pkuggable
# on the rhs of a s///
sed -e '
s:[\/&]:\\&:g
$!s:$:\\:
' -
}
dec2bin() {
# create an array of size 2^$1
# Usage: dec2bin 6
# creates array d2b as:
# underscore for clarity only
# $d2b[0] => "000_000"
# $d2b[1] => "000_001"
# ...
# $d2b[63] => "111_111"
eval "d2b=($(yes '{0,1}' | sed "$1q" | oneLine))"
}
#> build the encoding lookup table
encode_tbl=$(printf '%s\n' "$(
dec2bin 6
i=0
for c in "${b64_chars[@]}"
do
printf "$fmt" "$c" "${d2b[$i]}"
(( i++ ))
done
)" | esc_rhs)
#> build the decoding lookup table
decode_tbl=$(printf '%s\n' "$(
dec2bin 8
for dec in {0..255}
do
hex=$(printf '%02x' "$dec")
bin=${d2b[$dec]}
printf "$fmt" "$bin" "$hex"
done
)" | esc_rhs)
#> hex to bin
h2d=$(for i in {0..255};do
printf 'x%02x:%02d\n' "$i" "$i"
done | oneLine | esc_rhs)
#######> main()
sed -E "
s/^\s*(CSULTIME|CSLOCTIME)::\s*/&\n/;T
h;s/\n.*//
x;s/.*\n//
s/[^${b64}]//g
/^\$/d;s/^|\$/\n/g
# unencode
s/\$/$encode_tbl/
:encode
/\n\n/!{
s/((\n)[${b64}])(.*\1(${sextet}))/\4\2\3/
b encode
}
s/\n.*//;:pad
/^(${octet})+\$/!{
s/\$/0/;b pad
}
# chunk it in 8-bit portions
s/(${octet})/& /g
G;s/\$/${decode_tbl}/;t decode
:decode
s/(${octet}) (.*\n\1([[:xdigit:]]{2}))/\3\2/
t decode
s/\n.*//
#> hex to decimal
s/^|\$/\n/g
s/\$/$h2d/;t hex2int
:hex2int
s/\n([[:xdigit:]]{2})(.*\n.*x\1:([[:digit:]]+))/\3\n\2/
t hex2int
s/\n.*//
#> rearrange decoded value into
#> yyy-mm-dd hh:mm:ss format
s/(..)(..)(..)/\3\2\1/
s/../&-/g
s/(.*)./$century\1/
s/-/:/3g
s/:/ /
#> stitch back the prefixes
#> CSULTIME, CSLOCTIME
H;z;x;s/\n//
" file
出力:-
-1e-0===
dn: serv=CSPS,mscId=167e48dc2b7a42d4acce611c8b477262,ou=multiSCs,dc=three
structuralObjectClass: CP1
objectClass: CP1
objectClass: CUDBServiceAuxiliary
objectClass: CP2
objectClass: CP3
objectClass: CP4
objectClass: CP5
objectClass: CP6
UNKNLOCDATECS:: FQsJ
UNKNLOCDATEPS:: FgMe
ISTTIMESTAMP:: FgMIDyI7
CSULTIME:: 2022-03-30 11:54:40
CSLOCTIME:: 2022-04-01 04:13:17
PSULTIME:: HgMWDBco
PSLOCTIME:: HgMWDBco
SCHAR:: AgA=
ICS: 1
CAT: 10
DBSG: 1
OFA: 1
SOCB: 1
PWD: 0000
PWDC: 0
SOCFB: 0
答え3
わかりました。私は正しく実行しています(sedを使用してPerlでhexdumpを使用する方法がわかりません)。問題はsed内でエスケープする必要がある文字です。
これで2つのsedを実行する必要がありますが、完全に機能します。
sed 's/\(CSULTIME::\)\(.*\)/echo -n \1" ";echo \2\| base64 -d \| hexdump -v -e '\''1\/1 "%02d" '\'' \| awk '\''BEGIN {FS = ""} {print "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'\'' /ge '
sed 's/\(CSLOCTIME::\)\(.*\)/echo -n \1" ";echo \2\| base64 -d \| hexdump -v -e '\''1\/1 "%02d" '\'' \| awk '\''BEGIN {FS = ""} {print "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'\'' /ge '
#-------------
Bash関数でコードを分割してエクスポートし、GNU sedのss // eから呼び出すことができます。
fx() {
printf '%s' "$2" | base64 -d |
hexdump -v -e '1/1 "%02d" ' |
awk -v temp="$1" 'BEGIN {FS = ""} {print temp "20" $5 $6 "-" $3 $4 "-" $1 $2 " " $7 $8 ":" $9 $10 ":" $11 $12}'
}
export -f fx
sed -E "s/((CSULTIME|CSLOCTIME)::\s*)(\S.*)/fx '\1' '\3'/e" file