FF
値でいっぱいのバイナリファイルがあります。序盤にたくさん詰めました\000
。次に、\000
ある種のオフセットを得るために、最初の部分を10で埋め、次に短い文字列を書きました。\000
私はこれを使用しましたprintf
:
printf \000\000\000\000\000\000\000\000\000\000MAC_ADDRESS=12:34:56:78:90,PCB_MAIN_ID=m/SF-1V/MAIN/0.0,PCB_PIGGY1_ID=n/SF-1V/PS/0.0,CSL_HW_VARIANT=D\000' > eeprom
ファイルの16進ダンプを表示すると、次のようになります。
さて、この文字列の読み方を知りたいです。MY_STR=${eeprom:OFFSET}
(はファイル名)を使用でき、eeprom
文字列だけでなく、私が望んでいない残りのファイルも提供します。最初に見つかった場合はどうやって停止しますか\000
?
MY_STR=${eeprom:OFFSET:LENGTH}
文字列の長さが不明なため使用できません。- もう一つのこと - どうやって補充できますか
FF
? - 使用
sh
(ビジボックス)
編集する
input
いくつかの小さな例を作成しようとしています...次の値を持つファイルがあります(後ろxxd -c 1 input
):
0000000: 68 h
0000001: 65 e
0000002: 6c l
0000003: 6c l
0000004: 6f o
0000005: 2c ,
0000006: 20
0000007: 00 .
0000008: 69 i
0000009: 74 t
000000a: 27 '
000000b: 73 s
000000c: 20
000000d: 6d m
000000e: 65 e
000000f: 2c ,
0000010: 00 .
このスクリプトがありますs.sh
。
BUF=""
for c in $(xxd -p input); do
if [ "${c}" != 00 ]; then
BUF="$BUFc";
else
break;
fi
done
echo $BUF
「hello」が鳴ると予想していましたが、何も印刷されません。
答え1
オプション1:直接変数の割り当て
気になるのがヌルバイトだけであれば、好みの標準的な方法を使用してファイル内のデータを変数として直接読み取ることができるはずです。つまり、ヌルバイトを無視してファイルからデータを読み取ることができるはずです。 。以下は、cat
コマンドとコマンドの置換を使用する例です。
$ data="$(cat eeprom)"
$ echo "${data}"
MAC_ADDRESS=12:34:56:78:90,PCB_MAIN_ID=m/SF-1V/MAIN/0.0,PCB_PIGGY1_ID=n/SF-1V/PS/0.0,CSL_HW_VARIANT=D
これはBusyBox Dockerコンテナで私にとって効果的でした。
解決策 2: xxd
andfor
ループの使用
さらに制御したい場合は、xxd
バイトを16進文字列に変換してその文字列を繰り返すことができます。その後、これらの文字列を繰り返すときに目的のロジックを適用できます。たとえば、初期NULL値を明示的にスキップして、一部の中断条件に達するまで残りのデータを印刷できます。
次のスクリプトは、有効な文字(ASCII 32〜127)の「許可リスト」を指定し、他の文字のサブシーケンスを区切り文字として処理し、有効な部分文字列をすべて抽出します。
#!/bin/sh
# get_hex_substrings.sh
# Get the path to the data-file as a command-line argument
datafile="$1"
# Keep track of state using environment variables
inside_padding_block="true"
inside_bad_block="false"
# NOTE: The '-p' flag is for "plain" output (no additional formatting)
# and the '-c 1' option specifies that the representation of each byte
# will be printed on a separate line
for h in $(xxd -p -c 1 "${datafile}"); do
# Convert the hex character to standard decimal
d="$((0x${h}))"
# Case where we're still inside the initial padding block
if [ "${inside_padding_block}" == "true" ]; then
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
inside_padding_block="false";
printf '\x'"${h}";
fi
# Case where we're passed the initial padding, but inside another
# block of non-printable characters
elif [ "${inside_bad_block}" == "true" ]; then
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
inside_bad_block="false";
printf '\x'"${h}";
fi
# Case where we're inside of a substring that we want to extract
else
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
printf '\x'"${h}";
else
inside_bad_block="true";
echo
fi
fi
done
if [ "${inside_bad_block}" == "false" ]; then
echo
fi
\x00
これで、サブストリングを区切るサブシーケンスの合計を使用してサンプルファイルを生成してテストできます\xff
。
printf '\x00\x00\x00string1\xff\xff\xffstring2\x00\x00\x00string3\x00\x00\x00' > data.hex
以下は、スクリプトを実行したときに得られる出力です。
$ sh get_hex_substrings.sh data.hex
string1
string2
string3
解決策3:tr
およびcut
コマンドの使用
ヌルバイトを処理するためにtr
コマンドを使用することもできます。cut
以下は、隣接するヌル文字を圧縮/折りたたみ、それを改行文字に変換してヌル終了文字列リストから最初のヌル終了文字列を抽出する例です。
$ printf '\000\000\000string1\000\000\000string2\000\000\000string3\000\000\000' > file.dat
$ tr -s '\000' '\n' < file.dat | cut -d$'\n' -f2
string1