ディスクI / Oタイムアウトがディスクの切断とSMRディスクのデータ破損を防ぐ方法は？

Question 1

次のカーネルパラメータを変更しましたが、高書き込み負荷でSMRディスクの接続が切断されなくなりました。場合によっては、過剰なI / O（たとえば、1桁のMB /秒の書き込み速度）は書き込みパフォーマンスを非常に遅くする可能性がありますが、少なくともディスク接続が失われることはありません。

DEVICE=sdX # insert your device name here
echo 3600 > /sys/block/$DEVICE/device/timeout
echo 3600 > /sys/block/$DEVICE/device/eh_timeout
echo noop > /sys/block/$DEVICE/queue/scheduler
echo 1 > /sys/block/$DEVICE/device/queue_depth
echo 4 > /sys/block/$DEVICE/queue/nr_requests

それぞれを個別にテストしていないので、それぞれを設定する必要があるかどうかはわかりませんが、この組み合わせは私にとっては効果的でした。

Answer

次のカーネルパラメータを変更しましたが、高書き込み負荷でSMRディスクの接続が切断されなくなりました。場合によっては、過剰なI / O（たとえば、1桁のMB /秒の書き込み速度）は書き込みパフォーマンスを非常に遅くする可能性がありますが、少なくともディスク接続が失われることはありません。

DEVICE=sdX # insert your device name here
echo 3600 > /sys/block/$DEVICE/device/timeout
echo 3600 > /sys/block/$DEVICE/device/eh_timeout
echo noop > /sys/block/$DEVICE/queue/scheduler
echo 1 > /sys/block/$DEVICE/device/queue_depth
echo 4 > /sys/block/$DEVICE/queue/nr_requests

それぞれを個別にテストしていないので、それぞれを設定する必要があるかどうかはわかりませんが、この組み合わせは私にとっては効果的でした。

Question 2

SMRドライブでXFSやext4を使用するのと比較して、F2FSを使用するのは良い経験でした。私のext4はSMRドライブで前述したのと同様の動作を示しているので、LinuxでSMRソリューションを調べる必要があります。また、お客様が説明するタイムアウトの問題が発生しました。私もUbuntuを使用していますが、最新のUbuntu 18.04.3 LTSバージョンを使用しています。

まず、ランダムな読み取り/書き込み操作が多いサーバーにはSMRドライブをお勧めしません。 SMRの使用を避けたいユースケースの例には、読み取り/書き込みスループットの高いデータベースおよびNASアプリケーションがあります。私のユースケースはNASの外部バックアップですが、これは時間がかかりません。

最初にすべきことは、F2FSファイルシステムを取得することです。これは18.04で非常に簡単です。

sudo apt install f2fs-tools

gpartedSMRドライブのすべてのパーティションを削除してから、ドライブ全体にわたるgpartedF2FSパーティションを作成するために使用します。

マイドライブ（Toshiba）は、MS-Windowsオペレーティングシステムコンピュータで使用するために2つのパーティションに事前フォーマットされています。最初のパーティションを小さくすると、どのファイルシステムをインストールしても書き込み速度がひどいです。私は最初のパーティションがドライブのSMR以外の部分がログや他のメタデータに割り当てられる場所であると強く疑っています。私の経験では、作成されたファイルシステムがこの領域にアクセスして利点を得ることが非常に重要です。

残念ながら、gpartedには、ブロックパーティションのSMRドライブに適したファイルシステムを適切に作成するためのオプションを設定できる場所がないようです。パーティション識別情報を記録した後、gpartedmkfsコマンドを終了して手動で実行しましたが、今回は次のような魔法が追加されました。

sudo mkfs.f2fs -fm /dev/XXXX

XXXX以前に識別したパーティションはどこにありますかgparted？ -m オプションは、F2FS に SMR ドライブの遮断領域機能を使用するよう指示するため、重要です。それがなければ、私の経験によると、あなたは屋根の地獄で苦しむでしょう。

これが完了してインストールされると、ドライブへの書き込みは非常に一貫しています。私の書き込み速度はほとんど117 MB / sから105 MB / sの間です。時々、数秒間書き込み速度が70-80 MB / sに低下した。

私はSMRドライブがターゲットヘルペスが重なるドライブ領域を書き換えて追いつく必要があると思います。幸いなことに、これは頻繁に起こりません。しかし、（まだ）ハードドライブの空き容量を半分も利用できないことは認めています。これが発生すると、shingled書き込みがより頻繁に発生し、バックアップに時間がかかることが予想されます。しかし、これはプラッタのタイル化された領域を避けるのに非常に効果的であり、速度が遅くなる例の多くを見つけることが困難です。また、デバイスのカプセル化されていない領域を活用してメタデータ（ログ）を保存するように見えます。

また、読み取りが完了してコマンドプロンプトが返された後、F2FSが残りのデータをフラッシュするのに約10秒かかったことも確認しました。データの損失を防ぐために、この期間中にデバイスを取り外したりプラグを抜いたりしないことが重要です。シェルスクリプトを使用している場合は、この点に注意してください。

私はF2FSを使った私の書き込み速度がxfsを使った書き込み速度よりはるかに高いことに同意するでしょう。また、これを達成するために時間制限を変更する必要もありませんでした。

Answer