私のディスクにエラーが発生した場合に電子メールレポートを送信するようにsmartdを設定しました。残念ながら、同じ(変更されていない)値を持つ同じ属性のスパムを毎日受け取ります。
The following warning/error was logged by the smartd daemon:
Device: /dev/sdb [SAT], 1 Offline uncorrectable sectors
Device info:
ST32000542AS, S/N:XXXXX, WWN:5-XXXXXX-XXXXXXXX, FW:XXXX, 2.00 TB
私は修正不可能なセクターを持つディスクに固有のリスクを十分に知っています。(このディスクはRAID10構成用です。)
毎日同じメールを受けたくないし、値が変更/増えるときにメールを受けたいです。
これは私の現在の構成です/etc/smartd.conf
。
DEVICESCAN -d removable -n standby -t -m root -M exec /usr/share/smartmontools/smartd-runner
smartdの期待される動作を達成するために何を変更する必要がありますか?
答え1
ステータス永続性が有効になっているときのデフォルトの動作(Debianのデフォルトの動作だと思います)は、メインイベントが記録されたときに毎日電子メールを送信することです(または少なくとも1日間電子が記録されている場合はメインイベントが記録されるとき)。郵便)。次のオプションを使用してこの動作を変更できます-M
。
-M once
あなたのEメールにsmartd.conf
送信され、主なイベントについては重複ではなく1つのEメールのみが生成されます。
(この-M once
オプションはこのオプションに追加されます-M exec
。)
/var/lib/smartmontools
ステータス永続性が実際に有効になっていることを確認するには、次の内容を確認します。すべてのドライブの最新の状態ファイルを表示する必要があります。
答え2
あなたは明らかにDebianの専門家とを-M exec
使用しています。smartd-runner
Package Maintainers and system administrators can put scripts to be run
when smartd detects an error into /etc/smartmontools/run.d. These
scripts will be run by smartd-runner using run-parts(8). The script will
receive the filename of the file containing the errormessage as first
parameter. See /etc/smartmontools/run.d/10mail for an example.
このランチャーの主な目的は、メールの送信をオプションにするようです(メールプログラムが最初にインストールされているかどうかによって異なります)、単独でデスクトップにポップアップ通知を実行するようです(デスクトップ通知がインストールされている場合)。
したがって、10mailスクリプトを変更して重複した電子メールをフィルタリングできると思います。
別の方法は、--savestates
このオプションを使用してsmartdを実行し、-M once
smartd.confでそれを使用することです。 smartd.conf のマニュアルページに、これの詳細な説明がまとめられています。
once - send only one warning email for each type of disk problem
daily - send additional warning reminder emails, once per day,
diminishing - send additional warning reminder emails, after a
one-day interval, then a two-day interval, then a four-day
test - send a single test email immediately upon smartd startup.
exec PATH - run the executable PATH instead of the default mail
これがうまくいかない場合は、それを解決するか、それに応じてフィルタリングするための独自のメールハンドラ実行ロジックを作成する必要があります。
私は修正不可能なセクターを持つディスクに固有のリスクを十分に知っています。 (このディスクはRAID10構成用です。)
そのようなドライブをすぐに交換することをお勧めします。 RAIDによる冗長約束は、各ドライブが100%動作している場合にのみ有効です。
ドライブを交換した後、データ損失の危険なしに、取り除かれたドライブで完全な書き込みテストを実行できます。このテストでは、ドライブのパフォーマンスに応じてドライブを引き続き使用するかどうかについて、より多くの情報に基づいて決定を下すことができます。好ましくはアタックの外側)またはそうではない。
ドライブをテストするまでは、ドライブの状態がどれほど悪いか正確にはわかりません.smartd.confは定期的なセルフテストを実行しているように見えないため、長い間エラーが検出されない可能性があります.これが再構築プロセス中にRAIDがシャットダウンされる理由です。
答え3
これは古いスレッドですが、smartdマニュアルで見つけたものを投稿します。
-U ID[+]
[ATA only] Report if the number of offline uncorrectable sectors
is non-zero. Here ID is the id number of the Attribute whose
raw value is the Offline Uncorrectable Sector count. The
allowed range of ID is 0 to 255 inclusive. To turn off this
reporting, use ID = 0. If the -U ID option is not given, then
it defaults to -U 198 (since Attribute 198 is generally used to
monitor offline uncorrectable sectors). If the name of this
Attribute is changed by a '-v 198,FORMAT,NAME' (except '-v
198,FORMAT,Offline_Scan_UNC_SectCt'), directive, the default is
changed to -U 0.
If '+' is specified, a report is only printed if the number of
sectors has increased since the last check cycle. **Some disks do
not reset this attribute when a bad sector is reallocated.** See
also '-v 198,increasing' below.
したがって、-U 198+オプションを追加すると、必要に応じて正しく動作するはずです。