このドライブが死んでいますか? :サムスンSSD 970 EVOプラス1TB

このドライブが死んでいますか? :サムスンSSD 970 EVOプラス1TB

中古コンピュータを購入し、ここにsmartdをインストールしました。 smartdから「重要な警告(0x04):信頼性」Eメールを受信しました(完了)。ペーストビン)。これはPercentage Used: 112%心配です。 smartdの「重大な警告(0x04):信頼性」という説明で十分ですか?

This message was generated by the smartd daemon running on:

   host name:  kosh
   DNS domain: [Empty]

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, Critical Warning (0x04): Reliability

Device info:
Samsung SSD 970 EVO Plus 1TB, S/N:S4EWNM0R328374F, FW:2B2QEXM7, 1.00 TB

<snip>

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
- NVM subsystem reliability has been degraded

SMART/Health Information (NVMe Log 0x02)

<snip>
Percentage Used:                    112%
<snip>

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS  Message
  0       4357     0  0x0010  0x4004      -            0     0     -  Invalid Field in Command

Self-test Log (NVMe Log 0x06)
Self-test status: No self-test in progress
No Self-tests Logged

私はsmartmontoolsバージョン7.4を実行しているので、「コマンドの無効なフィールド」エラーが赤いニシンのようです。https://www.smartmontools.org/ticket/1222テストが失敗しないように修正されました。

それから私は以下を実行しました。

$ sudo smartctl -t short /dev/nvme0n1

これsudo smartctl --all /dev/nvme0n1で次のようになります。

Self-test Log (NVMe Log 0x06)
Self-test status: No self-test in progress
Num  Test_Description  Status                       Power_on_Hours  Failing_LBA  NSID Seg SCT Code
 0   Short             Completed: failed segments             3535            -     1   2   -    -
 1   Short             Completed: failed segments             3535            -     1   2   -    -

しかし、「失敗した作品」に関する追加情報を取得する方法がわかりません。

ディスクが破損して交換する必要があると結論付けるのに十分ですか、それともまだ希望がありますか?

答え1

重要な警告は、ビットフィールドがデバイス自体から直接読み取られることです。その後、smartmontoolsはこれを示しています。したがって、smartmontools自体は実行しない説明を探しています。技術的には、smartctlはXまたはYの理由でこれを表示しません。ドライブファームウェアは独自にエラービットを設定します。

バラよりNVM Express®基本仕様、図208、200ページこの特定の重要な警告ビットは次のように記述されます。

深刻な警告:このフィールドは、コントローラの状態に関する重大な警告を示します。各ビットは重大な警告タイプに対応し、複数のビットを「1」に設定できます。ビットが「0」にクリアされると、この重要な警告は適用されません。重大な警告により、ホストに非同期イベント通知が発行される可能性があります。このフィールドのビットは、ログページインポートコマンドが処理されたときの状態を示し、関連する非同期イベント通知(存在する場合)が発生したり発生したときの状態を反映しないことがあります。

ビット:2 |定義:「1」に設定すると、主要なメディア関連エラーまたはNVMサブシステムの信頼性を低下させる内部エラーが原因で、NVMサブシステムの信頼性が低下しました。

(ここでビットは0から計算され始めるので、深刻な警告(0x04)はビット2です。)

ビットを設定するのに十分な割合を使用していますか?これは可能です。 GoogleでSamsung EVO SSDのsmartctl出力を検索しましたが、使用率が100%を超えるいくつかの項目がすべて設定されていました。

ただし、セルフテストでは失敗したセグメントを表示しないでください。たぶん長い自己テストと不良ブロック(-nまたは-wを使用しない)またはddに対して読み取り専用テストを実行できますか?

疑わしい場合:ドライブを交換してください。

関連情報