
私は私に奇妙なことを見つけました。
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 8003 -
# 2 Extended offline Completed: read failure 90% 8001 5907400
# 3 Extended offline Completed: read failure 90% 8001 5907400
# 4 Extended offline Completed: read failure 90% 8001 5907400
# 5 Extended offline Completed: read failure 90% 8001 5907400
# 6 Short offline Completed: read failure 80% 8001 5907400
# 7 Short offline Completed: read failure 80% 8000 5907400
# 8 Extended offline Completed without error 00% 1 -
私のドライブで多数のATAエラーが発生したため、データを読み取ることができません。 RMAをすることに決めてhdparm
セキュリティ削除を実行してshred
しまいました。小型(500GB Samsung EVO)SSDなので比較的スピードが速いです。私は別のものを実行し、smartctl -t short
...それは自分で「修正」されました。
ドライブにはまだATA Error Count: 207
次のプロパティがあります。
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 075 075 010 Pre-fail Always - 123
9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 8004
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 27
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 4
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 075 075 010 Pre-fail Always - 123
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 075 075 010 Pre-fail Always - 123
187 Reported_Uncorrect 0x0032 099 099 000 Old_age Always - 207
190 Airflow_Temperature_Cel 0x0032 060 051 000 Old_age Always - 40
195 Hardware_ECC_Recovered 0x001a 199 199 000 Old_age Always - 207
199 UDMA_CRC_Error_Count 0x003e 099 099 000 Old_age Always - 1
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 12
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 3737223587
SMARTテストが突然「自己修正」される原因は何ですか?ドライブはもはや信頼できないと思いますか?しかし、サムスンがテストに合格しなかったので、今すぐ返品するかどうか疑問です。
編集:ストーリーの完成度を高めるために、サムスンはドライブを新しいドライブに置き換えました。
答え1
データはエラー訂正情報と共に保存され、複数のビットエラーを修正し(より多くの)ビットエラーを検出できます。
簡単なケースは4人の多数決です。
0000 - '0', no error
0001 - '0', 1 error
0010 - '0', 1 error
0011 - uncorrectable
0100 - '0', 1 error
0101 - uncorrectable
0110 - uncorrectable
0111 - '1', 1 error
1000 - '0', 1 error
1001 - uncorrectable
1010 - uncorrectable
1011 - '1', 1 error
1100 - uncorrectable
1101 - '1', 1 error
1110 - '1', 1 error
1111 - '1', 0 errors
この方法では、1つのエラーを修正し、2つのエラーを検出できます。 3つのエラーがあると、誤った結果が出ます。もちろん、実際の方法ではより大きなグループを使用するため、データが4倍ではなく数パーセントだけ拡張され、エラーが頻繁に一緒にクラスタ化されることも考慮します。
したがって、「修正不可能」エラーは必ずしもメディアの破損を意味するわけではなく、単にデータを回復できないという意味にすぎません。データを上書きすると、この問題を簡単に解決できます。そんなことが起きているようです。
エラーが表示される前にエラーを読み取ろうとする回数が多い。これらの試みのいずれかが成功すると、ブロックは再マップされて表示されますUsed_Rsvd_Blk_Cnt_Tot
。元の値である123が75に変換されるため、予約済みブロックの約4分の1が使用されると予想されるため、約500個程度になります。FAILING_NOW
このプロパティは、ブロックの10%が残る(たとえば約50個)状態に入ります。
はい。 SSDは、読み込み失敗に加えて、再割り当てされたセクタが多いので、少し奇妙だと思います。