に基づいてeblockのアドバイスsmartctl
、問題を確認するために、過去数日間に何度も実行しています。たとえば、出力は次のようになりますsudo smartctl -a /dev/nvme0n1p2
。
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: Samsung SSD 970 EVO Plus 500GB
Serial Number: S4EVNZFN503427W
Firmware Version: 2B2QEXM7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 500,107,862,016 [500 GB]
Unallocated NVM Capacity: 0
Controller ID: 4
Number of Namespaces: 1
Namespace 1 Size/Capacity: 500,107,862,016 [500 GB]
Namespace 1 Utilization: 94,943,219,712 [94.9 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 5501ad2a18
Local Time is: Wed Dec 2 11:19:04 2020 CET
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 85 Celsius
Critical Comp. Temp. Threshold: 85 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.80W - - 0 0 0 0 0 0
1 + 6.00W - - 1 1 1 1 0 0
2 + 3.40W - - 2 2 2 2 0 0
3 - 0.0700W - - 3 3 3 3 210 1200
4 - 0.0100W - - 4 4 4 4 2000 8000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 38 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 382,321 [195 GB]
Data Units Written: 695,579 [356 GB]
Host Read Commands: 4,525,857
Host Write Commands: 9,680,786
Controller Busy Time: 30
Power Cycles: 205
Power On Hours: 75
Unsafe Shutdowns: 73
Media and Data Integrity Errors: 0
Error Information Log Entries: 209
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 38 Celsius
Temperature Sensor 2: 41 Celsius
Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
「SMART全体の健康自己評価テストの結果:合格」と「記録されたエラーなし」という行は安心できるように見えますが、次の行はそうではありません。
Unsafe Shutdowns: 73
~によるとNVMeコマンドラインツールを使用してNVMeフラッシュの状態を確認する投稿者:Peter Zaitsev(2017年2月)、安全でない終了は意味します。
終了通知を送信せずに発生した停電の数。使用しているNVMeデバイスによっては、安全でないシャットダウンによってユーザーデータが破損する可能性があります。
私のTuxedoノートブックが予期せず何度も終了しました(参照:予期しない停電の原因をログファイルで知る方法はありますか?)しかし73番ではありません。
~によるとこのフォーラムの投稿はTom's Harware(2019年4月)にあります。、クイックスタートを無効にすると便利です。これは正しいですか?それとも別のものが必要ですか?
答え1
何らかの理由で、私はこのSMARTパラメータが正しいとは思いません。私のSSDを例にすると、次のようになります。
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 75
このSSDの寿命中にリセットボタンを押したか、電源が20回未満に失われたため、これは明らかに間違っています。
比較的安全でなければならないのは、systemd
カーネルがシャットダウンする前にバッファをフラッシュするように指示されるため、すべてのダーティキャッシュが実際にデバイスにダンプされるからです。
定期的に適切なバックアップを実行することを忘れないでください。これが最も重要です。