可能ですが、まず適切なテストを行ってください。

可能ですが、まず適切なテストを行ってください。

今日、Firefoxで映像を見て、以下のようなウィンドウが出ました。 ここに画像の説明を入力してください。

またはGSmartContolの出力:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-4.19.0-22-amd64] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Laptop SSHD
Device Model:     ST500LM000-1EJ162-SSHD
Serial Number:    W3715AR9
LU WWN Device Id: 5 000c50 06e236b9f
Firmware Version: HPD3
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Oct 23 14:41:09 2022 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM level is:     254 (maximum performance)
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, frozen [SEC2]

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (  634) seconds.
Offline data collection
capabilities:            (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    (  99) minutes.
SCT capabilities:          (0x1081) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR-K   118   099   006    -    195697992
  3 Spin_Up_Time            PO---K   099   099   000    -    0
  4 Start_Stop_Count        -O--CK   093   093   020    -    7676
  5 Reallocated_Sector_Ct   PO--CK   100   100   036    -    0
  7 Seek_Error_Rate         POSR-K   082   060   030    -    4473742513
  9 Power_On_Hours          -O--CK   087   087   000    -    11853
 10 Spin_Retry_Count        PO--CK   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   093   093   020    -    7668
180 Unknown_HDD_Attribute   -O-R-K   100   100   000    -    64025461
183 Runtime_Bad_Block       -O--CK   100   100   000    -    0
184 End-to-End_Error        PO--CK   100   100   097    -    0
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   099   000    -    2
189 High_Fly_Writes         -O-RCK   063   063   000    -    37
190 Airflow_Temperature_Cel -O---K   069   055   045    -    31 (Min/Max 28/32)
191 G-Sense_Error_Rate      -O--CK   100   100   000    -    0
192 Power-Off_Retract_Count -O--CK   100   100   000    -    228
193 Load_Cycle_Count        -O--CK   097   097   000    -    7777
194 Temperature_Celsius     -O---K   031   045   000    -    31 (0 14 0 0 0)
196 Reallocated_Event_Count -O--CK   100   100   000    -    0
197 Current_Pending_Sector  -O--CK   100   100   000    -    16
198 Offline_Uncorrectable   ----CK   100   100   000    -    16
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
254 Free_Fall_Sensor        -O--CK   100   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
Address    Access  R/W   Size  Description
0x00       GPL,SL  R/O      1  Log Directory
0x01           SL  R/O      1  Summary SMART error log
0x02           SL  R/O      5  Comprehensive SMART error log
0x03       GPL     R/O      5  Ext. Comprehensive SMART error log
0x06           SL  R/O      1  SMART self-test log
0x07       GPL     R/O      1  Extended self-test log
0x09           SL  R/W      1  Selective self-test log
0x10       GPL     R/O      1  NCQ Command Error log
0x11       GPL     R/O      1  SATA Phy Event Counters log
0x21       GPL     R/O      1  Write stream error log
0x22       GPL     R/O      1  Read stream error log
0x24       GPL     R/O   1223  Current Device Internal Status Data log
0x25       GPL     R/O   1223  Saved Device Internal Status Data log
0x30       GPL,SL  R/O      9  IDENTIFY DEVICE data log
0x80-0x9f  GPL,SL  R/W     16  Host vendor specific log
0xa1       GPL,SL  VS      20  Device vendor specific log
0xa2       GPL     VS    3900  Device vendor specific log
0xa8       GPL,SL  VS     129  Device vendor specific log
0xa9       GPL,SL  VS       1  Device vendor specific log
0xab       GPL     VS       1  Device vendor specific log
0xae       GPL     VS       1  Device vendor specific log
0xb0       GPL     VS    4580  Device vendor specific log
0xb6       GPL     VS    1918  Device vendor specific log
0xbe-0xbf  GPL     VS   65535  Device vendor specific log
0xc1       GPL,SL  VS      10  Device vendor specific log
0xc2       GPL,SL  VS      50  Device vendor specific log
0xc4       GPL,SL  VS       5  Device vendor specific log
0xe0       GPL,SL  R/W      1  SCT Command/Status
0xe1       GPL,SL  R/W      1  SCT Data Transfer

SMART Extended Comprehensive Error Log Version: 1 (5 sectors)
Device Error Count: 1
    CR     = Command Register
    FEATR  = Features Register
    COUNT  = Count (was: Sector Count) Register
    LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
    LH     = LBA High (was: Cylinder High) Register    ]   LBA
    LM     = LBA Mid (was: Cylinder Low) Register      ] Register
    LL     = LBA Low (was: Sector Number) Register     ]
    DV     = Device (was: Device/Head) Register
    DC     = Device Control Register
    ER     = Error register
    ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 [0] occurred at disk power-on lifetime: 8134 hours (338 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 51 00 00 00 00 00 a0 3a 40 00 00  Error: UNC at LBA = 0x00a03a40 = 10500672

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  25 00 00 00 2a 00 00 00 a0 3a 40 e0 00     01:31:49.827  READ DMA EXT
  25 00 00 00 35 00 00 00 a0 42 0b e0 00     01:31:49.348  READ DMA EXT
  25 00 00 00 0b 00 00 00 a0 42 00 e0 00     01:31:49.345  READ DMA EXT
  25 00 00 00 15 00 00 03 93 ac 6b e0 00     01:31:49.342  READ DMA EXT
  25 00 00 00 2b 00 00 03 93 ac 40 e0 00     01:31:49.339  READ DMA EXT

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     11852         -
# 2  Short offline       Completed without error       00%     11847         -
# 3  Short offline       Completed without error       00%     11844         -
# 4  Short offline       Completed without error       00%     11835         -
# 5  Short offline       Completed without error       00%     11830         -
# 6  Short offline       Completed without error       00%     11823         -
# 7  Short offline       Completed without error       00%     11818         -
# 8  Short offline       Completed without error       00%     11814         -
# 9  Short offline       Completed without error       00%     11806         -
#10  Short offline       Completed without error       00%     11801         -
#11  Short offline       Completed without error       00%     11792         -
#12  Short offline       Completed without error       00%     11790         -
#13  Short offline       Completed without error       00%     11780         -
#14  Short offline       Completed without error       00%     11772         -
#15  Short offline       Completed without error       00%     11765         -
#16  Short offline       Completed without error       00%     11756         -
#17  Short offline       Completed without error       00%     11751         -
#18  Short offline       Completed without error       00%     11747         -
#19  Short offline       Completed without error       00%     11740         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    31 Celsius
Power Cycle Min/Max Temperature:     25/32 Celsius
Lifetime    Min/Max Temperature:     16/44 Celsius
Under/Over Temperature Limit Count:   0/2

SCT Data Table command not supported

SCT Error Recovery Control command not supported

Device Statistics (GP/SMART Log 0x04) not supported

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x000a  2            3  Device-to-host register FISes sent due to a COMRESET
0x0001  2            0  Command failed due to ICRC error
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS

今日Linuxを起動しましたが、起動できませんでした。だからブートを再起動しましたが、問題なく動作しました。このエラーが発生する前でした。この起動問題がsmartmontoolsのバグに関連しているかどうかはわかりません。このエラー警告が表示される前に起動に関する問題が発生しました。

混乱している: reoprtに「ディスクの電源投入寿命[0]中にエラー1が発生しました:8134時間(338日+ 22時間)」という行があります。ところで日付がありません。このエラーが発生した日付があるため、今日の日付を表示し、エラーを今日の日付に明確に指定できることを期待しています。 txtファイルの完全な出力で日付が見つからず、8134hでエラーが発生したため、sshdの実際の寿命を探しています。だから私のsshdがこれまでに実行された時間をどこかで見つけることができると期待しています。しかし、私はこれも見つかりませんでした。

どのホストのシステムログが参照されますか?おそらく次のようになります:/var/log/syslog?

もしそうなら:これは: https://workupload.com/file/NVD2gpdrvHp

しかし、私の主な質問は:私のsshdがすぐに死ぬ危険が高いですか?

ハードドライブの状態が変更されたとします。しかし、今私の現在の健康状態はどこで確認できますか?

ありがとうございます。

答え1

オフライン変更不可能セクタ

投稿した画像やテキストを見ると、すでに読めない、または書き込めないセクタが16個あります。

過去にデータ復旧ワーカーとして以下を使用することをお勧めします。ddrescue(マンページ)できるだけ早くディスクの残りの部分を外部メディアにコピーします。

この時点では、SMARTとPOHを介しているかどうかは重要ではありません。


これで使用しddrescueて実際に問題があることを確認できるので、別の問題はどのファイルが影響を受けるかを把握することであり、ddrescueのログファイルにそのファイルが見つかりません。

次のようにddrescueイメージを正常にマウントする必要がありますroot

mount -o ro,loop,offset=$(( sector size, usually 512 * an actual offset )) /path/to/ddrescue/image /mnt/point/

エラー=影響を受けたファイルを探す:

cp -PRv /mnt/point/ /path/to/extracted/files/ 2>>/path/to/extracted/files/ERRORS.txt

これは単なる例です。必ずパスを再確認してコピーして貼り付けないでください。

答え2

ドライブ自体は日付を知らず、日付を設定する方法もありません。これは単に充電時間単位で計算され、ドライブが一度に数分間しか動作しない場合、そのカウンタも粗く正しく計算されない可能性があります。

現在の電源投入時間は11853なので、このシステムが毎日実行されている平均時間に基づいて日付を推定できます。または、他の場所に電源投入時の値を記録して、より正確な日付を推測することもできます。

ドライブに読み込めない(保留中または変更できない)セクタがあるため、一部のデータが失われた可能性があります。比較できるバックアップや確認できるチェックサムはありますか?

個人的には、まず(読み取りエラー処理のために)交換してddrescueから、より徹底的にテストします。 SMARTが報告するエラーカウンタは、常に意図的に問題を検出せずにドライブで発生した最小値です。

したがって、現在報告されていないバグがある可能性があります。

将来的には、長期自己テスト(またはオプションの自己評価)短いテストは、読み取りエラーを検出するのに十分信頼できないためです。

答え3

私は特にこれについて心配します:

  7 Seek_Error_Rate         POSR-K   082   060   030    -    4473742513

ナビゲーションエラー率が高い(以前は悪かった)。

ブロックには本質的に心配する必要がない修正不可能なエラーがある可能性があり、16個の保留中のエラーがある可能性がありますが、検索エラー率に基づいてそのドライブを信頼しない可能性があり、これらのドライブが失敗すると通常は失敗します。すぐに、そして驚くほど。

不良ブロックチェックを実行し、長期間にわたってセルフテストを実行した後、結果に基づいて実行するアクションを決定します。ディスクはシステムファイル(または簡単に復元できる他のファイル)を保存するのに適していますが、おそらく重要なデータをディスクに保存することはありません。

どのホストのシステムログが参照されますか?/var/log/syslog

はい。内部ログに同じエラー(例:LBA 0x00a03a40で修正不可能なREAD DMA EXT)が表示されることがあります。

私はSSHDの実際のライフサイクルを探しています。

  9 Power_On_Hours          -O--CK   087   087   000    -    11853

SMART値は100に正規化され(低いほど悪い)、ドライブが表示されたしきい値を下回ると「失敗」と見なされます。これがあなたのドライブがまだ通過する理由です。すべての値がしきい値より高い。

それでも動作していて、いくつかの不良ブロック(発生する可能性があります)があり、そのブロックを再割り当てすると、かなり長い間問題ありません。したがって、引き続き使用できますが、私が書いたようにエラーが発生すると、高い検索エラー率がすでにいくつかの問題(おそらく機械的)を示しているため、突然失敗する可能性があります。

答え4

可能ですが、まず適切なテストを行ってください。

特に、ディスクに対して長期間のセルフテストを実行する必要があります。smartctl -t long /dev/sdaターミナル(ドライブがあると仮定)からrootとしてこれを実行して/dev/sdaから、約1時間40分後に戻ってGSmartControlの出力を再確認してください。

これにより、ディスクファームウェアは独自の内部テストコレクションを実行します。しなければならないGSmartControlの出力にいくつかの変更が発生します。特に、あなたは次のいずれかを探しています:

  • 「SMART総合健康自己評価結果」が他の内容に変更されましたPASSED
  • 増加生の属性 5、196、197、または 198 のいずれかの値。
  • 出力のSMART拡張包括的なエラー・ログ部分に1つ以上の他のエラーがあります。
  • SMART拡張セルフテストログセクションの新しい-エントリLBA_of_first_error

拡張セルフテストを実行した後にこれらの条件のいずれかが見つかった場合は、すぐにドライブの交換を検討する必要があります。

拡張セルフテストを実行してもこれらの条件が表示されない場合は、ドライブの交換を検討してくださいが、そうでない可能性があります。〜のように緊急。それでも継続して監視してください。

しかし、記録されたエラーはどうですか?

ドライブの電源を入れるには11853時間かかりました(SMART拡張セルフテストログでも推測できるプロパティ9の元の値)、エラーはずっと前に発生したため無視できます。

いくつかの背景知識では、システムは数値を正確な日付にマップできないため、日付はリストされていません。ドライブには内部時計がないため、日付自体を追跡できず、システム自体はドライブがどれくらいの時間を費やしたかを知りません。停電(これを行うには、電源を入れるのにかかる時間をプロットする必要があります。存在する特定の日時まで)。

オフラインで編集できないセクタ/現在保留中のセクタはどうですか?

これらの指標は実際にSMARTの大きな問題を強調しています。過去のデータではなく、現在の値の特定の時点のスナップショットのみを取得するためそしてカウンターの最後の変更が発生した時点のタイムスタンプがない場合、遠い過去のイベントと最近のイベントを区別したり、急激な変化と着実な増加を区別する方法はありません。

これらの特定の指標は、これらの差別化が実際に重要な部分です。これらの数字(または再割り当てされたセクターの数)の1つが突然突然急増したり連続的に増加したりすると、この状況は懸念されます。何百時間も1〜2回しか得られず、ほとんどが同じままであればそれほど大きな問題ではありません(まだ注意を払う価値がありますが、赤ちゃんを食べることはありません)。

特別な場合は、数字が変わり続けたり、突然再びジャンプしない限りは問題ありません(再割り当てのためのバックアップセクタとして使用できる一般的なドライブの近くにはありません)。

すべてが大丈夫なら、交換を推奨するのはなぜですか?

しかし、、ここに含めることができる他の事項があります。私が見つけた最大の問題は、検索エラー率が特に高いことです(属性7)。これはほとんどゼロにはなりませんが、正規化された属性値が約90以下に下がるのは珍しいほど十分です。ほとんどの場合、これはドライブ自体内の機械的問題を表し、これはすぐに差し迫ったエラーを示す非常に信頼できる指標です。さらに、高速書き込み数はゼロではありません(これは通常機械的問題を示します)。

これを考慮すると、少なくとも対応するドライブ交換計画を真剣に検討します。可能であれば、SSDを使用すると、ノートブックで既存のハードドライブを使用するときに発生するほとんどの問題を解決し、スピードアップできます。そしてバッテリー寿命が少し延長されます)。あなた完全にしかし、故障する前に交換しようとすると、ハードドライブの機械的故障はほぼ常に突然、災害的であり、後で実際にデータを回復することは不可能です。

関連情報