ディスク交換後もraidz2で読み取り/書き込み/cksumエラーが続く(Netapp DS4243)

ディスク交換後もraidz2で読み取り/書き込み/cksumエラーが続く(Netapp DS4243)

以前はうまくいきましたが、今はパフォーマンスが低下し、次のように構成されたzfsプールがあります。数週間、ディスクを交換して再交換してプールを修正しようとしましたが、同じベイで同じ問題が再び発生しました。 。

数週間前

        NAME                        STATE     READ WRITE CKSUM
        zpool                       DEGRADED     0     0     0
          raidz2-0                  DEGRADED     0     0     0
            wwn-0x50000c900040b558  ONLINE       3   159     0
            wwn-0x50000c900040a134  ONLINE       0     0     0
            wwn-0x50000c900040f8b0  ONLINE       0     0     0
            wwn-0x50000c90003fd4c4  ONLINE       0     0     0
            wwn-0x50000c90003fe7fc  ONLINE       0     0     0
            wwn-0x50000c9000409f8c  ONLINE       0     0     0
            scsi-3500605ba010cb160  ONLINE       0     0     0
            wwn-0x50000c900015436c  ONLINE       0     0     0
            replacing-8             UNAVAIL      3 35.9K     0  insufficient replicas
              2597997485925153301   FAULTED      0     0     0  was /dev/sdl1
              sdaa                  FAULTED     20 27.0K     0  corrupted data
              sdaa                  FAULTED      3 9.27K     0  too many errors
            wwn-0x50000c900040a0a0  ONLINE   5.74K 78.3K     0
            wwn-0x50000c90004104fc  ONLINE       0     0     0
            wwn-0x50000c90003fc900  ONLINE       0     0     0
          raidz2-1                  ONLINE       0     0     0
            wwn-0x500605ba00776c40  ONLINE       3     2     2
            wwn-0x500605ba00a89b18  ONLINE       0     0     0
            wwn-0x50000c90003fc944  ONLINE       0     0     0
            wwn-0x50000c90003fbdf0  ONLINE       0     0     0
            wwn-0x50000c90003fbdf4  ONLINE       0     0     0
            wwn-0x50000c9000409f24  ONLINE       0     0     0
            wwn-0x500605ba0108354c  ONLINE       0     0     0
            wwn-0x500605ba00bfceec  ONLINE       0     0     0
            wwn-0x50000c900040ac94  ONLINE       0     0     0
            wwn-0x50000c900040f968  ONLINE       0     0     0
            wwn-0x50000c90003fbe10  ONLINE       0     0     0
            wwn-0x50000c900040a828  ONLINE       0     0     0
        special
          mirror-2                  ONLINE       0     0     0
            wwn-0x5001b444a7ae7a55  ONLINE       0     0     0
            wwn-0x5001b444a7ae7a57  ONLINE       0     0     0

追加ディスク交換後の再同期とリセット:

        NAME                                     STATE     READ WRITE CKSUM
        zpool                                    DEGRADED     0     0     0
          raidz2-0                               DEGRADED     0     0     0
            wwn-0x50000c900040b558               ONLINE       0     0     0
            wwn-0x50000c900040a134               ONLINE       0     0     0
            wwn-0x50000c900040f8b0               ONLINE       0     0     0
            wwn-0x50000c90003fd4c4               ONLINE       0     0     0
            wwn-0x50000c90003fe7fc               ONLINE       0     0     0
            wwn-0x50000c9000409f8c               ONLINE       0     0     0
            scsi-3500605ba010cb160               ONLINE       0     0     0
            wwn-0x50000c900015436c               ONLINE       0     0     0
            usb-LITEON_UITRA1_00000000006BF-0:0  DEGRADED     0     0 18.0K  too many errors  (resilvering)
            replacing-9                          DEGRADED    52  318K 2.01K
              old                                OFFLINE      0     0     0  block size: 512B configured, 4096B native
              wwn-0x50000c900040a0a0             ONLINE      17 1.58M     0  block size: 512B configured, 4096B native  (resilvering)
            wwn-0x50000c90004104fc               ONLINE       0     0     0
            wwn-0x50000c90003fc900               ONLINE       0     0     0
          raidz2-1                               ONLINE       0     0     0
            wwn-0x500605ba00776c40               ONLINE       0     0     0
            wwn-0x500605ba00a89b18               ONLINE       0     0     0
            wwn-0x50000c90003fc944               ONLINE       0     0     0
            wwn-0x50000c90003fbdf0               ONLINE       0     0     0
            wwn-0x50000c90003fbdf4               ONLINE       0     0     0
            wwn-0x50000c9000409f24               ONLINE       0     0     0
            wwn-0x500605ba0108354c               ONLINE       0     0     0
            wwn-0x500605ba00bfceec               ONLINE       0     0     0
            wwn-0x50000c900040ac94               ONLINE       0     0     0
            wwn-0x50000c900040f968               ONLINE       0     0     0
            wwn-0x50000c90003fbe10               ONLINE       0     0     0
            wwn-0x50000c900040a828               ONLINE       0     0     0
        special
          mirror-2                               ONLINE       0     0     0
            wwn-0x5001b444a7ae7a55               ONLINE       0     0     0
            wwn-0x5001b444a7ae7a57               ONLINE       0     0     0

errors: No known data errors

24軸Netapp DS4243であり、エラーは主に問題のある3つのドライブベイのうちの1つに関連しています。

問題ベイ 質問 テスト
USB-LITEON_UITRA1_00000000006BF-0:0 数分以上このベイにオンラインのままのディスクがないため、USBエンクロージャに交換されました。 新しいディスクを含む4つのディスクがテストと再同期に使用されました。問題が解決し、USBエンクロージャと交換しましたが、動作しましたが、USBエンクロージャのディスクのためにエラーの数が多いことが報告されましたが、ディスクがHD Sentinelでテストされたために奇妙でした。
wwn-0x50000c900040a0a0 一般的に問題はありませんが、数回オフラインになり、再同期操作の終わりに不安定な読み書きエラーが発生しました。 テストと再同期には、新しいディスクを含む3つのディスクを使用します。問題はまだ存在します
wwn-0x50000c900040b558 不安定な読み取りおよび書き込みエラーがある場合、オフラインで一度だけ発生しますが、wwn-0x50000c900040a0a0未満です。 テストと再同期には2つの異なるディスクを使用します。問題はまだ存在します

問題ベイは物理的に隣接せずにランダムに配置されます。https://i.stack.imgur.com/GkrGG.jpg)。これらのベイは Netapp デバイスの内部に接続されます。単にドライブをホットスワップベイに接続し、SAS HDケーブルを使用してSAS HBAアダプタに直接接続します。唯一の物理的な動作は、Netappが過去にIOM6コントローラをインストールしたと考えているということです。

wwn-0x50000c900040a0a0およびwwn-0x50000c900040b558のsmartctl統計にはディスクエラーは表示されませんが、wwn-0x50000c900040a0a0の「通常エラー数」の値は28です。私が収集したデータは、インターフェイスエラーの可能性についてのヒントを提供します。理由がわかりました。

残念ながら、これは失う余裕のないプールであり、永久に再同期する必要はありません(現在は新しいディスクにのみ再同期する際にエラーが発生します)。

更新 - 修正を見つけましたか? ? ? 驚くべきことに、既存のEmulex SATA-> SASインターポーザボードを対応するLSIボードに交換して、影響を受けたベイの問題を解決しました。

また、すべて関連している可能性があるため、より厚いワイヤゲージを備えた新しいHD SASケーブルがありますが、これまでは非常に良いです。

関連情報