再起動後のLinux md構成の変更

再起動後のLinux md構成の変更

再起動中にUbuntu RAID構成が変更されたため、その理由を理解できませんでした。

  • 問題 1: 起動時に /dev/md/host:name デバイスが作成されません。説明的な名前がどのように、いつ、なぜ作成されたのか理解できません。予測可能な方が良いでしょう。

この配列は常にデバイス名を取得します。

jak # mdadm --detail /dev/md127
[...]
名前:jak:neat(ホストjakのローカル)
UUID:593fc406:87eefd53:0a076a84:f1405112

この配列ではデバイス名がほとんど得られません。

jak # mdadm --detail /dev/md130
[...]
名前: jak:sour (ホスト jak local)
UUID:809a185b:a2613844:3975b412:759ec297

私が理解したところによると、人間が読むことができる名前は/ etc / fstabで使用するためのものです。

jak#tail -2 /etc/fstab
/dev/md130 /jak/data/sour ext4 デフォルト 0 0
/dev/md/jak:neat /jak/data/neat ext4 デフォルト 0 0

jak:sour に対して明示的に /dev/md130 をマウントしたことがわかりますが、これはデバイス名が時々変更されるため問題になります。私もなぜ機器番号が変わるのか理解できませんね。 fstabでどの信頼できる/ devエントリを使用する必要がありますか?

  • 問題2:再起動するたびにスペアドライブがアレイから外れます。

jak:neatとjak:sourの両方にバックアップドライブがあります(以下のmdadm出力)。再起動すると、スペアドライブはアレイから消えます。ディスクデバイスは/ dev / sd *に表示され、アレイに簡単に再接続できますが(mdadm --add /dev/md127 /dev/sdn1)、明らかにそれらがアレイから外れることは望ましくありません。

  • ひざまずき:GoogleとStack Exchangeを検索特定Linuxソフトウェアの襲撃問題は、信号対雑音比の痛みを伴う練習です。これが良い質問であることを願っています。

  • 構成の詳細:

#uname -a
Linux jak 4.15.0-65-generic #74-Ubuntu SMP 火曜日 9月 17日 17:06:04 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux
jak # mdadm --detail /dev/md127
/dev/md127:
           バージョン: 1.2
     作成日: 2018年6月1日金曜日 07:33:21
        レイドレベル:raid10
        アレイサイズ:23441682432(22355.73GiB 24004.28GB)
     使用された開発サイズ: 7813894144(7451.91GiB 8001.43GB)
      レイド機器:6
     総ユニット数:7
       耐久性:スーパーブロックは耐久性に優れています。

     意図ビットマップ:内部

       アップロード日:2019年10月6日日曜日07:02:47
             状態:清潔で点検中
    アクティブデバイス:6
   作業機器:7
    失敗したデバイス:0
     予備設備: 1

            レイアウト:近辺=2
        ブロックサイズ:512K

一貫性戦略:ビットマップ

      状態確認:18%完了

              名前:jak:neat(ホストjakのローカル)
              UUID:593fc406:87eefd53:0a076a84:f1405112
            イベント: 201984

    番号 プライマリセカンダリ RaidDevice ステータス
       0 8 17 0 アクティブ同期セット-A /dev/sdb1
       1 65 1 1 アクティブシンクセット-B /dev/sdq1
       2 8 81 2 アクティブ同期セット-A /dev/sdf1
       3 65 33 3 アクティブシンクセット-B /dev/sds1
       4 8 49 4 アクティブ同期セット-A /dev/sdd1
       6 65 17 5 アクティブ同期セット -B /dev/sdr1

       7 8 177 - スペア /dev/sdl1
ジャック#
jak # mdadm --detail /dev/md130
/dev/md130:
           バージョン: 1.2
     作成日: 2018年5月26日 土曜日 10:51:23
        レイドレベル:raid6
        アレイサイズ:39065217024(37255.49GiB 40002.78GB)
     使用された開発サイズ: 9766304256(9313.87GiB 10000.70GB)
      レイド機器:6
     総ユニット数:7
       耐久性:スーパーブロックは耐久性に優れています。

     意図ビットマップ:内部

       アップロード日:2019年10月6日日曜日07:03:43
             状態:清潔で点検中
    アクティブデバイス:6
   作業機器:7
    失敗したデバイス:0
     予備設備: 1

            レイアウト:左対称
        ブロックサイズ:512K

一貫性戦略:ビットマップ

      ステータス確認:41%完了

              名前: jak:sour (ホスト jak local)
              UUID:809a185b:a2613844:3975b412:759ec297
            活動: 139649

    番号 プライマリセカンダリ RaidDevice ステータス
       0 8 1 0 アクティブ同期 /dev/sda1
       1 8 33 1 アクティブ同期 /dev/sdc1
       2 8 129 2 アクティブ同期 /dev/sdi1
       3 8 145 3 アクティブ同期 /dev/sdj1
       4 8 161 4 アクティブ同期 /dev/sdk1
       6 8 241 5 アクティブ同期 /dev/sdp1

       7 8 209 - スペア /dev/sdn1
ジャック#

私は/dev/sdnが疑わしいとは思っていませんが、とにかく詳細は次のとおりです。

jak#smartctl -a /dev/sdn
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.0-65-generic] (ローカルビルド)
著作権 (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

===情報セクションの開始===
機器モデル:WDC WD100EFAX-68LHPN0
所蔵番号:JEKG3TLZ
LU WWNデバイスID:5 000cca 267f04f25
ファームウェアバージョン:83.H0A83
ユーザー容量: 10,000,831,348,736バイト[10.0TB]
セクタサイズ:論理512バイト、物理4096バイト
速度:5400rpm
フルサイズ:3.5インチ
デバイスは smartctl データベースにありません。 [詳細は-P showallを使用してください。]
ATA バージョンは ACS-2、ATA8-ACS T13/1699-D Revision 4 です。
SATAバージョン:SATA 3.2、6.0Gb/s(現在:6.0Gb/s)
現地時間:2019年10月6日日曜日07:04:58 PDT
SMARTサポート:有効 - デバイスはSMARTをサポートします。
SMARTサポートは次のとおりです。有効

===スマートデータ読み取り開始===
SMART総合健康自己評価テスト結果:合格

一般的なSMART値:
オフラインデータ収集ステータス:(0x82)オフラインデータ収集アクティビティ
                    エラーなしで完了しました。
                    自動オフラインデータ収集:有効になっています。
セルフテスト実行状態:(0)最後のセルフテストルーチンが完了しました。
                    エラーや自己チェックはありません。
                    すでに実行中です。
オフラインで完了するのに要した合計時間
データ収集:(93)秒。
オフラインデータ収集
機能:(0x5b)SMART即時オフライン実行。
                    自動オフラインデータ収集ON/OFFをサポートします。
                    オンライン新製品のリリース以降、オフラインコレクションは中止されます。
                    注文する。
                    オフラインサーフェススキャンをサポートします。
                    自己テストをサポートします。
                    転送セルフテストはサポートされていません。
                    オプションの自己テストをサポートします。
SMART機能:(0x0003)入力前のSMARTデータ保存
                    省電力モード。
                    SMART自動保存タイマーをサポートします。
エラーロギング機能:(0x01)エラーロギングをサポートします。
                    一般的なロギングをサポートします。
簡単なセルフテスト手順
推奨ポーリング時間:(2)分。
拡張自己テストプログラム
推奨ポーリング時間:(1116)分。
SCT機能:(0x003d)SCTステータスをサポートします。
                    SCTエラー回復制御をサポートします。
                    SCT機能制御をサポートします。
                    SCTデータシートをサポートしています。

SMART属性データ構造リビジョン番号:16
しきい値を持つベンダー固有のSMART属性:
ID#ATTRIBUTE_NAMEフラグ値最悪のしきい値タイプが更新されました。 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100100016 常に事前失敗 - 0
  2 Throughput_Performance 0x0004131131054 Old_age オフライン - 104
  3 Spin_Up_Time 0x0007100100024 常に事前失敗 - 0
  4 Start_Stop_Count 0x0012100100000 Old_age 常に - 3
  5 Realated_Sector_Ct 0x0033100100005 常に - 失敗前 0
  7 Seek_Error_Rate 0x000a 100100067 Old_age 常に - 0
  8 Seek_Time_Performance 0x0004128128020 Old_age オフライン - 18
  9 Power_On_Hours 0x0012100100000 Old_age 常に - 1148
 10 Spin_Retry_Count 0x0012100100060 Old_age 常に - 0
 12 Power_Cycle_Count 0x0032100100000 Old_age 常に - 3
 22 Unknown_Attribute 0x0023100100025 常に - 失敗前 100
192 Power-Off_Retract_Count 0x0032100100000 Old_age 常に - 51
193 Load_Cycle_Count 0x0012100100000 Old_age 常に - 51
194Temperature_Celsius 0x0002 144 144 000 Old_age常に - 45(最小/最大20/54)
196 Realated_Event_Count 0x0032 100100000 Old_age 常に - 0
197 Current_Pending_Sector 0x0022100100000 Old_age 常に - 0
198 Offline_Un 変更可能 0x0008 100100000 Old_age オフライン - 0
199 UDMA_CRC_Error_Count 0x000a 200200000 Old_age 常に - 0

SMARTエラーログバージョン:1
記録されたエラーなし

SMARTセルフテストログ構造改訂番号1
自己テストは記録されません。 [セルフテストを実行するには、次のようにします。smartctl -t]

SMARTオプションの自己テストログデータ構造リビジョン番号1
 範囲MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 未テスト
    2 0 0 未テスト
    3 0 0 未テスト
    4 0 0 テストされていない
    5 0 0 未テスト
オプションのセルフテストフラグ(0x0):
  選択した範囲をスキャンした後、スキャンしたディスクの残りの部分を読み取らないでください。
電源を入れたときにオプションのセルフテストが待機している場合は、0分後に再開してください。

ジャック#
#mdadm.conf
#
#!気づく!このファイルを更新したら、update-initramfs -uを実行します。
#!気づく!これにより、initramfsに最新のコピーがあるようになります。
#
#このファイルの詳細については、mdadm.conf(5)を参照してください。
#

#デフォルトでは(組み込み)すべてのパーティション(/ proc / partitions)とすべてのパーティションをスキャンします。
#MDスーパーブロックコンテナ。または、検索するデバイスを指定するには、次を使用します。
#必要に応じてワイルドカードを使用してください。
#DEVICEコンテナパーティションの分割

#自動的に新しいアレイをローカルシステムに属するものとしてマークします。
ホームホスティング

#監視デーモンに電子メール警告を送信する場所を指示します。
MAILADDRルート

#既存のMDアレイの定義
配列/dev/md/0 メタデータ=1.2 UUID=7636d5d0:8c9d0823:7252c563:30724789 名前=jak:0
ARRAY /dev/md130 メタデータ=1.2 UUID=809a185b:a2613844:3975b412:759ec297 名前=jak:sour

#この設定は2018年4月28日土曜日16:34:38-0700でmkconfによって自動的に作成されました。

今残りの質問

  • /etc/md/jak:neatそして/etc/md/jak:sour現れないでください。どのプロセスがこれを生成しますか?

  • 実行するとblkid /dev/md127出力は返されません。予想される出力を返します/dev/md0。だからfstab今、あなたはファイルシステムデバイスをととしてリストしますが、/dev/md127これは/dev/md130一時的な感じです。

フィードバックをお寄せいただきありがとうございます!

答え1

ありがとうLinuxセキュリティモンスター手がかりを見つけてください。

(意図的に)更新したことはありません。mdadm.conf(マンページ);そこにいるのか知りませんでした。欠落しているコンテンツを追加すると、ARRAY本当に役に立ちます。

そして私は(意図的に)走らなかった。update-initramfs(マンページ)

この2つの手順を実行すると、私のワークステーションは2回連続して正常に起動しました。本当にすごいです。


私の質問の最後にある残りの質問を参照してください。

関連情報