私は2つのWD Gold 4TBを購入し、単一のRAID1パーティションmd0にkdeと一緒にdebian sidをインストールしました。
# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5]
[raid4] [raid10]
md0 : active raid1 sda1[0] sdb1[1]
3906885632 blocks super 1.2 [2/2] [UU]
bitmap: 5/30 pages [20KB], 65536KB chunk
unused devices: <none>
# mount | grep md0
/dev/md0 on / type ext4 (rw,noatime,nodiratime,errors=remount-ro,data=ordered)
これで問題は、hddtemp
アイドル状態でも報告された温度が非常に高いことです(ディスクをタッチして確認)。
# hddtemp /dev/sda /dev/sdb
/dev/sda: WDC WD4002FYYZ-01B7CB1: 59 C
/dev/sdb: WDC WD4002FYYZ-01B7CB1: 57 C
室温より30度以上高いです!追加の冷却のためにケースのサイドパネルを開いてみましたが、役に立ちませんでした。
ほぼ毎秒ディスクアクセス音が聞こえ、読み書きの量が少なくなります。これによりスピンアップが防止されるようです。また、iotop
1/2秒ごとに数kB / sの書き込みを報告します。原則として、これらの書き込みはバッファリングする必要がありますが、すぐに書き込まれるようです。
だからバッファサイズを増やしてみました。
# echo cfq > /sys/block/sda/queue/scheduler
# echo 10000 > /sys/block/sda/queue/iosched/fifo_expire_async
# echo 250 > /sys/block/sda/queue/iosched/fifo_expire_sync
# echo 80 > /sys/block/sda/queue/iosched/slice_async
# echo 1 > /sys/block/sda/queue/iosched/low_latency
# echo 6 > /sys/block/sda/queue/iosched/quantum
# echo 5 > /sys/block/sda/queue/iosched/slice_async_rq
# echo 3 > /sys/block/sda/queue/iosched/slice_idle
# echo 100 > /sys/block/sda/queue/iosched/slice_sync
hdparm
(sdbと同じ)電源管理フラグも変更します(参照:https://ubuntuforums.org/showthread.php?t=795327):
# hdparm -B /dev/sda
/dev/sda:
APM_level = 255
# hdparm -B 64 /dev/sda
/dev/sda:
setting Advanced Power Management level to 0x40 (64)
APM_level = 64
Load_Cycle_Count
また、カウンターが毎分約5ずつ増加したことを確認しました。
# date; sudo smartctl -a /dev/sda | grep 'Load_Cycle_Count'
Tue Apr 24 16:14:00 CEST 2018
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 338
# date; sudo smartctl -a /dev/sda | grep 'Load_Cycle_Count'
Tue Apr 24 16:15:03 CEST 2018
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 343
この速度では、ディスクは1年以内に失敗します(600,000サイクルで指定されています)。
これは次の情報ですhdparm
。
# hdparm -i /dev/sda
/dev/sda:
Model=WDC WD4002FYYZ-01B7CB1, FwRev=01.01M03, SerialNo=K3H05BLL
Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs }
RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=56
BuffType=DualPortCache, BuffSize=unknown, MaxMultSect=16, MultSect=off
CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=7814037168
IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
PIO modes: pio0 pio1 pio2 pio3 pio4
DMA modes: mdma0 mdma1 mdma2
UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6
AdvancedPM=yes: disabled (255) WriteCache=enabled
Drive conforms to: unknown: ATA/ATAPI-2,3,4,5,6,7
* signifies the current active mode
これにより、BuffSize=unknown
バッファに問題があると疑われます。ハードドライブの温度がなぜそんなに高いのか、どうすればわかりますか?
答え1
私にとって、1秒あたりのディスクアクセスの原因はhddtemp自体です。デーモンを停止するとすぐにディスクアクセスが停止します。