Tag Archives: ipmi

Linuxで BMC Watch Dog を使う

自宅サーバーに使用している Supermicro X7SPA-HF-D525BMC (Nuvoton WPCM450) という独立した小さなコンピューターのようなものを持っており、もしカーネル・パニックなどでOSがハングしたときに、BMCが自動的にマシンを再起動してくれる Watch Dog という機能がついている。BMCはOSの管轄外なので、OSがハングしてもBMCは問題なく動くことができる。

ではBMCはどうやってマシンがハングしていると判断するのだろうか。BMCは Watch Dog Timer というものを内蔵しており、それがカウントダウンしていってゼロになるとマシンを再起動する。なのでOSは Watch Dog Timer を定期的にリセットしてゼロにならないようにすれば再起動は掛からない。つまり「Watch Dog Timer をリセットできない」=「マシンがハングしている」というわけだ。

X7SPA-HF-D525の BMC Watch Dog Timer を有効にするには、BIOSの「Advanced > IPMI Configuration > BMC Watch Dog Timer Action」を Reset System などに変更し、BMC Watch Dog TimeOut でタイマーの時間を指定する。5 min とは5分間に1度でもタイマーをリセットすればよい一方、ハングしてから再起動が掛かるまで最大5分間のラグがあるということを意味する。X7SPA-HF-D525では5分、1分、30秒、10秒から選べるが、あまり短いとOSの負荷が高いためにタイマーをリセットできなかったときにも誤って再起動を掛けてしまう可能性が高くなるため、ラグが許容できる範囲で長いほうが安心だろう。なお、これを今すぐ設定しまうと、手動でタイマーを定期的にリセットする必要に迫られるので、実際には自動でタイマーをリセットできる環境を整えてから有効にしたほうが良いかもしれない。

Continue reading Linuxで BMC Watch Dog を使う