« Google Streetview ネットでの評判など | メイン | MySQLチューニングと仮想メモリ »

linuxのsmartmontoolsに関して

現在、2.5inchのハードディスクx2でRAID1を組んで稼動しているサーバがあるのですが、このサーバにはsmartmontools(smartd)をインストールして、ハードディスクの情報を定期的にチェックするようにしています。モニターの結果は、/var/log/messagesに書き込まれるようになっています。この結果を見てちょっと困っているのが、load_cycle_countの回数が非常に多く、健康値?が毎日ガンガン下がっているのです。このままでは、いずれエラーを吐き続けることになってしまいます。なにゆえ、この回数が多いのだろうか?対処をしなくてはなりません。

smartのload/unload cycle countは、ヘッドが円盤上からリトラクト(退避)位置に戻ったことを表わしています。この動作は、省電力機能などで行われ、普通に使っている際には発生しません。ちなみに、使っているハードディスクはHitachi HTS541260H9SA00(5K120 SATA1.5G 60GB)です。まず、当方で思ったのは、リトラクト回数が多いのは、ハードディスクに実装されているAPM(Advanced Power Management)の設定によるものかと思いまして、Feature Tools という設定ツールを使用して、省電力機能をオフにしようと考えました。しかし、家中のあらゆるPCやSATAカード、果てはSATA-IDE変換カードにまで、どんなSATAポートにつないでFeature Toolsを起動しても「APMが実装されていない」という旨のメッセージが表示されてしまいます(他の情報は見える。APMだけが「無い」と表示される)。今まで、HGSTのハードディスクを随分たくさん買ったのですが、Travelstar 5K120のSATA版だけ、APMを制御できないのです(※これ、当方の環境だけなのでしょうか?5K120のSATAでもフィーチャーツールが使えた方、もし情報をお持ちなら、宜しければメールなどで教えてください…)。

そして、更に考えてみました。このサーバのファイルシステムは、全てext3でフォーマットされています。ということは、ジャーナリングが働いているので、5秒に1回くらいはディスクへのアクセスが発生します。省電力機能などでヘッドがリトラクトする場合、ディスクへのアクセスが何分間か無かった時に行われます。このサーバでは、MySQLやらhttpdやらが常時動いていて、更にジャーナリングも行っているわけですから、基本的にディスクへの書き込みアクセスが何分間も無いような状況は考えられません。にも関わらず、なぜヘッドのロードやアンロードが起きているのか?これは、疑問のまま残ってしまいました。

そして、最後に一つ思い当たったのが、smartmontools自体の動作についてです。こちら、ソースも何も読んでいませんし(※そもそも、ATAのコマンドも知らない当方が読んでも、良くわからないだろうから読む気にもなれず)、思いつきなんですが、「もしかしたら、smartd が情報を読みにいく際に、ヘッドを退避させるコマンドを送っているのではないだろうか?」と、ふと考えたのです。現在、smartd はデフォルトの設定どおり、30分に1度、smartを読みにいきます。そこで、それを24時間に一度にしてみました。これで、ログにどういった結果が現れるのでしょうか? こちらは、現在実験中です。何ヶ月かしたらわかると思います。

このとき、ちょっと躓いたのが、チェック間隔の設定です。/etc/rc.d/init.d/smartd に、smartをチェックするインターバル(間隔)を設定するのですが、どうもこれが反映されない。smartd_opts="--interval=86400" という記述をすれば、/etc/{default,sysconfig}/smartmontools might override だそうですから、オーバーライドされて有効になると思うのですが(※シェルスクリプトもそのようになっていますし)、might が曲者なのか?設定が有効になりませんでした。仕方が無いので、/etc/sysconfig/smartmontools のほうに -i 86400 とオプションを記述して動作させています。

※8/11日追記。いろいろ情報を漁ってみると、どうも2.5インチのハードディスクは、ノートなど動かす環境での使用が前提の為か、振動への対策などの理由で、適当な間隔?で勝手にリトラクトを行うみたいです。ブレードサーバ向けなどに、連続稼動を想定した2.5インチハードディスクという製品があるので、サーバ用途にはそちらを使った方がいいんですね。ということで、全く役に立たない記事になってしまいました。

About

2008年08月10日 12:58に投稿されたエントリーのページです。

ひとつ前の投稿は「Google Streetview ネットでの評判など」です。

次の投稿は「MySQLチューニングと仮想メモリ」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。