データベース障害(その1)

以前、DB障害が発生したと記事で書きましたが

 

========関連記事========

またもや、DB障害が発生していしまいました。
以前、書いたブログでHDDの故障っぽいかもって事を書きましたが、前回はRAIDのどのディスクがおかしいのかまでは特定できず、応急処置でそのまま動かしましたが、今回はデータが完全に飛びました。
バックアップは取っていたので、致命的な事態は避けられましたが、
このブログの最近10日分の記事が消えて無くなりました。(結構ショックです)
故障していたのは、RAID-0で動かしている
/dev/hda
/dev/hdb
/dev/hdc
/dev/hdd
のうちで/devhdcでした。
/dev/hdc単体では、SMARTの状態がOKで簡易セルフチェックもOKなんですが
RAIDを構築すると、このSSDだけフリーズしてしまうのです。
試しに、/dev/hdcを取り外してRAIDを構築してみると何事も無かったかのように動いてくれたので
この状態で行く事にしました。
RAID-0で4台から3台に減ったので
450MB/sまで読込速度は落ちてしまいましたが、仕方ないですね。
まだ保障期間内なので交換したもらおうと思ってますが、
/dev/hdc自体が完全に壊れているかどうかのチェックをしてからでないとサポートセンターとの交渉が面倒になりそうな故障の仕方なので、時間のある時にWIN機に繋いでフォーマットが通るかどうかのチェックやファイルの書き込みチェックをしてからサポセンとやりとりすることにします。
SSDって静かで速くて良いんだけど、壊れる時って微妙な壊れ方が多いみたいなんで扱いがHDDより難しいです。
とりあえず、DB障害の原因がわかってスッキリとはしましたが、SSDの書き込み回数に起因する故障なら、あとの3台のSSDの寿命も短いのかもしれません。(DBの使い方としては、頻繁にデータの書き込みを繰り返す様な使い方をしていないので、書き込み回数エラーでは無いと思うんですが・・・)

その2へつづく

雑談スレ

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)