昨日に続いて
情報処理試験ITサービスマネージャの論文について
少し考察します。
問2のテーマは、サービス可用性管理です。
可用性の目標を達成するには、
何かを監視・測定し、
測定結果から問題があれば対策を打つ、
のが大事だよって話です。
問1と比べると、具体的な例が少ないので、
難易度としては、こっちが上と思います。
さて、
「故障の発生などサービス可用性を損なう事象を監視」
とありますが、具体例がありません。
しょうがない(?)ので自分で考えてみます。
私だったらどうするかというと、
故障いったらすぐ頭にうかぶのがハードディスクです。
最近はSSDが多くなってきたのでわかりませんが、
以前のハードディスクは、結構頻繁に壊れていました。
「あ、また壊れたか」という感じです。
なので、ディスク故障の監視の話がいいかなと思いました。
サーバが有するハードの故障検知を実施しつつ、
IOPSとかR/Wのレスポンスあたりを監視しますか。
そして、故障したらディスクを交換するのですが、
ハード保守ベンダーに依頼して
交換してもらうケースにします。
検知から、対応完了までの時間も計測して
その改善に取り組む話ですね。
保守ベンダーへの依頼テンプレ整備、
部品交換エンジニアへの依頼テンプレ整備、
データセンター入館方法をお伝えする方法整備、
パスワード通達方法整備、
作業机といすの準備方法整備、
くらいの改善案が頭に浮かびます。
ここからは、実際の話なんですが、
データセンターって大々的に看板とか設定しないので、
初めて行くとわかりづらいんですよね。
実体験ですが、部品交換エンジニアから
迷子の電話がかかってきたことも実際あります。
データセンター入館までの説明のテンプレ改善して、
部品交換エンジニアが一発で入館できると
システム運用側も面倒がなくていいですよね。
実際、私も何度かテンプレをブラッシュアップしてました。
うまくいくと、達成感あります。
今回は、迷子にならなかった!って。