ミスを防ぐ組織体制を作る 自動化、標準化、可視化が鍵

クラウド時代の「運用の常識」(第5回)

クラウドや仮想化がシステムの共用を促進。それに伴い、システム運用がより複雑になってきた。こうした状況で人為的なミスを減らすには、運用の自動化や標準化を推し進めることが得策だ。サーバーやジョブの数といった基礎数値に加え、運用プロセスまで可視化することで、運用改善の糸口がつかめる。

運用受け入れを実践するポイント

 運用受け入れのポイントを説明しよう。システム開発が進み、テスト工程の終盤になると、運用部門が受け入れのチェックを行う。チェックすべき項目はたくさんあるが、最も重要なのは上位工程で合意した運用受け入れ基準が守られているかを確認することである。自動化すべき運用業務が人手を必要としないようになっているか、標準ルールに従ってバッチスケジュールが組まれているか、といったことを運用部門の責任でチェックするのだ。もし、違反があれば開発部門に是正を促す。違反が繰り返され一向に受け入れ基準を満たす見込みがない場合は運用の受け入れを拒否する場合もある。

 運用受け入れというステップを踏むことで、個々のシステムは運用部門から見て「システムのあるべき姿」に近づいていく。運用現場では個別対応がなくなるので、属人化を防ぐことが可能になる。結果として人為的なミスの防止につながり、システム運用の品質向上が見込めるようになるのだ。

 運用受け入れの基準は一度決めたら変わらない、というものではない。IT技術の進歩や監査基準の変更など、様々な要因によって基準そのものが陳腐化していく。そのため、基準自体を定期的に見直す活動が必要である。見直しの後には周知が必要となるので、あまり頻繁に基準を変更することは避けるべきだろう。更新頻度は2~3年に1回程度が現実的である。

基礎数値を可視化する

 運用の可視化、あるいは見える化という言葉は今日、様々な業界や企業で使われている。IT業界の運用部門で可視化すべき情報とは何だろうか。

 まずは基礎数値を可視化したい。運用の標準化が進むと一人の担当者が複数のシステムを担当するようになる。システム規模によるが、場合によっては10~20システムを数名のチームで運用することも珍しくない。それに伴い、各担当者のライン上にいるマネジャーは50~60以上のシステムを担当することになるだろう。

 こうなると、担当システムのすべてについて、サーバーが何台あるのか、バッチジョブはどのくらい動いているのか、運用部門へのサービス要求や問い合わせは何件発生しているのか、といった基礎数値を把握することが難しくなる。基礎数値を把握できないと、トラブルが起こった際の影響範囲の見極めが困難になったり、改善施策を検討する際に正しい効果を予測できなくなったりするという事態に陥る。

 現在では、様々な基礎数値を運用ツ ールで取得することが可能だ。取得した数値は関連システムごと、運用担当チームごとといった単位で集計する仕組みを合わせて用意することが望ましい。基礎数値は様々な場面で活用できる。例えば、単純にシステム規模に関する数値を要員数で割るだけでも、システムごとの運用効率を評価する一つの指標となる。

野村総合研究所 システムマネジメント事業本部
運用マネジメント部 主任

北山 誠
大規模システムの運用業務プロセス設計、運用受け入れを主に担当。
ここ数年は運用可視化活動の推進に当たる。ITIL V2 Manager資格を持つ。
(著者プロフィールは執筆時のものです)

お問い合わせ

株式会社 野村総合研究所
マルチクラウドインテグレーション事業本部
E-mail:sysm-info@nri.co.jp

ページのトップへ