»

1月 04

001システム運用処理自動化の落とし穴に落ちないマネジメント

重要な情報システムはデータバックアップをとるのが原則だ。できれば自動化しておきたい。しかし、いざというときに昨日のバックアップデータがない、調べてみたらかなり以前から取得できていなかったということがある。

□ システム運用処理は自動化が望ましい
データのバックアップに限らず、情報システムを稼働させるためにおこなう運用業務は、できる限り自動化しておく必要がある。人が操作して行なうことは手間でもあるし、忘却や欠勤などで行えなかったり、うっかりミスしてしまったりすることがあるためだ。毎日決まった時刻に動作するように設定して、処理が自動で完結するようにしておくことでこのような問題が解消される。

□ 自動化に頼り切ったために発生するリスク
ただし、自動化に頼り切ってしまうことは危険だ。コンピュータの処理というのは何らかの条件により、完全に動作しないこともあるからだ。
某社の事例だが、自動で取得できているはずのデータバックアップ処理が、半年近く動作していなかったことが発覚した。コンピュータルームが入る建物のある地域が、夏場の猛暑による落雷で停電した。システムは無事に再起動できたが、このとき、磁気テープ装置の起動完了がシステムのサーバーの起動タイミングよりも遅かったため、システムが磁気テープ装置を認識できなくなったことで、以降毎晩の自動バックアップ処理がエラーとなっていたのである。別件でシステムバックアップ処理を見直すために調べていた際にこの事実が分かった。

□ 要注意なのは、処理結果が業務ですぐに使われない処理
データバックアップのほかにもシステム間のデータ受け渡し、ウィルス定義ファイルのアップデート、ウィルススキャン、不要データの削除、外部へのデータ発信など、通常は自動で行なうこととしている処理は多い。
自動処理が動かなかった場合でも、自動で行なわれた処理の結果に人間が介在するケースは、動作していない事実に気がつくことが多いのでまだ傷が浅い。自動で立ち上がっているべき基幹システムが立ち上がっていない場合などは、すぐにIT担当部署に連絡が来るはずである。
問題となるのは、その日の処理が動かなくてもすぐには業務に影響は無いが、システムトラブルや一定の時期の経過(ex.ディスク容量オーバーフロー)など、別な条件が発生した際に大ごとになるようなケースである。

□ 最終的には人的チェックが不可欠
対処の考え方の基本は、作業結果のチェックと通報である。大きく以下の2つのやり方が考えられる。
(1)自動処理の結果を人間がチェックする。問題があれば担当者に連絡する。
(2)自動処理の結果を自動でチェックするする仕組みを作り、問題があればメールなどで担当者に連絡が行くような運用とする。ただし、このチェックの仕組みが動作しているかを適当なタイミングで人間がチェックすることは必要となる。
(2)については、運用監視システム導入などに投資することで実現可能である。しかし、大きな投資をせずに、(1)を効率的、組織的に行なうことが中小企業では現実的だと思われる。チェックリストと、チェックマニュアルを用意し、毎日、数日ごとなどの適当なタイミングでチェックを実行する。

□ 人的チェックの人的チェック?
しかしここで大きな問題がある。チェックをすべき人や組織は本当にチェックをやり続けられるかということである。期限があり、どうしても気になる目の前の仕事をしているうちに、チェックのような仕事が疎かになるということはありがちだ。では、その人をチェックする仕事を・・・、というようなことでは果てしない物語になってしまう。
上記は極端な例かもしれないが、やはりチェックすることを日常業務のルールとし、他の業務上のルールと同様に会社の管理の仕組みに組込んでいくことが必要である。

□ 今日からこれを!
今のところ、何もしていないという組織の方は、ひとまず下記をしてみることをお勧めする。
・バックアップ取得のチェックはできているか。できていないようであれば、まず一度、見てみよう。バックアップファイルがあるかどうか、書込み日付はどうか、ファイルサイズは適切かを見てみよう。
(執筆:山田一彦)