CW_Welcomeバナー

IT業界動向

RSS

今もなお進化を続ける「オートノミック・コンピューティング」

ログ・フォーマットの標準仕様「CBE」が現在のキー・テクノロジー
(2007年02月15日)

「オートノミック・コンピューティング」がIT業界を騒がしたのは2003年前後。コンピュータが自己の問題を検知し、修復作業を自動的に行うというコンセプトは、複雑化するIT環境に頭を悩ますITマネジャーには福音に聞こえたことだろう。だが、一方で、この次世代技術が掲げる理想があまりにも高く、一過性のバズワードにすぎないと冷ややかな目で見る向きも多かったのは想像に難くない。しかし今日、オートノミック・コンピューティングはその理想の実現に向けて着実に進化し続けている。本稿では、現時点でのオートノミック・コンピューティングについて、IBMでこの技術の舵取りを担ってきた岩野和生氏のインタビューを交えて解説する。



山口 学

人手では限界がある複雑なIT環境の管理

 絶対に問題が発生しない情報システムは存在しない――この認識に立てば、「問題への対処能力」を得ることが、情報システムにとっていかに重要な課題であるかを理解できるだろう。どれほど高機能でパフォーマンスが高い情報システムであっても、問題を抱えたままの状態で稼働し続けていては、その本来の能力を発揮できないのだ。

 だが、残念なことに、従来の情報システムは、問題への対処能力を実現する仕組みが不十分だった。情報システム自体の機能で行えるのは、問題が発生したという事実を検出し、エラー・メッセージなどの形で通知するところまで。その問題が何を原因としており、どのような解決策をとるべきかは、管理者の判断にゆだねられていたのである。

 情報システムの構成がシンプルで、動作させるソフトウェアの数がさほど多くない時代には、それでも何とか対処できていた。しかし、コンピュータの性能向上に伴い、多数のハードウェア・デバイスが接続され、さまざまなソフトウェアが同時に稼働するようになった。その結果、現在の情報システムは、人間が判断して人手で修復作業を行うのが困難なほど複雑になってしまったのだ。

 何しろ、通知されるエラー・メッセージが多すぎる。当然ながら人間が処理できる情報量には限界があり、むやみにメッセージを提示されても、どれから手を付けるべきかわからなくなってしまうだけだ。もちろん、運用管理ツールの閾値設定を変更して通知されるメッセージ数を調整することは可能だが、機械的に通知メッセージ数を減らすだけでは、かえって問題判別を難しくするだけだろう。

 膨大な量のエラー・メッセージが通知される原因の1つとして、ある1カ所で発生した問題が、他の複数の個所で誤動作を引き起こすというケースが挙げられる。そうした場合、複数のエラー・メッセージ間に因果関係が存在しているということになる。

 例えば、RAIDコントローラ内のキャッシュに発生した障害がデータベース・サーバの誤動作を引き起こしたことで、処理待ちのトランザクションでキューが満杯になり、アプリケーション・サーバが新たな処理の受け付けを停止。その影響を受けて、Webサーバへのネットワーク負荷が異常に高まってしまう――こうした因果関係を把握せずに、Webサーバの台数を増やしたりロード・バランシングの設定を変えたりしても、問題の解決に至ることはないだろう。

問題解決の自動化を目指した過去の試み

 これまでも、問題を検出してエラー・メッセージを通知するところまでは自動化できていた。情報システムの問題対処能力をさらに高めるには、問題の判別から解決策の提示、場合によっては問題の修復までをも自動化できればいいはずである。

 そもそも、コンピュータとは、演算やデータ加工を高速かつ自動的に行うことを目指して開発された装置だ。その稼働状態を正常に維持するための機能を自動化することは、コンピュータの生い立ちの上からも自然な流れであると言えよう。

 自動化のアプローチとしては、複数のメッセージの内容を基に個々の重要度を判定したり因果関係を調べたりして、過去の問題とその解決策が蓄積されたナレッジ・ベースを検索するといったことが考えられる。かつて、このアプローチを具現化するための理論的支柱として期待されていたのが、人工知能(AI:Artificial Intelligence)である。

 1950年代に誕生したAIは、1970年代以降にエキスパート・システムやニューラル・ネットワークとして結実。これらのうち、あらかじめ記述しておいたルールに現象を適用して推論を行うエキスパート・システムは、情報システムに発生する問題の判別と解決策の提示に適していると考えられた。そこで、同システムの製品化を目指したソフトウェア・ベンダーも少なからずあったが、市場の支持を得るまでには至らなかった。なお、もう一方のニューラル・ネットワークは、ルールなしで推論を行うというもので、検証可能な解を得ることが難しいことから、問題を判別することを目的とした用途には適していないとされている。

記事詳細テキストバナー

ページの先頭へ戻る