IT運用チームの能力を補強するためにAI(人工知能)を使用することが増えてきています。これは一般的に、AIOpsと呼ばれています。AIOpsに激しく抵抗を示すITチームもあれば、熱心に支持するITチームもあります。では、どうしてAIOpsを導入すべきなのでしょうか? 企業にとって、またITチームに所属する個人にとって、AIOpsはどのような意味を持つのでしょうか?
まずは、誰も触れたがらない話題を取り上げましょう。他の業界でデジタル化が労働者に大混乱をもたらしていることを考えると、AIOpsの導入によって仕事をコンピューターに奪われるのではないかとITチームが警戒感を抱くのは理解できます。
ITチームの皆さん、ご安心ください。AIOpsを導入しても、ロボットがあなたの仕事を奪うことはありません。実際は、その反対といえるでしょう。
AIOpsは長年の間、形を変えながらも身近に存在していました。AIOpsがバスワードのようになったのは数年前のことで、それ以降、ジュニパーをはじめとする大手技術系ベンダーのポートフォリオの一部となっています。AIOpsの導入理由と方法に関してはデータが存在しており、拡張と迅速な成長の双方に対処しなければならないことがAIOpsの採用を後押ししていることは明白です。人員の削減を望んでいるためではありません。
人間の限界
人間が記憶できる情報の量には限界があり、どれだけの数の変数を追跡できるか、新しい問題にどれだけ早く対処できるかという点でもそれは変わりません。ある程度までは、チームに人員を追加することで個人の限界に対処できます。しかし、あくまで「ある程度までは」にすぎません。
システムの複雑さが一定のレベルを超えるか、あるいは複雑化が急速に進むと、チームを増員しても助けにはなりません。ITにおいてはシステム思考が必須です。そしてシステム思考には、変数のほとんど(すべてとはいわないまでも)を記憶する能力が必要とされます。こうした限界は、チームで担当を分担することである程度回避できます。ただし最終的には、誰かが、あるいは担当するグループが、全体を把握して、今の状況を推し進めた場合にどのような変化が生じるかを理解しなければなりません。
状況があまりにも複雑だと、私たちは抽象化を行います。管理インターフェイス、自動化、オーケストレーション、可視化、分析、レポートが最新のITチームのツールです。ストレージ、コンピューティング、ネットワーキングといったさまざまなレベルで複雑さが抽象化されます。それは大規模なITチームが定期的に、プログラムを利用して大規模に仮想データセンター全体を作成して壊すようなものです。
ただし、何層にもわたるこのような抽象化には、システムに徐々に及ぶ変化の影響が不明瞭になるという問題点があります。ストレージを好きなだけ抽象化することはできますが、SAN(ストレージ エリア ネットワーク)の動作に問題を発生させ、実稼働環境にインパクトを与える可能性が残ります。
テクノロジーの成熟度が増すほど、こうした問題に直面する頻度は低くなります。結果として、実際に問題に直面したときに、その問題がさらに不明瞭なものになっているか、あるいは発生頻度がきわめてまれになっているかのいずれかとなり、問題解決の難度は上がります。
ITチームの補強
複雑さ、成長、拡張に対処するために抽象化を利用できるようになると、そのために用いる管理ツールに応じて知識のギャップが生じます。AIOpsのテクノロジーはそうしたギャップを解消します。AIOpsのAIはすべて、さまざまな形で「正常」と見える状態を学習し、異常と見える状態になるとこれに懸念を抱きます。この点で、AIOpsのAIは、従来のSIEM(セキュリティ情報およびイベント管理)システムによく似ています。
ただしSIEMは、問題が発生したときにアラートを発するだけです。AIOps製品は、ジュニパーネットワークスの仮想ネットワークアシスタント「Marvis」を含め、問題の内容だけでなく問題の解決方法も記録します。Aの動作がXに似ている場合、Yソリューションを適用すると問題が解決する、ということを学習します。そしてAIは、数年間同じ問題が発生しなくても、その問題と解決策を記憶しています。
ITチームもまた、チケットシステムを使用して、これと同じことを数十年間行ってきました。残念ながらチケットシステムは検索に依存します。つまり、適切なメタデータやセマンティックタグといった要素が重要になります。必要なデータが見つかるかどうかは、担当者が情報を正確に記録していることや、前回のインシデントでチケットの情報が詳細に記述されていることに左右されます。そして人間はドキュメントの作成が苦手です。
しかしAIOpsのAIは、ドキュメント作成に優れています。統計、ログ、チケット、ヘルプの問い合わせなど、所定のインシデントに関連するすべてのデータにアクセスできれば、特定のタイプのインシデントに関連付けられたものとして、そのすべてのデータを、AIが存在する限りいつまでも保存できます。異常が発生するたびに、AIはそれまでの学習内容のすべてを確認します。新たに発生したイベントが過去のイベントに似ていれば、解決できる可能性のある方法に関する情報をITチームに迅速に通知します。
実際便利かもしれないと思えるようになってきましたか? では気を引き締めましょう。状況ははるかに良くなっているのですから。
未来につながるAIOps
ITチームのイベントから時間をかけて学習すれば、AIOpsのAIはますます便利なものになっていくでしょう。ただし、そこまで到達するにはかなりの時間がかかると考えられます。AIが大きめのデータセットに基づくトレーニングを必要とすることは常識です。AIOpsによって解決しようとしている問題の1つが、人間はドキュメントの作成が苦手だということであるとしても、チケットシステムのどこにAIを利用するか正確に指定することはできないため、魔法のようなことは起こせません。
ただし、AIの利用を1社の企業だけに制限しないとしたら、どうでしょうか? AIがあらゆる企業から学習するとしたら、どうでしょうか? そのAIの背後で、既知の問題に対するハードコード化された答えという形でも、またAIの向上に貢献しようとして参加した企業の助力を得ながらAIのナレッジベースを拡張していくという方法でも、ベンダーがナレッジを絶えず追加しているとしたらどうでしょうか?
AIの機能は突然、飛躍的な成長を示し、ITチームは、過去に自社で発生した不明瞭なインフラストラクチャエラーの修正方法だけでなく、参加企業のすべてで発生した不明瞭なインフラストラクチャエラーの修正方法も参考にできるようになります。そして、ソリューションに一定の自信を持てるようになると、IT部門の介入なしで自動的に修正を適用するようにAIを設定できます。
こうしたことは、ITチームが以前に行っていた作業と関係するでしょうか? はい。しかしそれは、誰もが嫌い、明らかに苦手としている仕事の一部を自動化するという作業です。AIOpsは、人間の仕事を奪うロボットを意味する言葉ではありません。本来の仕事ができるよう繰り返しの作業から人間を解放し、人間だけでは対応できないようなより大規模で複雑な、より急速に成長するネットワークに企業が対処できるようになる製品を指す言葉です。
このシリーズのその他のブログ
アシスタント、チャットボット、AIドリブンフレームワーク(英語)
AIドリブンによる問題解決(英語)
AIデータとAIプリミティブ(英語)
その他のAIリソース
AIソートリーダーシップ(英語)