HPE NetworkingのチーフAIオフィサーであるボブ・フライデーと私は、最近、Tech Field Dayのポッドキャストに参加しました。このポッドキャストの出発点となる前提は、「データセンターネットワークにはAIが必要」というテーマでした。私たちはこれに全面的に同意しています。ボブは、この10年の間、AIOps(IT運用のための人工知能)をネットワーキングに持ち込むパイオニアとして活動してきました。彼は、HPE Networkingの「Self-Driving Network™」への移行の道のりを説明することで議論をスタートさせました。このビジョンは、彼が最近発表した6回シリーズのブログで詳細に解説したものです。それから私たちは、特にデータセンターネットワークにとってのAIの意味について深堀りし、この分野で私たちが行ってきた取り組みの概要を説明しました。この2部構成のブログシリーズでは、以下について取り上げています。
解決すべき問題はあるか?
運用担当者は自社のネットワークに触れるのを恐れています。馬鹿らしく聞こえるでしょうが、ほとんどのネットワークエンジニアは、新サービスのプロビジョニングであれ、ファームウェアのアップグレードであれ、変更前も、変更中も、そして変更後も神経質になっています。そのプロセスは精神的にストレスがかかるものであり、運用担当者は、自分がネットワークに触れることでそれを壊してしまうのではないかと心配なのです。
データセンターネットワークにおけるこの流行にある基本的な問題は、複雑性です。理解しなければならないプロトコルの乱立、おそらくは数千におよぶ物理デバイスおよび論理デバイスの設定、管理すべき複数のインフラストラクチャベンダー。対応すべき課題は数多くあります。この複雑性に加え、運用担当者が対応する終わりのないデータの氾濫や、今日の市場に出回る多くの不適切なトラブルシューティングツールなどに、多くのデータセンターネットワークチームが圧倒されています。その結果、彼らはデータの海に溺れながら、インサイトに飢えているのです。
これこそまさに、賢いAIと機械学習アルゴリズムが役に立つ場面です。つまり、人間が取捨選択するにはデータが多すぎる一方、たいていの場合、データはしっかり構造化されています。
テクノロジーではなく、何を必要としているのかが問題
あまりに多くのテクノロジーの議論が間違った出発点、つまりはテクノロジー自体の話から始められています。私たちは、会社の上層部から次のようなことをよく言われます。「私たちは企業として、AIを使用する必要がある。そうでなければ出遅れてしまう」あるいは、ベンダーからこう言われるかもしれません。「御社のデータセンターネットワークではAIを使う必要があります」しかしこれらは、目的のない出発点です。あらゆるテクノロジーの議論は、自分たちの目的は何か、解決する必要がある問題は何か、というところから始めるべきです。
私たちの目標は常に明確でした。それは、「可能な限り最良のユーザーエクスペリエンスを提供すること」です。その「ユーザー」が、データセンターネットワークの運用担当者なのかデータセンターを利用するエンドユーザーなのか、また、ユーザーが自分が使用しているアプリケーションについて知っているか否かにかかわらずです。ここ10年にわたり、ジュニパーはAIを開発し、初めはWi-Fiに、次にキャンパスおよびブランチドメインの領域全体に広げし、驚くほど成功してきました。データセンターについては、私たちには後発者優位性があります。キャンパスでの導入から得られたあらゆるインサイトを手に入れられるからです。
データセンターネットワーク運用の課題
目標がユーザーエクスペリエンスの最適化なら、データセンター担当者が顧客と緊密に協力して解決する必要がある課題があります。私たちはそれらの課題を3つのカテゴリーに分けました。それらは、限られたインサイト、不十分なスピード、低い信頼性です。
- インサイト:よくある状況として、企業のネットワークリードが、CRMアプリや、ERPシステムや、その他の重要なアプリがダウンすることに大きな不満を持つエグゼクティブから抗議の電話を受けることがあります。それは本当にネットワークの問題なのでしょうか? おそらくそうではありません。多くのネットワークチームは、ネットワーク上で実行中のアプリケーションに関するインサイトを十分持っていません。しかしはっきりさせましょう。データセンターで一番大切なことは、エンドユーザーが必要とするアプリケーションをホストし、提供することです。そのアプリケーションが、顧客にとって重要度の低いものであっても、ビジネスにとってミッションクリティカルなものであってもです。
- スピード:発生しているもう1つの問題は、ITインフラストラクチャの管理の点で、スピードや俊敏性が不足していることです。何らかの予期していなかった需要の高まりのために素早く機能を追加しなければならないなど、緊急の新しいビジネス要件が発生し、企業が用意している標準的な変更管理プロセスやメンテナンス期間ではうまくいかなかった場合、そのプロセスの速さが十分でないか、あまりに柔軟性に欠けています。
- 信頼性:さらに、低い信頼性とダウンタイムは、現在進行中の懸念事項です。ほぼすべての企業にとって、たった1つの性急な変更や手動による設定ミスはネットワーク全体をダウンさせ、企業の評判や財務に多大な影響をもたらします。言うまでもなく、あなたのキャリアにとってもマイナスです。迅速で堅牢な自動リカバリやロールバック機能がない場合、サービスの復帰に数時間または数日におよぶ集中的な作業が必要になるかもしれません。あまりに多くのデータセンターネットワークの運用担当者が、自分が受け身の状態となっており、急場の処理や緊急事態に絶えず対処するばかりで、ビジネスをサポートするための事前対応型の戦略的なITイニシアティブに専念できていないことに気づきます。
万能の解決策としてむやみにAIに飛びつくのではなく、問題を徹底的に理解し、AIがそれらの問題の解決に役立つのかと自分に問いかけなければなりません。そしてその答えは、絶対的に「イエス」です。
AIは必要だが、それだけでは不十分である
しかしAIは発生しているNetOpsの問題をすべて解決できるわけではありません。AIは必要だが、それだけでは不十分です。基本的に確率的なAIと、インテントベースネットワーク構築のような決定論的なアプローチの両方を使用するシステムが必要です。
設定の99%が正しければそれでOKでしょうか? いいえ、100%正しくなければなりません。それには、ルールベースの決定論的なソフトウェアが必要です。しかし、データセンターが予測不能な環境で稼働するDay 2では話が違ってきます。もし、無数の症状に基づいて、発生した問題の根本的原因を99%の正確さで伝えることができるシステムがあるなら、それはおそらく、今日そこにあるものより優れたソリューションです。そしてこれがAIのパワーです。大量のデータを絞り込み、相関関係を抽出します。これは人間には簡単にできません。
AIとインテントベースネットワーク構築という2つのテクノロジーを組み合わせれば、強力なネットワーク運用担当者エクスペリエンスと、エンドユーザー向けのアプリケーションエクスペリエンスを提供することができます。
このブログシリーズの2回目と最後のパートでは、AIOpsを使用して厄介なデータセンターネットワークの課題を解決する方法を深掘りする予定です。