2024年1月、ジュニパーはAIネイティブネットワーキングプラットフォームを発表しました。このプラットフォームにより、適切なインフラストラクチャで適切なデータを活用して適切な応答を実現し、ユーザーおよび運用担当者に最適なエクスペリエンスを提供できるようになります。AIによるネットワーク運用の簡素化(AI for Networking)や、AIで最適化されたイーサネットファブリックによるAIワークロードとGPUパフォーマンスの改善(Networking for AI)を通じて、ジュニパーはお客様にエクスペリエンスファーストネットワーキングを提供するというコミットメントを実現するための取り組みを進めています。
ジュニパーには、QFXスイッチ、PTXルーター、SRXファイアウォールで構成された高パフォーマンスの安全なデータセンターネットワークインフラストラクチャを長年にわたって提供してきた実績があります。そこに新たに加わったAIネイティブネットワーキングアーキテクチャにより、お客様はマルチベンダーのAIデータセンターをエンドツーエンドで運用できるようになります。ジュニパーが新たに提供するソリューションOps4AIには、お客様にさらに多くの価値をもたらすさまざまな機能強化が含まれています。Ops4AIでは、以下に挙げるジュニパーネットワークスのコンポーネントが独自に組み合わされています。
- 仮想ネットワークアシスタント「Marvis」を基盤とするデータセンターでのAIOps
- Juniper Apstraマルチベンダーデータセンターファブリック管理によるインテントベースの自動化
- AIで最適化されたイーサネット機能(RoCEv2 for IPv4/v6、輻輳管理、効率的なロードバランシング、テレメトリなど)
これらのコンポーネントがまとめて含まれているOps4AIにより、運用コストの削減とプロセスの効率化を同時に実現しながら、高性能AIデータセンターの導入期間を迅速に短縮できます。さらに、次のような拡張機能も新たに加わりました。お客様が自由に利用できる新しいマルチベンダーのJuniper Ops4AI Labでは、オープンソースかつプライベートのAIモデルおよびワークロードをテストできます。ジュニパー検証済み設計では、ジュニパー、NVIDIA、Broadcom、Intel、Weka、およびその他のパートナーを使用してAI向けのネットワーキング構成を確保できます。また、JunosソフトウェアとApstraの強化により、AIで最適化されたデータセンターネットワーキングを実現できます。
それでは、Junos®ソフトウェアとJuniper Apstraの新たに強化された機能について見ていきましょう。以下のような強化が行われています。
AI向けのファブリック自動調整
GPUのRDMA(リモートダイナミックメモリアクセス)は、AIネットワークで膨大な量のネットワークトラフィックを発生させます。ロードバランシングなどの輻輳回避手法を用いても輻輳を避けられない状況が存在します(複数のGPUからラストホップのスイッチにある単一GPUに向かうトラフィックなど)。このような状況で用いられるのが、DCQCN(データセンターの量子化輻輳通知)などの輻輳制御手法です。DCQCNは、ECN(明示的輻輳通知)やPFC(優先順位に基づくフロー制御)などの機能を使用してパラメーター設定を計算および構成することで、すべてのスイッチにわたってポートごと、キューごとに最適なパフォーマンスを提供します。すべてのスイッチにわたって数千ものキューを手動で設定するのは、困難であり手間がかかります。
この問題を解決するため、Apstraは各ポートの各キューから定期的にテレメトリを収集します。収集したテレメトリ情報に基づいて、各ポートの各キューについて、ECNとPFCの最適なパラメーター設定が計算されます。クローズドループ自動化により、ネットワーク内のすべてのスイッチに対して最適な設定が適用されます。
このソリューションが最適な輻輳制御設定を適用することで、運用が大幅に簡素化され、遅延とJCT(ジョブ完了時間)が低減されます。ジュニパーのお客様はAIインフラストラクチャに積極的に投資しているため、これらの機能はJuniper Apstraを導入することで追加コストなしで利用できるようにしています。詳細については、最新のCloud Field Dayのデモをご覧ください。また、このアプリケーションはGitHubにもアップロードしています。
図1:AI向けのファブリック自動調整
グローバルロードバランシング
AIネットワークトラフィックには独自の特徴があります。それは、GPUのRDMAがトラフィックの大部分を占めている点です。このRDMAは、高帯域幅の少数かつ大規模なフロー(エレファントフロー)をもたらします。そのため、5タプルハッシュベースの静的ロードバランシングでは対応できません。複数のエレファントフローが同じリンクにマッピングされて輻輳が発生します。その結果、JCT(ジョブ完了時間)が長期化します。これは大規模にGPUに投資している環境にとっては大打撃となります。
この問題を解決するのが、DLB(ダイナミックロードバランシング)です。DLBでは、ローカルスイッチのアップリンクの状態が考慮されます。
DLBであれば、従来の静的ロードバランシングと比べて、ファブリックの帯域幅使用率を大幅に改善できます。ただし、DLBではローカルリンクの品質しか追跡できません。つまり、ingressノードからegressノードへのパス全体の品質を把握することはできません。たとえば、CLOSトポロジーにおいて、サーバー1とサーバー2がそれぞれフロー1とフロー2と呼ばれるデータを送信しようとしているとします。DLBの場合、リーフ1はローカルリンクの使用率しか把握できないため、ローカルスイッチの品質テーブルのみに基づいて判断を行うことになります(テーブルではローカルリンクの品質は最高水準かもしれません)。しかし、GLB(グローバルロードバランシング)の場合、スパイン/リーフレベルの輻輳が発生しているパス全体の品質を把握できます。
図2:フローのロードバランシング
これは、全体像を把握したうえで経路を選択するGoogle Mapsとよく似ています。
この機能により最適なネットワークパスが選択され、遅延の低減、ネットワーク使用率の改善、ジョブ完了時間の短縮が実現されます。その結果、AIワークロードのパフォーマンスが改善し、高額なGPUをより有効に活用できるようになります。
ネットワークからSmartNICまでのエンドツーエンドの可視化
今では、管理者はネットワークスイッチのみを監視することで輻輳の発生場所を特定できます。しかし、その輻輳がどのエンドポイント(AIデータセンターの場合はGPU)に影響を及ぼすかは、一切把握できません。これでは、パフォーマンスの問題を特定して解決することは困難です。複数のトレーニングジョブを実行している環境において、スイッチのテレメトリを監視するだけでは、どのトレーニングジョブが輻輳の影響で遅延しているかを特定できません。特定のためには、すべてのサーバーのNIC RoCE v2の統計値を手動で確認しなければなりませんし、これは現実的ではありません。
この問題を解決するには、AIサーバーのSmartNICの豊富なRoCE v2ストリーミングテレメトリをJuniper Apstraに統合し、既存のネットワークスイッチテレメトリと関連付けることで、パフォーマンスの問題が発生した際の可観測性とデバッグのワークフローを大幅に強化します。この関連付けにより、ネットワークの全体像を把握して、AIサーバーとネットワークの動作の関係性に対する理解を深めることができます。リアルタイムデータを通じて、ネットワークパフォーマンス、トラフィックパターン、輻輳発生の可能性がある場所、影響を受けるエンドポイントを把握すると、パフォーマンスのボトルネックや異常を特定できます。
この機能によって、ネットワークの可観測性が強化され、パフォーマンスの問題のデバッグ作業が簡素化され、クローズドループのアクションを通じて全体的なネットワークパフォーマンスを改善できます。たとえば、SmartNICの誤順序パケットを監視することで、スイッチのスマートなロードバランシング機能のパラメーターを調整できます。その結果、エンドツーエンドの可視性により、AIインフラストラクチャのパフォーマンスを最大化できます。
図3:ネットワークからSmartNICまでのエンドツーエンドの可視化
詳細については、7月23日開催のオンラインイベント「Seize the AI Moment」のレコーディングをご覧ください。このイベントでは、ジュニパーのお客様や業界の著名人が一堂に会し、急速に進展しているAIデータセンターインフラストラクチャについて解説しています。
製品の方向性に関する記述:ジュニパーネットワークスは、「製品の方向性に関する記述」または「Plan of Record(POR)」と呼ばれる、将来の製品、機能、強化の開発および計画に関連する情報を開示する場合があります。 提供されるこれらの詳細は、ジュニパーの現在の開発成果と計画に基づいています。これらの開発成果や計画は、ジュニパー独自の裁量で、予告なく変更されることがあります。 正式契約に規定されていない限り、ジュニパーネットワークスは、本Webサイト、プレゼンテーション、ミーティングまたは刊行物に記載された製品、機能、強化の導入について、一切保証せず、責任も負いません。また、PORの信頼性に起因するいかなる損失に対しても、ジュニパーは責任を負いません。 サードパーティによる購入の決定は、このPORに基づいて行うべきではなく、ジュニパーネットワークスが本Webサイト、プレゼンテーション、ミーティングまたは出版物に記載されている特徴や機能を提供することを購入の条件とするものではありません。