엔터프라이즈 IT 조직은 최신 인공지능(AI)의 발전을 활용하기 위해 ‘무언가를 해야 한다’는 압박을 받고 있습니다. 생성형 AI는 R&D의 부수적인 영역에서 산업 전반의 필수 요소로 빠르게 전환되었습니다. 하지만 대부분의 엔터프라이즈 네트워킹 팀은 여전히 어디서부터 시작해야 할지 모르는 상황입니다.
AI 워크로드를 위한 새로운 데이터센터를 구축할 때 살펴봐야 할 많은 새로운 기술과 다양한 프로토콜이 있지만, 사실 대부분의 조직에서는 기존 네트워크 인프라와 전문 지식이 여전히 적용됩니다. 우리가 긴밀히 협력하는 많은 회사들은 이러한 현실을 발견하고 놀랍니다.
주니퍼에서는 고객이 새로운 AI 데이터센터 아키텍처를 구축하고 운영하는 데 따른 고유한 도전 과제를 탐색하도록 돕고 있습니다. 실제로, 주니퍼는 지난 7월에 AI 데이터센터(“Networking for AI”) 솔루션을 출시하고 Juniper™ Apstra 데이터센터 패브릭 관리 및 자동화 소프트웨어의 핵심 기능을 조명한 바 있습니다. 스케줄된 패브릭과 같은 복잡하거나 독점적인 AI 데이터센터 구축은 필요하지 않습니다. Apstra는 Day 0 설계에서부터 Day 1 배포, Day 2 이후의 지속적인 운영에 이르기까지 AI 데이터센터 네트워크 수명 주기 전반에 걸친 모든 단계를 안내합니다. 이 새로운 솔루션 개요에서 모든 세부 정보를 확인하십시오.
주니퍼 Apstra 템플릿으로 AI 데이터센터 구축 및 운영 간소화
네트워크 팀은 AI의 최신 발전을 활용하기 위해 새로운 AI 데이터센터(AI DC) 인프라를 구축하는 업무를 맡고 있습니다. “엘리펀트 플로우(elephant flows)”라고도 불리는 AI 트래픽 패턴의 독특한 특성은 신속히 반응하고 미래 지향적인 네트워킹 및 관리 접근 방식이 필요한 일련의 과제와 요구 사항을 수반합니다. 이는 일반적인 기업 데이터센터 조직에 완전히 새로운 세계이며, 값비싼 그래픽 처리 장치(GPU)의 활용도를 극대화하고 작업 완료 시간(JCT)을 최소화하여 AI DC의 경제성을 최적화하는 것이 무엇보다 중요합니다.
다행히도, 거의 모든 네트워크 팀이 익숙한 이더넷 인프라는 이러한 과제를 해결할 수 있습니다. 다만, AI DC에는 성능 최적화를 위해 이더넷 패브릭을 조정하는 새로운 네트워크 아키텍처와 기술이 필요합니다. Apstra는 새로운 AI DC 아키텍처와 패브릭 튜닝 과제를 모두 처리합니다. AI DC 설계는 기존의 Apstra 청사진을 사용하여 템플릿 디자이너에서 만들어집니다. 그리고 Apstra를 사용하여 AI 교육 네트워크를 자동 조정하면 오늘날의 수동적이고 시간 소모적인 접근 방식에 비해 많은 시간을 단축하고 스트레스를 줄일 수 있습니다. 이러한 새로운 기능은 기존 Apstra 라이선스에 따라 무료로 제공됩니다.
고유한 요구 사항으로 인해, AI 워크로드에 따라 AI DC 패브릭을 설계하고 구성하는 것은 기존 워크로드에 비해 추가적인 과제를 안겨줍니다. Apstra의 AI 클러스터 템플릿 디자이너를 사용하면 특정 리소스 요구 사항과 워크로드에 맞춘 검증되고 최적화된 Apstra 템플릿을 빠르고 쉽게 생성할 수 있습니다. 필요한 GPU, 서버, 랙 수 등 최소한의 입력 사항을 지정하기만 하면, 이 도구는 사용자 정의 랙 템플릿을 생성하여 효율적인 리소스 활용을 보장하고 잠재적인 성능 병목 현상을 최소화하므로 몇 번의 클릭만으로 네트워크를 안정적으로 확장할 수 있습니다. “레일 최적화(rail-optimized)” 설계가 무엇인지 모르시겠습니까? Apstra가 구축 방법을 알려드립니다. Apstra의 지속적인 검증을 통해 데이터센터 네트워크의 운영 상태가 템플릿에 선언된 의도와 일치하는지 확인합니다.
Apstra AI 클러스터 템플릿 디자이너
고유한 설계 요구 사항과 연결 수로 인해 AI 교육 환경을 구축하는 것은 복잡하고 오류가 발생하기 쉽습니다. Apstra 청사진을 랙 높이 정보와 결합하면 데이터센터 기술자가 높은 수준의 정확도로 케이블 작업을 완료하는 데 사용할 수 있는 정밀한 링크 및 엔드포인트 목록을 가진 케이블링 맵을 제공합니다.
GPU 서버의 네트워크 인터페이스 카드(NIC)는 AI DC 설계에서 중요한 역할을 합니다. 모든 노드 간 라우팅을 위한 GPU NIC를 구성하는 것은 힘든 일이며 전체 네트워크 패브릭에 대한 이해가 필요합니다. AI/ML용 Apstra 호스트 에이전트는 GPU 네트워크 청사진에서 파생된 올바른 IP 주소와 라우팅 정보로 GPU NIC를 자동으로 구성할 수 있습니다.
Apstra GPU/NIC 모니터링
구하기 어려운 GPU 배송을 기다리는 동안 AI DC 미리 준비
AI 가속기(예: GPU)는 비싸고 부족합니다. 많은 회사들이 제품을 구하기 위해 몇 개월을 기다린 후 마침내 값비싼 GPU를 구매하지만, 인프라를 구축하고 구성하는 데 몇 주가 걸리는 동안 그냥 방치해 두는 경우가 많습니다.
Apstra는 물리적 하드웨어를 구매하기 전에 네트워크 설계를 디지털 방식으로 모델링하고 관리할 수 있는 강력한 프레임워크를 제공하여 조직이 네트워크 계획 및 구축 프로세스를 효과적으로 간소화할 수 있도록 지원합니다. 인프라가 창고에 도착하기 전에 전체 AI DC를 미리 준비하십시오. Apstra를 사용하면 몇 주가 아닌 며칠 만에 구축이 가능합니다.
AI DC 패브릭 오토 튜닝
이더넷을 통한 AI 모델 교육은 데이터센터 양자화 혼잡 알림(DCQCN, Data Center Quantized Congestion Notification)과 같은 새로운 혼잡 관리 및 흐름 제어 기술을 필요로 합니다. 성능을 최적화하고 이러한 정교한 프로토콜을 활용할 수 있도록 AI 패브릭을 튜닝하는 것은 상당한 운영상의 과제를 안겨줍니다. 수동 튜닝 기술은 시간이 많이 걸리고, 비효과적이며, 오류와 비효율성이 따릅니다.
Apstra를 사용하면 몇 분 안에 패브릭을 자동으로 튜닝할 수 있습니다. 패브릭 튜닝은 패킷 손실을 최소화하면서 처리량을 극대화하는 미세한 균형을 맞추는 작업입니다. 스위치 버퍼가 채워짐에 따라 DCQCN, ECN(Explicit Congestion Notification), PFC(Priority Flow Control)의 구성 요소들이 트래픽 흐름을 최적화하는 데 사용됩니다. Apstra는 주요 RoCE v2 혼잡 지표를 지속적으로 모니터링하고 스위치의 DCQCN을 재구성하여 패킷 손실을 방지합니다. 실시간 네트워크 분석에 기반한 DCQCN 매개 변수의 동적 최적화는 효율적인 운영을 보장합니다. 이 애플리케이션은 현재 GitHub에서 다운로드할 수 있으며, 어떤 Apstra 라이선스라도 있는 경우 무료로 사용할 수도 있습니다.
Apstra AI DC 패브릭 자동 조정 앱
기업 AI 프로젝트의 가치 실현 시간을 최소화하는 주니퍼 Apstra
고객이 모델 성능과 데이터센터 네트워크 설계의 효율성을 테스트하고 AI 가치 실현 시간을 단축할 수 있도록 해주는 주니퍼 Ops4AI 랩을 꼭 확인해 보십시오. 엔터프라이즈 네트워크 팀은 경영진이 추진하는 공격적인 AI 목표 앞에서 당황할 필요가 없습니다. 주니퍼 Apstra가 도와드리겠습니다.
세부 내용은 솔루션 개요를 읽고 AI 데이터센터 솔루션 페이지에서 더 자세히 알아보십시오.