![]() |
NVIDIA AI Data Platform으로 AI 추론 가속화와 함께 엔비디아 클라우드 파트너 및 엔터프라이즈 배포를 위한 새로운 스토리지 인증 획득
캘리포니아주 새너제이 및 캠벨, 2025년 3월 19일 /PRNewswire/ — AI 네이티브 데이터 플랫폼 회사인 웨카(WEKA)가 미국 캘리포니아주 새너제이에서 열리고 있는 GTC 2025에서 NVIDIA AI Data Platform 레퍼런스 디자인과의 통합을 발표했다. 이와 더불어 웨카는 에이전틱 AI(Agentic AI)와 추론 모델의 미래를 대비해 최적화된 AI 인프라를 제공할 목적으로 엔비디아 스토리지 인증도 획득했다. 더불어 웨카는 NVIDIA GB200 NVL72를 사용하는 NVIDIA Cloud Partner(NCP) Reference Architecture에 대한 새로운 인증과 엔비디아 NVIDIA Enterprise Reference Architecture를 사용하는 엔터프라이즈 AI 공장에 배포하기 위한 NVIDIA-Certified System™ Storage 지정을 발표했다.
웨카는 또한 WEKA Data Platform 소프트웨어를 엔비디아의 가속 컴퓨팅, 네트워킹, 엔터프라이즈 소프트웨어와 통합해 AI 추론 속도를 높이고, 초당 처리되는 토큰 수를 극대화해 토큰의 효율성을 획기적으로 향상시키는 새로운 Augmented Memory Grid™ 기능을 공개했다.
웨카의 고성능 스토리지로 AI 에이전트 성능 강화
NVIDIA AI Data Platform은 에이전틱 AI 시대를 위한 기업 인프라를 재정의하고 있다. NVIDIA Blackwell 플랫폼, NVIDIA BlueField® DPU, NVIDIA Spectrum-X™ 네트워킹, NVIDIA AI Enterprise 소프트웨어를 기업용 스토리지와 통합해 데이터를 실행 가능한 인텔리전스로 변환하는 맞춤형 레퍼런스 디자인을 제공한다. 이제 기업들은 WEKA Data Platform 소프트웨어로 NVIDIA AI Data Platform의 이점을 활용해 AI 쿼리 에이전트를 비즈니스 지식에 연결하고, 복잡한 추론에 대해 최고의 AI 추론 성능과 더 높은 정확도를 보여주는, 대규모 확장이 가능한 엔터프라이즈 AI용 고성능 파운데이션을 생성할 수 있다.
WEKA Augmented Memory Grid로 AI 메모리 장벽을 깨다
AI 에이전트의 자율적 의사 결정, 복잡한 문제 해결, 적응형 학습 기능을 계속 확장함에 따라 더 긴 컨텍스트 창을 지원할 수 있는 AI 인프라의 필요성이 확대되면서, 모델의 매개 변수가 증가하고, 시스템 메모리 요구 사항이 증가하고 있다. WEKA Augmented Memory Grid를 사용하는 AI 모델은 1테라바이트로 고정된 오늘날의 용량 증가량 대신 테라바이트의 세 자릿수 크기인 페타바이트로 용량을 추가해 대규모 모델 추론에 맞게 메모리를 확장할 수 있다. 이와 동시에 WEKA Augmented Memory Grid는 마이크로초 수준의 지연이란 메모리 속도에 가까운 성능으로 더 빠른 토큰 처리가 가능해 전례 없는 추론 결과를 얻을 수 있다. 주요 이점은 다음과 같다.
- 첫 번째 토큰 도달 시간 극적으로 단축: 10만 5000개의 토큰을 처리할 때 WEKA Augmented Memory Grid는 프리필(prefill) 컨텍스트를 재계산하는 시간 대비 첫 번째 토큰 도달 시간을 41배 단축했다.
- 토큰 처리 최적화: 추론 클러스터는 클러스터 전체에서 더 높은 토큰 처리량을 달성할 수 있고, 전체 추론 시스템의 토큰 처리 비용을 최대 24%까지 낮출 수 있다.
새로운 엔비디아 스토리지 인증으로 엔터프라이즈 AI 혁신 앞당겨
WEKApod™ Nitro Data Platform Appliance는 NVIDIA HGX H200, B200, GB200 NVL72를 통해 NVIDIA Cloud Partner(NCP) 배포를 위한 최초의 고성능 스토리지 솔루션 중 하나로 인증을 받음으로써 AI 개발자와 혁신가를 위한 NCP 제공업체의 인프라 서비스를 강화한다. WEKApod 어플라이언스는 고성능 밀도와 전력 효율성을 제공해, 단일 8U 엔트리 레벨 구성으로 최대 1152개의 GPU를 지원할 수 있다.
WEKApod™ Nitro 어플라이언스는 NVIDIA-Certified System을 갖춘 NVIDIA Enterprise Reference Architecture 지침에 따라 AI 공장을 구축하는 기업을 위한 새로운 NVIDIA-Certified Systems Storage 지정을 획득했다. 이 인증은 WEKA Data Platform이 엔비디아의 우수 사례와 호환되어 광범위한 엔터프라이즈 AI와 HPC 워크로드를 위해 최적의 스토리지 성능과 효율성 및 확장성을 보장한다는 것을 입증해준다.
나일레쉬 파텔(Nilesh Patel) 웨카 최고제품책임자(CPO)는 “웨카는 엔비디아와의 협력을 통해 NVIDIA AI Data Platform을 가진 조직에 고성능 AI 스토리지 솔루션을 제공함으로써 AI 혁신을 억제하고 모델의 성능과 인프라 효율성을 저하시키는 데이터 문제를 해결하고 있다”면서 “음속 장벽 돌파가 항공우주 혁신에 새로운 지평을 열었듯이 WEKA Augmented Memory Grid는 AI 메모리 장벽을 허물고, GPU 메모리를 확장하고, NVIDIA AI Data Platform 전반에 걸쳐 토큰의 효율성을 최적화하고 있다. 이러한 혁신은 AI 토큰 경제를 변화시켜 성능 저하 없이도 더 낮은 비용으로 더 빠른 혁신을 이루게 해줄 것이다”라고 덧붙였다.
롭 데이비스(Rob Davis) 엔비디아 스토리지 네트워킹 기술 담당 부사장은 “에이전틱 AI와 추론 모델의 힘을 활용하려는 기업이 이처럼 까다로운 워크로드를 처리하려면 전례 없는 효율성과 확장성이 필요하다”면서 “엔비디아와 웨카의 기술을 합치면 AI 에이전트가 추론 과정에서 최첨단 속도와 정확성으로 데이터에 액세스하고 데이터를 처리할 수 있다”고 말했다.
제공 시기
- NVIDIA Blackwell 시스템용 웨카의 NCP 레퍼런스 아키텍처는 이달 말 말부터 판매된다.
- WEKA Augmented Memory Grid 기능은 2025년 봄에 WEKA Data Platform 고객에게 제공될 예정이다.
추가 정보 블로그 참조:
엔비디아 GTC 2025 방문객은 GTC 엑스포 홀에 있는 웨카 부스를 방문하면 새로운 WEKA Augmented Memory Grid 기능을 시연해 볼 수 있다.
고객 추천사
투게더 AI(Together AI)
처장(Ce Zhang) 투게더 AI 최고기술책임자(CTO)는 “투게더 AI에는 속도와 효율성에 집착한다. 그래서 업계에서 가장 빠른 추론 속도를 제공하는 Together Interference Engine을 구축했다. 웨카의 Augmented Memory Grid 기능을 활용해 프롬프트 캐싱(prompt caching)에 소요되는 시간을 줄이고 여러 노드에서 이 캐시를 활용하는 유연성을 개선해 지연 시간을 줄이고 투게더 AI를 기반으로 모델을 구축하는 50만 명이 넘는 AI 개발자에게 혜택을 제공할 수 있게 되어 기쁘다”고 말했다.
요타 데이터 서비시즈(Yotta Data Services)
엔비디아 클라우드 파트너인 요타 데이터 서비시즈의 공동 설립자 겸 전무이사인 서닐 굽타(Sunil Gupta) CEO는 “WEKA Data Platform은 인도에서 가장 빠른 AI 슈퍼컴퓨팅 플랫폼인 Yotta Shakti Supercloud의 성능과 확장성을 향상시키는 데 핵심적인 역할을 한다. 웨카의 혁신적인 Augmented Memory Grid 기능과 NVIDIA Blackwell 배포를 위한 고성능 데이터 저장소 인증은 클라우드 규모에서 AI의 효율성을 향상시킨다. 웨카는 GPU 메모리를 확장하고 Shakti Supercloud 제품군 전체에서 활용도를 극대화함으로써 AI 성능 향상, 더 빠른 추론, 더 나은 비용 효율성을 제공할 수 있도록 지원한다”고 말했다.
웨카 소개
웨카는 AI 시대를 위해 구축된 기업 데이터 스택에 대한 새로운 방식을 설계하고 있다. WEKA® Data Platform은 클라우드와 어디에나 설치할 수 있는 AI 기반 아키텍처가 갖춰진 AI 인프라의 표준을 설정해 온-프레미스와 클라우드 및 엣지 환경에서 데이터의 원활한 이동을 보장한다. 이 플랫폼은 종래의 데이터 사일로를 GPU, AI 모델 트레이닝과 추론 그리고 기타 성능 집약적인 워크로드를 가속하는 동적 데이터 파이프라인으로 변환해 보다 작업 효율성 상승, 에너지 소비 감소, 관련 탄소 배출 저하를 유도한다. 웨카는 전 세계에서 가장 혁신적인 기업과 연구 조직들이 복잡한 데이터 문제를 해결해 더욱 신속하고 지속 가능한 방식으로 발견, 통찰, 결과에 도달할 수 있도록 지원하고 있으며, 여기에는 포춘 50대 기업 중 12개가 포함되어 있다. www.weka.io를 더 자세한 정보를 확인하거나, 링크드인과 엑스(X)를 통해 웨카와 연결하기 바란다.
웨카와 웨카 로고는 웨카아이오 주식회사(WekaIO, Inc.)의 등록상표이다. 여기에서 사용된 기타 트레이드 명칭들은 각 소유자의 상표일 수 있다.
사진 – https://mma.prnasia.com/media2/2643877/PR_WEKA_NVIDIA_GTC2025.jpg?p=medium600
로고 – https://mma.prnasia.com/media2/1796062/WEKA_v1_Logo.jpg?p=medium600
© 2025, 편집부. All rights reserved. 모든 콘텐츠(기사)에 대한 무단 전재ㆍ복사ㆍ배포 등을 금합니다.