AI 요약
NVIDIA가 차세대 AI 칩 플랫폼인 Rubin을 출시하며 AI 슈퍼컴퓨터 시장을 선도할 전망입니다.
Rubin 플랫폼은 이전 Blackwell 대비 추론 토큰 비용을 최대 10배 절감하고 MoE 모델 학습에 필요한 GPU 수를 4배 줄여 AI 채택을 가속화할 것으로 기대됩니다.
Microsoft, AWS, OpenAI 등 주요
기업들의 광범위한 생태계 지원은 NVIDIA의 AI 시장 지배력을 더욱 강화할 것으로 보입니다.
핵심 포인트
- NVIDIA가 차세대 AI 칩 플랫폼인 Rubin을 출시하며 AI 슈퍼컴퓨터 시장을 선도할 전망입니다.
- Rubin 플랫폼은 이전 Blackwell 대비 추론 토큰 비용을 최대 10배 절감하고 MoE 모델 학습에 필요한 GPU 수를 4배 줄여 AI 채택을 가속화할 것으로 기대됩니다.
- Microsoft, AWS, OpenAI 등 주요 기업들의 광범위한 생태계 지원은 NVIDIA의 AI 시장 지배력을 더욱 강화할 것으로 보입니다.
긍정 / 부정 요인
긍정 요인
- 차세대 AI 칩 플랫폼 출시
- 추론 토큰 비용 최대 10배 절감
- MoE 모델 학습 GPU 수 4배 감소
- 주요 빅테크 기업들의 광범위한 생태계 지원
기사 전문
엔비디아, 차세대 AI 컴퓨팅 위한 '루빈' 플랫폼 공개
엔비디아(NVIDIA)가 CES에서 차세대 AI 컴퓨팅 시대를 열 '루빈(Rubin)' 플랫폼을 공개했습니다. 루빈 플랫폼은 6개의 새로운 칩으로 구성되어 있으며, AI 모델 구축, 배포, 보안을 위한 새로운 기준을 제시하며 가장 크고 진보된 AI 시스템을 최저 비용으로 구축할 수 있도록 지원합니다. 이를 통해 AI 도입을 가속화할 것으로 기대됩니다.
루빈 플랫폼은 NVIDIA Vera CPU, NVIDIA Rubin GPU, NVIDIA NVLink™ 6 Switch, NVIDIA ConnectX®-9 SuperNIC, NVIDIA BlueField®-4 DPU, NVIDIA Spectrum™-6 Ethernet Switch 등 6개의 칩 간의 긴밀한 코드자인(codesign) 설계를 통해 학습 시간과 추론 토큰 비용을 대폭 절감합니다.
젠슨 황(Jensen Huang) 엔비디아 창업자 겸 CEO는 "AI 컴퓨팅 수요가 폭발적으로 증가하는 지금, 루빈 플랫폼이 적시에 등장했다"며, "연간 AI 슈퍼컴퓨터 출시라는 우리의 로드맵과 6개 칩에 걸친 극한의 코드자인 설계를 통해 루빈은 AI의 다음 프런티어를 향한 거대한 도약을 이루었다"고 말했습니다.
루빈 플랫폼은 미국 천문학자 베라 플로렌스 쿠퍼 루빈(Vera Florence Cooper Rubin)의 이름을 따 명명되었으며, 그녀의 발견은 우주에 대한 인류의 이해를 변화시켰습니다. 루빈 플랫폼은 NVIDIA Vera Rubin NVL72 랙 규모 솔루션과 NVIDIA HGX Rubin NVL8 시스템을 특징으로 합니다.
이번 플랫폼은 NVIDIA NVLink 인터커넥트 기술, Transformer Engine, Confidential Computing, RAS Engine의 최신 세대와 NVIDIA Vera CPU를 포함한 5가지 혁신을 선보입니다. 이러한 혁신은 NVIDIA Blackwell 플랫폼 대비 토큰당 비용을 최대 10배 낮추면서 에이전트 AI(agentic AI), 고급 추론, 대규모 Mixture-of-Experts(MoE) 모델 추론을 가속화합니다. 또한, 이전 세대 대비 MoE 모델 학습에 4배 적은 GPU를 사용하여 AI 채택을 가속화합니다.
광범위한 생태계 지원
루빈 플랫폼은 Amazon Web Services(AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Cursor, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, Nebius, Nscale, OpenAI, OpenEvidence, Oracle Cloud Infrastructure(OCI), Perplexity, Runway, Supermicro, Thinking Machines Lab, xAI 등 세계 유수의 AI 연구소, 클라우드 서비스 제공업체, 컴퓨터 제조업체, 스타트업들이 채택할 것으로 예상됩니다.
OpenAI의 샘 알트만(Sam Altman) CEO는 "지능은 컴퓨팅과 함께 확장된다. 더 많은 컴퓨팅을 추가하면 모델이 더 유능해지고, 더 어려운 문제를 해결하며, 사람들에게 더 큰 영향을 미친다. NVIDIA 루빈 플랫폼은 이러한 발전을 지속적으로 확장하여 고급 지능이 모두에게 혜택을 줄 수 있도록 돕는다"고 밝혔습니다.
Anthropic의 다리오 아모데이(Dario Amodei) 공동 창업자 겸 CEO는 "NVIDIA 루빈 플랫폼의 효율성 향상은 더 긴 메모리, 더 나은 추론, 더 신뢰할 수 있는 출력을 가능하게 하는 인프라 발전의 예"라며, "엔비디아와의 협력은 우리의 안전 연구와 최첨단 모델에 동력을 제공한다"고 말했습니다.
Meta의 마크 저커버그(Mark Zuckerberg) 창업자 겸 CEO는 "NVIDIA의 루빈 플랫폼은 가장 진보된 모델을 수십억 명의 사람들에게 배포하는 데 필요한 성능과 효율성의 획기적인 발전을 약속한다"고 전했습니다.
xAI의 일론 머스크(Elon Musk) 창업자 겸 CEO는 "NVIDIA 루빈은 AI를 위한 로켓 엔진이 될 것이다. 최첨단 모델을 대규모로 학습하고 배포하고 싶다면, 이것이 바로 당신이 사용할 인프라이며, 루빈은 엔비디아가 골드 스탠다드임을 다시 한번 세상에 알릴 것"이라고 강조했습니다.
Microsoft의 사티아 나델라(Satya Nadella) 이사회 의장 겸 CEO는 "우리는 최대 성능과 효율성으로 어디서든 모든 워크로드를 지원하는 세계에서 가장 강력한 AI 슈퍼팩토리를 구축하고 있다. NVIDIA Vera Rubin GPU를 추가함으로써 개발자와 조직이 완전히 새로운 방식으로 창조하고, 추론하고, 확장할 수 있도록 지원할 것"이라고 말했습니다.
CoreWeave의 마이크 인트레이터(Mike Intrator) 공동 창업자 겸 CEO는 "우리는 개척자들이 목적에 맞게 구축된 AI 플랫폼의 비교할 수 없는 성능으로 혁신을 가속화할 수 있도록 CoreWeave를 구축했으며, 진화하는 워크로드에 적합한 기술을 매칭해왔다. NVIDIA 루빈 플랫폼은 추론, 에이전트 및 대규모 추론 워크로드에 중요한 발전을 나타내며, 이를 우리 플랫폼에 추가하게 되어 기쁘다. CoreWeave Mission Control을 운영 표준으로 삼아 새로운 기능을 신속하게 통합하고 프로덕션 규모에서 안정적으로 실행할 수 있으며, 엔비디아와 긴밀히 협력하고 있다"고 밝혔습니다.
AWS의 맷 가먼(Matt Garman) CEO는 "AWS와 엔비디아는 15년 이상 클라우드 AI 혁신을 함께 추진해왔다. AWS 상의 NVIDIA 루빈 플랫폼은 고객에게 비교할 수 없는 선택권과 유연성을 제공하는 최첨단 AI 인프라를 제공하려는 우리의 지속적인 노력을 보여준다. 엔비디아의 고급 AI 기술과 AWS의 입증된 규모, 보안, 포괄적인 AI 서비스를 결합함으로써 고객은 가장 까다로운 AI 애플리케이션을 더 빠르고 비용 효율적으로 구축, 학습, 배포하여 실험에서 프로덕션까지 어떤 규모에서도 경로를 가속화할 수 있다"고 말했습니다.
Google 및 Alphabet의 순다르 피차이(Sundar Pichai) CEO는 "우리는 엔비디아와의 깊고 오랜 관계를 자랑스럽게 생각한다. 우리가 보는 NVIDIA GPU에 대한 상당한 고객 수요를 충족하기 위해 Google Cloud에서 하드웨어에 최적의 환경을 제공하는 데 집중하고 있다. 루빈 플랫폼의 인상적인 기능을 고객에게 제공하고 AI 경계를 발전시키는 데 필요한 규모와 성능을 제공하면서 협력을 계속할 것"이라고 전했습니다.
Oracle의 클레이 마구어크(Clay Magouyrk) CEO는 "Oracle Cloud Infrastructure는 최고 성능을 위해 구축된 하이퍼스케일 클라우드이며, 엔비디아와 함께 고객이 AI로 구축하고 확장할 수 있는 것의 한계를 넓히고 있다. NVIDIA Vera Rubin 아키텍처로 구동되는 기가스케일 AI 팩토리를 통해 OCI는 고객에게 모델 학습, 추론 및 실제 AI 영향의 한계를 넓히는 데 필요한 인프라 기반을 제공하고 있다"고 말했습니다.
Dell Technologies의 마이클 델(Michael Dell) 회장 겸 CEO는 "NVIDIA 루빈 플랫폼은 AI 인프라에서 중요한 도약을 나타낸다. 루빈을 NVIDIA와 함께하는 Dell AI Factory에 통합함으로써, 우리는 대규모 토큰 볼륨과 다단계 추론을 처리하면서 기업과 네오클라우드가 AI를 대규모로 배포하는 데 필요한 성능과 복원력을 제공할 수 있는 인프라를 구축하고 있다"고 밝혔습니다.
HPE의 안토니오 네리(Antonio Neri) 사장 겸 CEO는 "AI는 워크로드뿐만 아니라 IT의 근간을 재편하고 있으며, 네트워크에서 컴퓨팅까지 모든 인프라 계층을 재고해야 한다. NVIDIA Vera Rubin 플랫폼을 통해 HPE는 안전하고 AI 네이티브인 차세대 인프라를 구축하여 데이터를 지능으로 전환하고 기업이 진정한 AI 팩토리가 될 수 있도록 지원하고 있다"고 말했습니다.
Lenovo의 위안칭 양(Yuanqing Yang) 회장 겸 CEO는 "Lenovo는 차세대 NVIDIA 루빈 플랫폼을 채택하고 있으며, 우리의 Neptune 액체 냉각 솔루션과 글로벌 규모, 제조 효율성, 서비스 범위를 활용하여 기업이 통찰력과 혁신을 위한 지능적이고 가속화된 엔진 역할을 하는 AI 팩토리를 구축하도록 돕고 있다. 우리는 함께 효율적이고 안전한 AI가 모든 조직의 표준이 되는 AI 중심의 미래를 설계하고 있다"고 밝혔습니다.
지능 확장을 위한 설계
에이전트 AI 및 추론 모델과 최첨단 비디오 생성 워크로드는 컴퓨팅의 한계를 재정의하고 있습니다. 다단계 문제 해결은 모델이 긴 토큰 시퀀스를 처리, 추론 및 실행해야 합니다. 복잡한 AI 워크로드의 요구를 충족하도록 설계된 루빈 플랫폼의 5가지 혁신적인 기술은 다음과 같습니다.
6세대 NVIDIA NVLink: 오늘날의 대규모 MoE 모델에 필요한 빠르고 원활한 GPU 간 통신을 제공합니다. 각 GPU는 3.6TB/s의 대역폭을 제공하며, Vera Rubin NVL72 랙은 전체 인터넷보다 더 많은 대역폭인 260TB/s를 제공합니다. 집계 연산을 가속화하는 내장형 인네트워크 컴퓨팅과 향상된 서비스 가능성 및 복원력을 위한 새로운 기능을 갖춘 NVIDIA NVLink 6 스위치는 대규모에서 더 빠르고 효율적인 AI 학습 및 추론을 가능하게 합니다.
NVIDIA Vera CPU: 에이전트 추론을 위해 설계된 NVIDIA Vera는 대규모 AI 팩토리에 가장 효율적인 CPU입니다. NVIDIA CPU는 88개의 NVIDIA 맞춤형 Olympus 코어, 완전한 Armv9.2 호환성, 초고속 NVLink-C2C 연결 기능을 갖추고 있습니다. Vera는 다양한 최신 데이터 센터 워크로드를 지원하기 위해 탁월한 성능, 대역폭 및 업계 최고의 효율성을 제공합니다.
NVIDIA Rubin GPU: 3세대 Transformer Engine과 하드웨어 가속 적응형 압축 기능을 갖춘 Rubin GPU는 AI 추론을 위해 50 페타플롭스의 NVFP4 컴퓨팅 성능을 제공합니다.
3세대 NVIDIA Confidential Computing: Vera Rubin NVL72는 CPU, GPU 및 NVLink 도메인 전반에 걸쳐 데이터 보안을 유지하는 NVIDIA Confidential Computing을 제공하는 최초의 랙 규모 플랫폼으로, 세계에서 가장 큰 독점 모델, 학습 및 추론 워크로드를 보호합니다.
2세대 RAS Engine: GPU, CPU 및 NVLink를 포괄하는 루빈 플랫폼은 시스템 생산성을 극대화하기 위해 실시간 상태 확인, 장애 허용 및 사전 유지보수 기능을 제공합니다. 랙의 모듈식, 케이블 없는 트레이 설계는 Blackwell 대비 최대 18배 빠른 조립 및 서비스를 가능하게 합니다.
AI 네이티브 스토리지 및 안전한 소프트웨어 정의 인프라
NVIDIA 루빈은 NVIDIA Inference Context를 도입했습니다.
관련 기사
엔비디아, 1분기 재무 결과 발표를 위한 컨퍼런스 콜 개최
중립2026년 4월 29일 PM 09:02OpenAI의 새로운 GPT-5.5, 엔비디아 인프라 기반 Codex 구동 — 엔비디아, 이미 활용 시작
긍정2026년 4월 23일 PM 06:57GeForce NOW, Xbox Game Pass 및 Ubisoft+ 라벨로 게임 검색 기능 강화
긍정2026년 4월 23일 PM 01:23초기 우주 이해하기
중립2026년 4월 23일 PM 01:23열대우림부터 재활용 공장까지: 엔비디아 AI가 지구를 보호하는 5가지 방법
긍정2026년 4월 22일 PM 01:48