AI 요약
NVIDIA가 새로운 Nemotron 3 오픈 모델 제품군을 출시하며 AI 에이전트 개발 시장에서 리더십을 강화했습니다.
이 모델들은 이전 세대 대비 4배 높은 처리량과 향상된 정확도를 제공하여, 기업들이 투명하고 효율적인 AI 시스템을 구축하도록 지원합니다.
이는 NVIDIA의 AI 생태계 확장과 더불어 관련 시장에서의 경쟁 우위를 더욱 공고히 할 것으로 기대됩니다.
핵심 포인트
- NVIDIA가 새로운 Nemotron 3 오픈 모델 제품군을 출시하며 AI 에이전트 개발 시장에서 리더십을 강화했습니다.
- 이 모델들은 이전 세대 대비 4배 높은 처리량과 향상된 정확도를 제공하여, 기업들이 투명하고 효율적인 AI 시스템을 구축하도록 지원합니다.
- 이는 NVIDIA의 AI 생태계 확장과 더불어 관련 시장에서의 경쟁 우위를 더욱 공고히 할 것으로 기대됩니다.
긍정 / 부정 요인
긍정 요인
- AI 칩 신제품 출시
- 처리량 4배 향상
- 정확도 향상
- AI 에이전트 시장 경쟁력 강화
- AI 생태계 확장
기사 전문
엔비디아, AI 에이전트 개발 혁신 이끌 'Nemotron 3' 오픈 모델 공개
엔비디아(NVIDIA)가 AI 에이전트 개발을 위한 투명하고 효율적인 개방형 모델 제품군인 'Nemotron 3'를 공개했습니다. 이번에 공개된 Nemotron 3는 Nano, Super, Ultra 세 가지 크기로 제공되며, 특히 업계 최고 수준의 정확도를 자랑하는 가장 효율적인 개방형 모델 제품군으로 평가받고 있습니다.
Nemotron 3 Nano는 이전 모델인 Nemotron 2 Nano 대비 4배 높은 처리량을 제공하며, 혁신적인 하이브리드 Mixture-of-Experts(MoE) 아키텍처를 통해 대규모 멀티 에이전트 시스템에서 초당 가장 많은 토큰을 처리할 수 있습니다. 또한, 고급 강화 학습 기법과 동시 다중 환경 후처리 학습을 통해 뛰어난 정확도를 달성했습니다.
젠슨 황 엔비디아 창업자 겸 CEO는 "개방형 혁신은 AI 발전의 근간"이라며, "Nemotron을 통해 우리는 고급 AI를 개방형 플랫폼으로 전환하여 개발자들이 대규모 에이전트 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하고 있습니다."라고 말했습니다.
Nemotron 3는 조직들이 단일 모델 챗봇에서 협업 멀티 에이전트 AI 시스템으로 전환함에 따라 발생하는 통신 오버헤드, 컨텍스트 드리프트, 높은 추론 비용 등의 문제를 해결하는 데 중점을 두고 개발되었습니다. 또한, 개발자들은 자동화될 복잡한 워크플로우에 대한 신뢰를 위해 투명성을 요구하고 있습니다. Nemotron 3는 이러한 요구에 부응하여 전문화된 에이전트 AI 구축에 필요한 성능과 개방성을 제공합니다.
엔비디아는 유럽과 한국을 포함한 전 세계 여러 국가에서 자사의 주권 AI(Sovereign AI) 노력을 지원하고 있으며, 각 조직은 자체 데이터, 규정 및 가치에 맞는 AI 시스템을 구축할 수 있는 개방적이고 투명하며 효율적인 모델을 채택하고 있습니다.
Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys, Zoom 등 초기 채택 기업들은 Nemotron 제품군 모델을 통합하여 제조, 사이버 보안, 소프트웨어 개발, 미디어, 통신 등 다양한 산업 분야의 AI 워크플로우를 강화하고 있습니다.
ServiceNow의 Bill McDermott 회장 겸 CEO는 "엔비디아와 ServiceNow는 수년간 AI의 미래를 만들어 왔으며, 앞으로 더 많은 발전이 기대됩니다."라며, "오늘 우리는 모든 산업 분야의 리더들이 에이전트 AI 전략을 가속화할 수 있도록 지원하는 중요한 발걸음을 내디뎠습니다. ServiceNow의 지능형 워크플로우 자동화와 NVIDIA Nemotron 3의 결합은 비교할 수 없는 효율성, 속도 및 정확성으로 표준을 계속 정의할 것입니다."라고 전했습니다.
멀티 에이전트 AI 시스템이 확장됨에 따라 개발자들은 최첨단 추론을 위해 독점 모델에 의존하는 동시에 비용 절감을 위해 더 효율적이고 사용자 정의 가능한 개방형 모델을 사용하고 있습니다. 단일 워크플로우에서 최첨단 모델과 Nemotron 간에 작업을 라우팅하면 에이전트가 최적의 토크노믹스(tokenomics)를 유지하면서도 최고의 지능을 발휘할 수 있습니다.
Perplexity의 Aravind Srinivas CEO는 "Perplexity는 인간의 호기심이 AI 비서와 같은 뛰어난 도구에 내장된 정확한 AI에 의해 증폭될 것이라는 아이디어 위에 구축되었습니다."라며, "우리의 에이전트 라우터를 통해 Nemotron 3 Ultra와 같이 최적화된 개방형 모델로 워크로드를 지시하거나, 작업이 고유한 기능을 통해 이점을 얻을 때 선도적인 독점 모델을 활용하여 AI 비서가 탁월한 속도, 효율성 및 규모로 작동하도록 보장할 수 있습니다."라고 설명했습니다.
개방형 Nemotron 3 모델은 스타트업이 AI 에이전트를 더 빠르게 구축하고 반복하며 프로토타입부터 엔터프라이즈 배포까지 혁신을 가속화할 수 있도록 지원합니다. General Catalyst, Mayfield, Sierra Ventures의 포트폴리오 회사들은 Nemotron 3를 활용하여 인간-AI 협업을 지원하는 AI 팀원을 구축하고 있습니다.
Mayfield의 Navin Chaddha 매니징 파트너는 "엔비디아의 개방형 모델 스택과 NVIDIA Inception 프로그램은 초기 단계 기업에게 실험, 차별화 및 빠른 확장을 위한 모델, 도구 및 비용 효율적인 인프라를 제공합니다."라며, "Nemotron 3는 창업자들이 에이전트 AI 애플리케이션 및 AI 팀원 구축을 위한 출발점을 제공하며, 엔비디아의 방대한 설치 기반을 활용하는 데 도움을 줍니다."라고 말했습니다.
Nemotron 3, 효율성과 정확성으로 멀티 에이전트 AI 재정의
Nemotron 3 MoE 모델 제품군은 세 가지 크기로 구성됩니다.
Nemotron 3 Nano: 최대 30억 개의 파라미터를 활성화하는 300억 개 파라미터의 소형 모델로, 표적화되고 매우 효율적인 작업에 적합합니다.
Nemotron 3 Super: 약 1,000억 개의 파라미터와 토큰당 최대 100억 개의 활성 파라미터를 갖춘 고정확도 추론 모델로, 멀티 에이전트 애플리케이션에 사용됩니다.
Nemotron 3 Ultra: 약 5,000억 개의 파라미터와 토큰당 최대 500억 개의 활성 파라미터를 갖춘 대형 추론 엔진으로, 복잡한 AI 애플리케이션에 사용됩니다.
현재 사용 가능한 Nemotron 3 Nano는 소프트웨어 디버깅, 콘텐츠 요약, AI 비서 워크플로우, 정보 검색과 같은 작업을 낮은 추론 비용으로 최적화한 가장 컴퓨팅 비용 효율적인 모델입니다. 이 모델은 독특한 하이브리드 MoE 아키텍처를 사용하여 효율성과 확장성에서 이점을 제공합니다.
이 설계는 Nemotron 2 Nano 대비 최대 4배 높은 토큰 처리량을 달성하고 추론 토큰 생성을 최대 60%까지 줄여 추론 비용을 크게 절감합니다. 100만 토큰의 컨텍스트 창을 통해 Nemotron 3 Nano는 더 많은 정보를 기억하여 정확도를 높이고 장기적이고 다단계적인 작업에서 정보를 연결하는 능력을 향상시킵니다.
AI 벤치마킹 전문 독립 기관인 Artificial Analysis는 이 모델을 동일한 크기의 모델 중 가장 개방적이고 효율적이며 최고 수준의 정확도를 갖춘 모델로 평가했습니다.
Nemotron 3 Super는 낮은 지연 시간으로 복잡한 작업을 달성하기 위해 많은 협업 에이전트가 필요한 애플리케이션에 탁월합니다. Nemotron 3 Ultra는 심층 연구 및 전략 기획이 필요한 AI 워크플로우를 위한 고급 추론 엔진 역할을 합니다.
Nemotron 3 Super 및 Ultra는 엔비디아의 블랙웰(Blackwell) 아키텍처에서 엔비디아의 초고효율 4비트 NVFP4 학습 형식을 사용하여 메모리 요구 사항을 크게 줄이고 학습 속도를 높입니다. 이러한 효율성은 더 높은 정밀도 형식에 비해 정확도를 저하시키지 않으면서 기존 인프라에서 더 큰 모델을 학습할 수 있게 합니다.
Nemotron 3 제품군 모델을 통해 개발자는 특정 워크로드에 적합한 크기의 개방형 모델을 선택하여 수십 개에서 수백 개의 에이전트로 확장하면서도 복잡한 워크플로우를 위한 더 빠르고 정확한 장기 추론의 이점을 누릴 수 있습니다.
AI 에이전트 사용자 정의를 위한 새로운 개방형 도구 및 데이터
엔비디아는 또한 전문화된 AI 에이전트를 구축하는 모든 사람이 사용할 수 있는 학습 데이터셋과 최첨단 강화 학습 라이브러리 모음을 출시했습니다.
3조 개의 토큰으로 구성된 새로운 Nemotron 사전 학습, 후처리 및 강화 학습 데이터셋은 고도로 유능하고 도메인 특화된 에이전트를 만들기 위해 필요한 풍부한 추론, 코딩 및 다단계 워크플로우 예제를 제공합니다. Nemotron Agentic Safety Dataset은 복잡한 에이전트 시스템의 안전성을 평가하고 강화하는 데 도움이 되는 실제 원격 측정 데이터를 제공합니다.
개발을 가속화하기 위해 엔비디아는 Nemotron 모델을 위한 학습 환경과 후처리 기반을 제공하는 NeMo Gym 및 NeMo RL 오픈 소스 라이브러리를 출시했으며, 모델 안전성 및 성능을 검증하기 위한 NeMo Evaluator도 함께 제공합니다. 모든 도구와 데이터셋은 현재 GitHub 및 Hugging Face에서 사용할 수 있습니다.
Nemotron 3는 LM Studio, llama.cpp, SGLang 및 vLLM의 지원을 받습니다. 또한 Prime Intellect와 Unsloth는 NeMo Gym의 즉시 사용 가능한 학습 환경을 워크플로우에 직접 통합하여 팀이 강력한 강화 학습 학습에 더 빠르고 쉽게 액세스할 수 있도록 합니다.
NVIDIA 개방형 모델로 시작하기
Nemotron 3 Nano는 현재 Hugging Face 및 Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, Together AI를 포함한 추론 서비스 제공업체를 통해 사용할 수 있습니다.
Nemotron은 Couchbase, DataRobot, H2O.ai, JFrog, Lambda, UiPath를 포함한 엔터프라이즈 AI 및 데이터 인프라 플랫폼에서 제공됩니다. 퍼블릭 클라우드를 사용하는 고객의 경우 Nemotron 3 Nano는 Amazon Bedrock(서버리스)을 통해 AWS에서 사용할 수 있으며, 곧 Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale 및 Yotta에서도 지원될 예정입니다.
Nemotron 3 Nano는 NVIDIA NIM™ 마이크로서비스로 제공되어 최대의 개인 정보 보호 및 제어를 위해 NVIDIA 가속 인프라 어디에서나 안전하고 확장 가능한 배포가 가능합니다.
Nemotron 3 Super 및 Ultra는 2026년 상반기에 출시될 예정입니다.
관련 기사
엔비디아, 1분기 재무 결과 발표를 위한 컨퍼런스 콜 개최
중립2026년 4월 29일 PM 09:02OpenAI의 새로운 GPT-5.5, 엔비디아 인프라 기반 Codex 구동 — 엔비디아, 이미 활용 시작
긍정2026년 4월 23일 PM 06:57GeForce NOW, Xbox Game Pass 및 Ubisoft+ 라벨로 게임 검색 기능 강화
긍정2026년 4월 23일 PM 01:23초기 우주 이해하기
중립2026년 4월 23일 PM 01:23열대우림부터 재활용 공장까지: 엔비디아 AI가 지구를 보호하는 5가지 방법
긍정2026년 4월 22일 PM 01:48