AI 요약
META가 AI 시대에 맞춰 인프라를 재구축하며 자체 AI 칩 MTIA와 차세대 데이터센터 설계를 공개하여 AI 모델 개발 및 배포 효율성을 크게 향상시킬 것으로 기대됩니다.
이는 AI 기반 제품 강화와 메타버스 비전 실현에 긍정적인 영향을 미칠 전망입니다.
핵심 포인트
- META가 AI 시대에 맞춰 인프라를 재구축하며 자체 AI 칩 MTIA와 차세대 데이터센터 설계를 공개하여 AI 모델 개발 및 배포 효율성을 크게 향상시킬 것으로 기대됩니다.
- 이는 AI 기반 제품 강화와 메타버스 비전 실현에 긍정적인 영향을 미칠 전망입니다.
긍정 / 부정 요인
긍정 요인
- 자체 AI 칩 MTIA 개발 및 공개
- 차세대 AI 최적화 데이터센터 설계 발표
- AI 연구용 슈퍼컴퓨터 RSC 2단계 진행
- AI 기반 제품 및 경험 강화
- 메타버스 비전 실현 가속화
기사 전문
메타(META), AI 인프라 대규모 확장… 자체 칩·차세대 데이터센터 공개
메타(META)가 향후 10년간 폭발적으로 증가할 인공지능(AI) 컴퓨팅 수요에 대비해 자체 개발 칩, AI 최적화 데이터센터, 차세대 슈퍼컴퓨터 등 차세대 AI 인프라 구축에 박차를 가하고 있다고 밝혔습니다. 이는 AI 연구의 새로운 지평을 열고, 다양한 앱에 최첨단 AI 애플리케이션과 경험을 제공하며, 메타버스라는 장기적인 비전을 실현하기 위한 야심찬 계획의 일환입니다.
메타는 자체 개발한 AI 모델 구동용 맞춤형 실리콘 칩인 MTIA(Meta Training and Inference Accelerator)를 공개했습니다. MTIA는 CPU보다 뛰어난 컴퓨팅 성능과 효율성을 제공하며, 메타의 내부 워크로드에 최적화되어 있습니다. MTIA 칩과 GPU를 함께 배포함으로써 각 워크로드에 대해 더 나은 성능, 지연 시간 감소, 효율성 향상을 달성할 것으로 기대됩니다.
또한, 메타는 차세대 데이터센터 디자인을 선보였습니다. 이 데이터센터는 현재 제품을 지원하는 동시에 훈련 및 추론을 위한 미래 세대의 AI 하드웨어를 수용할 수 있도록 설계되었습니다. 특히 액체 냉각 방식의 AI 하드웨어를 지원하고 수천 개의 AI 칩을 연결하는 고성능 AI 네트워크를 갖춰 데이터센터 규모의 AI 훈련 클러스터를 구축할 수 있습니다. 이는 기존보다 더 빠르고 비용 효율적으로 구축될 예정이며, 메타의 방대한 비디오 워크로드를 지원하기 위해 개발된 자체 ASIC 솔루션인 MSVP와 같은 새로운 하드웨어와 시너지를 낼 것으로 보입니다.
AI 연구를 위한 메타의 슈퍼컴퓨터인 RSC(Research SuperCluster)도 한층 강화됩니다. 현재 세계에서 가장 빠른 AI 슈퍼컴퓨터 중 하나로 평가받는 RSC는 16,000개의 GPU를 탑재하고 있으며, 이는 2,000개의 훈련 시스템에 풀 대역폭을 제공하는 3단계 Clos 네트워크 패브릭을 통해 접근 가능합니다. RSC는 증강현실 도구, 콘텐츠 이해 시스템, 실시간 번역 기술 등 차세대 대규모 AI 모델 훈련을 지원할 예정입니다.
메타는 데이터센터부터 서버 하드웨어, 운영 시스템에 이르기까지 인프라 전반을 자체적으로 설계, 구축, 운영함으로써 물리적 계층부터 가상 계층, 소프트웨어 계층, 최종 사용자 경험까지 엔드투엔드 통합 스택을 최적화할 수 있다고 강조했습니다. 이러한 수직 통합은 특정 워크로드에 맞춰 GPU, CPU, 네트워크, 스토리지를 유연하게 배치하고, 필요에 따라 전력 및 냉각 솔루션을 재설계하는 등 맞춤형 인프라 구축을 가능하게 합니다.
메타는 앞으로 칩 설계의 전문화 및 맞춤화, 특정 워크로드에 최적화된 AI 인프라, 대규모 배포를 위한 새로운 시스템 및 도구, 제품 및 설계 지원의 효율성 향상 등이 가속화될 것으로 전망했습니다. 이러한 노력은 최신 연구를 기반으로 더욱 정교한 AI 모델을 구축하고, 전 세계 사람들이 이러한 신기술에 접근할 수 있도록 하는 제품을 제공하는 데 기여할 것입니다. 메타는 이러한 인프라 비전을 통해 AI 분야에서 지속적인 리더십을 유지할 것이라고 자신감을 내비쳤습니다.