AI 요약
META의 유럽 기술 허브에서 AI 연구 성과가 두드러지며, 특히 LLaMA 모델 개발과 DINOv2 등 컴퓨터 비전 분야에서 혁신을 이루고 있습니다.
이러한 연구 성과는 META의 AI 기술 리더십을 강화하며 미래 성장 동력을 확보하는 데 긍정적인 영향을 미칠 것으로 기대됩니다.
핵심 포인트
- META의 유럽 기술 허브에서 AI 연구 성과가 두드러지며, 특히 LLaMA 모델 개발과 DINOv2 등 컴퓨터 비전 분야에서 혁신을 이루고 있습니다.
- 이러한 연구 성과는 META의 AI 기술 리더십을 강화하며 미래 성장 동력을 확보하는 데 긍정적인 영향을 미칠 것으로 기대됩니다.
긍정 / 부정 요인
긍정 요인
- LLaMA 모델 개발 및 배포
- DINOv2 등 컴퓨터 비전 연구 성과
- AI 연구 분야에서의 선도적 위치 강화
- 유럽 기술 허브의 AI 연구 역량 증대
기사 전문
META, 유럽 AI 연구 허브 강화…LLaMA부터 AR/VR까지 혁신 주도
Meta의 유럽 인공지능 연구(FAIR) 허브가 설립 8주년을 맞아 파리, 런던, 텔아비브, 취리히 등 주요 거점을 중심으로 AI 연구를 선도하고 있습니다. 특히 탐색적 연구와 오픈 사이언스를 핵심 가치로 삼아 외부 연구기관과의 협력을 통해 AI 발전 속도를 높이고 있습니다.
Naila Murray FAIR EMEA 총괄은 "박사 과정 프로그램을 통해 다수의 AI 연구 인력을 양성했으며, 이들이 AI 분야 발전에 중요한 기여를 하고 있다"고 밝혔습니다. 현재 파리, 런던, 텔아비브, 취리히 팀은 자기 지도 학습, 강화 학습, 음성 및 오디오 처리, 컴퓨터 비전, 자연어 모델링, 책임감 있는 AI, 머신러닝 이론, 모델 효율성, AR/VR 등 다양한 분야에 집중하고 있습니다. Murray 총괄은 "우리 팀은 야심찬 목표와 동료애를 바탕으로 전문성, 직급, 지역, 직무를 넘어 긴밀하게 협력하며 빠른 연구 성과를 달성하고 있다"며, "매일 새로운 연구 돌파구가 나오고 있으며, 특히 EMEA 팀의 기여가 크다"고 덧붙였습니다.
최근 파리 연구팀은 최첨단 대규모 언어 모델인 LLaMA(Large Language Model Meta AI)를 개발 및 배포했습니다. LLaMA는 20개 언어의 텍스트 데이터를 기반으로 학습되어 창의적인 텍스트 생성, 수학 정리 증명, 단백질 구조 예측, 독해력 질문 답변 등 다양한 능력을 갖추고 있습니다. 이는 AI가 대규모로 수십억 명의 사람들에게 제공할 수 있는 잠재적 이점을 보여주는 대표적인 사례입니다.
파리 팀은 컴퓨터 비전 분야에서도 두 가지 혁신적인 성과를 발표했습니다. 첫 번째는 DINOv2로, 자기 지도 학습을 활용하여 기존 표준 방식과 동등하거나 그 이상의 성능을 달성하는 컴퓨터 비전 모델 학습 방법입니다. DINOv2는 이미지나 비디오에서 객체를 명시적인 지도나 목표 없이도 스스로 발견하고 분할할 수 있습니다. 예를 들어, 개를 직접 학습시키지 않아도 이미지 속 개를 인식할 수 있습니다. Meta는 DINOv2를 활용하여 월드 리소스 인스티튜트(World Resources Institute)와 협력하여 대륙 규모의 숲을 나무 단위로 매핑하는 프로젝트를 진행했습니다.
두 번째는 SEER(SElf-SupERvised) 모델입니다. SEER는 별도의 데이터 큐레이션이나 라벨링 없이 무작위 이미지 컬렉션에서 직접 학습하여 이미지 임베딩을 출력합니다. 특히 SEER10B는 다양한 데이터셋을 활용하여 성별, 피부색, 연령대 등 공정성 벤치마크에서 성능을 크게 향상시켰으며, 전 세계 이미지에 대한 이해도를 높여 전례 없는 정확도로 이미지를 지역화할 수 있습니다. 이는 AI 시스템이 모든 사람에게 잘 작동하도록 구축하는 데 중요한 역할을 할 것으로 기대됩니다.
런던과 파리 연구팀은 2022년 8월, 3D 모델링 분야에서 PyTorch3D 라이브러리 내 모듈형 프레임워크인 Implicitron의 코드를 오픈 소스로 공개했습니다. Implicitron은 신경망 기반의 암시적 표현(neural implicit representation) 기술을 사용하여 대량의 데이터나 특정 시점의 제약 없이 실제 객체와 가상 객체를 증강현실에서 매끄럽게 결합할 수 있습니다.
텔아비브 팀은 생성형 AI 분야를 선도하고 있습니다. 2022년 7월, 연구팀은 텍스트 설명과 자유로운 스케치를 통해 사용자의 비전을 시각화하는 Make-A-Scene 모델을 개발했습니다. 또한, 텍스트 프롬프트를 짧고 고품질의 독특한 비디오 클립으로 변환하는 Make-A-Video 시스템도 선보였습니다. 이 시스템은 이미지로부터 비디오를 생성하거나 기존 비디오와 유사한 새로운 비디오를 만들 수도 있습니다.
Meta는 증강현실(AR) 및 가상현실(VR)과 AI 기반 인터페이스가 차세대 컴퓨팅 패러다임을 형성할 것이라고 믿고 있습니다. 취리히 팀은 AR 및 VR 기술 발전에 집중하며, 다른 EMEA 허브들과 협력하여 사용자의 맥락, 선호도, 목표를 이해하는 맥락화된 AI 인터페이스를 개발하고 있습니다. 이는 미래에 기기가 도구가 아닌 파트너로서 사용자에게 맞춰 적응하는 기술 환경을 구축하는 데 기여할 것입니다.
Murray 총괄은 FAIR의 협업 기반이 다양한 팀을 통합하고 연구를 발전시키는 중요한 촉매제 역할을 하고 있다고 강조했습니다. 그녀는 "최근 몇 달간 멀티모달 인식, 언어 이해 및 생성, 강화 학습, 인간-기계 상호작용의 흥미로운 융합이 일어나고 있다"며, "이러한 융합은 AI 분야의 오랜 꿈인 진정한 고급 지능형 시스템 구축에 우리를 더 가깝게 데려가고 있으며, 이는 매우 흥미로운 일"이라고 덧붙였습니다.