AI 요약
META의 FAIR 팀이 AI 연구 10주년을 맞아 괄목할 만한 성과를 발표하며 AI 기술 발전을 선도하고 있습니다.
특히 Llama 2와 같은 오픈 소스 모델 공개 및 1,000개 이상의 언어를 지원하는 언어 번역 기술 발전은 META의 AI 경쟁력을 크게 강화하며 미래 성장 기대감을 높입니다.
또한, 스마트 글래스용 AI 코치, 실시간 음성 생성 및 번역 기술 등 혁신적인 AI 제품과 경험을 지속적으로 선보이며 시장을 선도할 것으로 전망됩니다.
핵심 포인트
- META의 FAIR 팀이 AI 연구 10주년을 맞아 괄목할 만한 성과를 발표하며 AI 기술 발전을 선도하고 있습니다.
- 특히 Llama 2와 같은 오픈 소스 모델 공개 및 1,000개 이상의 언어를 지원하는 언어 번역 기술 발전은 META의 AI 경쟁력을 크게 강화하며 미래 성장 기대감을 높입니다.
- 또한, 스마트 글래스용 AI 코치, 실시간 음성 생성 및 번역 기술 등 혁신적인 AI 제품과 경험을 지속적으로 선보이며 시장을 선도할 것으로 전망됩니다.
긍정 / 부정 요인
긍정 요인
- AI 연구 10주년 기념 및 성과 발표
- Llama 2와 같은 오픈 소스 대규모 언어 모델 공개
- 1,000개 이상의 언어 지원 언어 번역 기술 발전
- 스마트 글래스용 AI 코치 기술 개발
- 실시간 음성 생성 및 번역 기술 발전 (Audiobox, Seamless Communication)
기사 전문
Meta, AI 연구 10년 기념… 혁신 기술 잇따라 공개
Meta의 인공지능(AI) 연구팀인 FAIR(Fundamental AI Research)가 설립 10주년을 맞았습니다. 지난 10년간 FAIR는 AI 분야의 수많은 혁신을 이끌어왔으며, 개방적이고 책임감 있는 연구의 선두 주자로 자리매김했습니다. Meta는 논문, 코드, 모델, 데모, 책임감 있는 사용 가이드 등 연구 성과를 투명하게 공유하며 오픈 사이언스를 실천하고 있습니다.
FAIR는 지난 10년간 객체 탐지 분야에서 획기적인 성과를 거두었습니다. 이미지 속 객체를 인식하는 'Segment Anything' 기술이 대표적입니다. 또한, 영어에 의존하지 않고 100개 언어를 번역할 수 있는 비지도 기계 번역 기술을 개척했으며, 이를 통해 1,000개 이상의 언어로 텍스트-음성 변환 및 음성-텍스트 변환 기술을 확장하는 'No Language Left Behind' 프로젝트를 성공적으로 수행했습니다.
올해 초에는 오픈 소스 대규모 언어 모델인 'Llama'를 공개했으며, 이후 연구 및 상업적 용도로 무료 사용 가능한 'Llama 2'를 출시했습니다. 최근에는 Meta의 생성형 AI 및 제품 팀이 초기 연구를 바탕으로 개발한 새로운 AI 제품과 경험을 선보이며 수백만 명의 사용자에게 AI 기술을 제공하고 있습니다.
Meta는 이번 10주년을 맞아 최신 AI 기술 발전 현황도 공유했습니다. 'Ego-Exo4D'는 AI가 세상을 인식하는 방식을 개선하기 위한 업데이트로, 웨어러블 카메라를 통한 1인칭 시점(egocentric)과 주변 카메라를 통한 외부 시점(exocentric)을 동시에 캡처합니다. 이를 통해 AI 모델은 사람이 보고 듣는 것과 주변 환경에 대한 맥락 정보를 함께 이해할 수 있게 됩니다. 향후 이러한 AI 기술 발전은 스마트 글래스를 착용한 사용자가 가상 AI 코치의 안내를 받아 새로운 기술을 빠르게 습득하는 데 활용될 수 있습니다. 예를 들어, 전문가가 자전거 타이어를 교체하거나, 축구공을 저글링하거나, 종이학을 접는 과정을 보고 자신의 행동에 적용하는 것이 가능해집니다.
'Audiobox'는 음성 및 사운드 효과 생성 기능을 한층 발전시켰습니다. 올해 초 공개된 생성형 AI 모델 'Voicebox'의 후속작인 'Audiobox'는 음성 프롬프트나 텍스트 설명을 통해 원하는 소리나 음성을 생성할 수 있습니다. 예를 들어, "졸졸 흐르는 강물과 새 지저귀는 소리"와 같은 프롬프트로 사운드트랙을 만들거나, "젊은 여성이 높은 톤으로 빠르게 말하는 목소리"를 생성할 수 있습니다. 이를 통해 사용자는 모든 프로젝트에 맞춤형 오디오를 손쉽게 제작할 수 있습니다.
'Seamless Communication'은 언어 간 표현력을 더욱 풍부하게 보존하고, 화자가 말하는 도중에 번역을 시작하여 속도를 향상시키는 AI 번역 모델 모음입니다. 이전 언어 번역 서비스는 종종 음조, 쉼표, 강조 등 감정과 의도를 전달하는 중요한 신호를 포착하는 데 어려움을 겪었습니다. 'SeamlessExpressive'는 화자의 감정과 스타일을 보존하고 말의 속도와 리듬을 조절하는 모델을 사용하여 표현력 있는 언어 간 커뮤니케이션을 가능하게 하는 최초의 공개 시스템입니다. 현재 영어, 스페인어, 독일어, 프랑스어, 이탈리아어, 중국어를 지원합니다. 'SeamlessStreaming'은 다른 언어를 사용하는 사람과 실시간 대화를 가능하게 합니다. 화자가 문장을 마친 후에 번역하는 기존 시스템과 달리, 'SeamlessStreaming'은 화자가 말하는 도중에 번역을 시작하여 듣는 사람이 더 빠르게 번역을 접할 수 있도록 합니다.
Meta는 소프트웨어, 하드웨어, 인프라에 대한 투자를 통해 AI의 가장 큰 과제를 해결할 수 있는 독보적인 위치에 있습니다. FAIR는 업계 최고의 인재, 개방적인 문화, 그리고 무엇보다 탐구적인 연구를 수행할 수 있는 자유를 바탕으로 Meta 성공의 핵심적인 역할을 하고 있습니다. 이러한 자유는 Meta가 민첩성을 유지하고 사회적 연결의 미래를 구축하는 데 기여할 수 있도록 했습니다.
Meta는 책임감 있는 AI 연구와 개방성을 중요하게 생각합니다. 동료들의 검토를 거쳐 신중하게 작성된 연구 결과를 공유함으로써 우수성을 추구하고 연구 성과에 대한 신뢰를 구축합니다. 또한, 더 넓은 커뮤니티와의 협력을 통해 더 빠른 발전과 다양한 기여자들의 참여를 이끌어내고 있습니다.