메인 콘텐츠로 건너뛰기
MSFT logo
MSFTNASDAQ긍정AI/기술

텍스트 음성 변환 기술, 시각 장애인 및 저시력자를 위한 오디오북 제작 지원 #IDPD

microsoft
중요도

AI 요약

Microsoft Azure의 Custom Neural Voice 기술이 시각 장애인을 위한 오디오북 제작을 혁신하며 접근성을 대폭 확대할 것으로 기대됩니다.

AI와 클라우드 기반의 음성 합성 기술은 기존 제작 방식보다

훨씬 빠른 속도로 고품질 오디오북을 생산하여, 시각 장애인들의 학습 및 취업 기회 확대에 기여할 것으로 보입니다.

이는 Microsoft의 사회적 책임 이행과 함께 새로운 기술 시장에서의 경쟁력을 강화하는 긍정적인 신호입니다.

핵심 포인트

  • Microsoft Azure의 Custom Neural Voice 기술이 시각 장애인을 위한 오디오북 제작을 혁신하며 접근성을 대폭 확대할 것으로 기대됩니다.
  • AI와 클라우드 기반의 음성 합성 기술은 기존 제작 방식보다 훨씬 빠른 속도로 고품질 오디오북을 생산하여, 시각 장애인들의 학습 및 취업 기회 확대에 기여할 것으로 보입니다.
  • 이는 Microsoft의 사회적 책임 이행과 함께 새로운 기술 시장에서의 경쟁력을 강화하는 긍정적인 신호입니다.

긍정 / 부정 요인

긍정 요인

  • AI 및 클라우드 기술을 활용한 오디오북 제작 효율성 증대
  • 시각 장애인을 위한 교육 및 정보 접근성 확대
  • Microsoft Azure의 새로운 기능 홍보 및 기술력 입증
  • 사회적 책임 이행을 통한 기업 이미지 제고
  • 장기적인 파트너십 강화 (15년)

기사 전문

마이크로소프트(MSFT), AI 음성 기술로 시각장애인 교육·취업 지원 확대 마이크로소프트가 중국의 시각장애인 교육 기관인 홍단단(Hongdandan)과 협력하여 인공지능(AI) 기반의 음성 합성 기술을 활용, 시각장애인들의 학습 및 사회 적응을 돕는 새로운 오디오북 제작 방식을 선보이고 있습니다. 이는 시각장애인들이 이전보다 훨씬 빠르고 폭넓게 지식에 접근할 수 있도록 지원하며, 궁극적으로는 이들의 교육 기회 확대와 취업 경쟁력 강화에 기여할 것으로 기대됩니다. 이 프로젝트의 중심에는 10세에 시력을 잃었지만 굴하지 않고 방송인이 된 리나 동(Lina Dong) 씨가 있습니다. 동 씨는 자신이 겪었던 어려움을 바탕으로, 시각장애인들이 사회의 일원으로 더 잘 통합될 수 있도록 돕는 것을 목표로 삼고 있습니다. 그녀는 현재 베이징 홍단단 시각장애인 서비스 센터에서 언어 예술을 가르치고 있으며, 학생들을 위해 직접 오디오북을 제작하기도 합니다. 하지만 기존의 오디오북 제작 방식은 자원봉사자 교육, 녹음 및 편집 과정에 많은 시간과 노력이 소요되어 제작 속도와 범위에 한계가 있었습니다. 이러한 문제를 해결하기 위해 홍단단과 마이크로소프트는 AI와 클라우드 기술을 결합한 새로운 솔루션을 개발했습니다. 마이크로소프트 애저(Azure) 코그니티브 서비스의 '커스텀 뉴럴 보이스(Custom Neural Voice)' 기능을 활용하여, 동 씨의 목소리를 실감 나게 복제한 합성 음성을 생성했습니다. 이 기술을 통해 제작된 오디오 콘텐츠 생성 플랫폼(Audio Content Creation platform)은 동 씨가 직접 읽는 듯한 고품질의 오디오북을 신속하게 만들어냅니다. 리나 동 씨는 자신의 목소리 샘플을 제공하며 이 기술 개발에 적극적으로 참여했습니다. 그녀는 "홍단단과 저는 시각장애인들이 사회에 더 잘 적응하도록 돕는다는 같은 목표를 공유합니다. 누군가 꿈을 꾸면, 우리는 그 꿈을 이룰 수 있는 길을 열어줄 수 있습니다."라고 말했습니다. 그녀는 더 많은 오디오북이 제공됨으로써 학생들이 더 나은 성적을 거두고 미래 직업 전망을 밝게 할 수 있는 귀중한 기술을 습득하는 데 도움이 될 것이라고 강조했습니다. 중국에서 시각장애인들의 취업 기회는 오랫동안 매우 제한적이었습니다. 전통적으로 많은 시각장애인들은 안마 센터 등 특정 직종에 국한되어 일하는 경우가 많았으며, 점자 도서 역시 전문 마사지 기술에 관한 내용이 주를 이루었습니다. 이러한 상황을 변화시키고자 홍단단 설립자 정샤오지에(Zheng Xiaojie)는 2006년 '영혼의 눈 도서관(Eyes of the Soul Library)' 프로젝트를 시작했습니다. 정샤오지에 설립자는 젊은 시각장애인들의 요구에 따라 다양한 주제의 오디오북 제작 아이디어를 얻었습니다. 당시에는 전문 녹음 장비가 부족하여 컴퓨터와 어린이 프로그램용 마이크를 사용하며 기본적인 오디오 파일을 제공하는 수준이었지만, 현재는 마이크로소프트 애저를 통해 중국 전역 105개 학교의 시각장애 학생들에게 콘텐츠를 제공하고 있습니다. 또한, 홍단단 자체 앱과 위챗 미니 프로그램을 통해 1,000개 이상의 타이틀을 이용할 수 있습니다. 마이크로소프트는 약 15년간 홍단단과 파트너십을 유지하며 기술 지원을 제공해 왔습니다. 특히 이번 AI 음성 서비스는 이전에는 상상할 수 없었던 기술로, 마이크로소프트의 책임감 있는 AI 원칙에 따라 투명성, 공정성, 책임성, 개인 정보 보호 및 보안을 최우선으로 고려하여 개발되었습니다. 리나 동 씨는 현재 중국 전매대학교에서 합성 음성 생성 및 활용에 대한 연구를 진행 중입니다. 그녀는 "시각장애인으로서 기술 발전은 제 삶을 변화시켰습니다."라고 말하며, 마이크로소프트의 AI 음성 기술에 대해 "일반적인 합성 음성보다 실제 목소리를 훨씬 더 잘 시뮬레이션합니다. 톤 변화와 같은 세부적인 부분들이 매우 뛰어납니다."라고 평가했습니다. 그녀는 이상적인 오디오 목소리는 따뜻하고 명확하며 자신감과 애정이 느껴져야 한다고 덧붙였습니다. 동 씨와 정 설립자는 '영혼의 눈 도서관'이 시각장애인들의 교육 및 취업 기회를 개선하는 데 중요한 역할을 할 뿐만 아니라, 자신감과 자립심을 심어주는 연결감을 제공한다는 점을 강조합니다. 정 설립자는 "많은 시각장애인들이 인터넷 시대의 기회를 포착하고 자신에게 맞는 직업과 위치를 찾을 수 있게 되었습니다. 우리는 그들에게 지식을 습득하고 세상을 알 수 있는 통로를 제공합니다. 목소리의 동반자는 그들과 세상 사이의 거리를 없애주었고, 많은 이들이 더 긍정적이고 자신감 있게 되었습니다. 더 이상 고립감이나 세상에 대한 두려움을 느끼지 않고, 스스로 많은 것을 할 수 있다고 믿게 되었습니다."라고 말했습니다.

관련 기사