[아이뉴스24 정유림 기자] 페이스북 운영사 메타가 음성 언어 4천개 이상을 식별하고 약 1천100개 언어를 음성에서 텍스트(글), 또는 텍스트에서 음성으로 변환해주는 대규모 다국어 음성인식(MMS) 인공지능(AI) 모델을 오픈소스로 공개했다고 24일 밝혔다.
메타 측은 "기존 음성 인식 모델은 최대 100여 개 언어만을 지원하는 한계가 있었는데 이번에 공개하는 AI 모델은 음성-텍스트 변환 및 텍스트-음성 변환이 가능한 언어의 수를 기존 100여 개에서 1천107개로 10배 가량 확대했다"며 "음성으로 식별 가능한 언어 수도 4천개 이상으로 약 40배 늘렸다"고 설명했다.
메타 자체 분석 결과, 음성 변환 언어 수를 61개에서 1천107개로 18배 가량 늘렸을 때 문자 오류율은 0.4% 증가하는데 그쳤다. 오픈AI의 음성인식 모델 위스퍼와 유사 비교를 수행한 결과, 메타의 AI 모델은 단어 오류율을 절반으로 줄이면서 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다고 강조했다.
메타코리아 관계자는 "AI는 메타의 다양한 제품과 서비스의 기반이자 메타버스를 향한 중장기적 비전 실현의 근간이 되는 핵심 기술"이라며 "AI 인프라스트럭처 구축과 AI 모델 고도화, 디지털 마케팅 경험 개선 등 3가지 분야에 집중해 AI에 대한 연구와 투자를 이어가고 있다"고 밝혔다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기