[독자AI 대전] 네이버클라우드 "텍스트 넘어 시각·청각 통합…모두를 위한 AI 실현"

[아이뉴스24 윤소진 기자] “인공지능(AI)이 현실 세계의 문제를 해결하기 위해서는 텍스트 기반 이해를 넘어 시각, 청각 등 다양한 감각을 통합적으로 활용할 수 있어야 한다.”

성낙호 네이버클라우드 하이퍼스케일AI 기술총괄이 30일 오후 서울 코엑스에서 열린 독자AI 프로젝트 1차 발표회에서 1차 개발 성과를 발표하고 있다. [사진=윤소진 기자]

성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 30일 오후 서울 코엑스에서 열린 ‘독자 AI 파운데이션 모델’ 프로젝트 1차 발표회에서 ‘옴니(Omni) 모델’ 개발 전략을 공개하며 이같이 밝혔다.

성 총괄은 “옴니 모델은 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 이해하고 추론할 수 있는 모델”이라며 “AI가 글로만 세상을 배운 상태로는 실제 문제 해결에 한계가 있다”고 말했다. 그는 거대 언어 모델(LLM)을 두고 “책만 읽고 공부한 두뇌와 같다”며 “세상을 보고, 듣고, 만지는 경험이 함께 학습돼야 현실을 통합적으로 이해할 수 있다”고 설명했다.

네이버클라우드는 이러한 문제의식 아래 기존 멀티모달 방식과 달리, 처음부터 모든 감각을 하나의 모델에서 공동 학습하는 네이티브 옴니모달 구조를 선택했다. 성 총괄은 "텍스트 모델에 이미지나 음성 모듈을 덧붙이는 방식은 산업 현장에서 구축 비용과 복잡도가 급격히 커진다”며 “하나의 모델이 입력을 직접 이해하는 구조가 실용성 측면에서 훨씬 유리하다”고 강조했다.

이날 네이버클라우드는 지난 8월부터 약 4개월간 개발한 독자 AI 1차 성과로 텍스트·이미지·오디오를 단일 모델에서 학습한 ‘HyperCLOVA X SEED 8B Omni’와, 추론 능력에 시각·음성·도구 활용 역량을 결합한 ‘HyperCLOVA X SEED 32B Think’를 공개했다. 두 모델은 모두 오픈소스로 제공된다.

네이버클라우드는 이 모델을 기반으로 제조, 농업, 금융, 국방 등 산업 영역의 적용 방향과 함께 AI 마음 케어, 보이스 스타일러, 이미지 변환 서비스 등 일상 영역에서의 활용 사례도 제시했다. 성 총괄은 “감정 공감형 AI, 음성 변환 AI, 이미지 생성 AI는 기술이 연구 단계를 넘어 일상으로 스며들 수 있음을 보여주는 사례”라고 말했다.

향후 확장 전략으로는 데이터 차별화와 글로벌 적용을 제시했다. 성 총괄은 “AI는 데이터를 지능으로 전환하는 기술이며, 소버린 AI는 각 국가의 고유한 데이터를 가장 잘 이해하고 활용할 수 있을 때 경쟁력을 갖는다”며 “지도와 공간 정보 같은 물리적 맥락 데이터를 결합한 월드 모델을 기반으로 로봇, 자율주행 등 현실 세계와 직접 연결된 서비스로 확장해 나갈 것”이라고 밝혔다.

그는 이어 “네이버클라우드는 이미 일본, 태국, 사우디아라비아 등에서 각국의 환경과 문제에 맞는 AI 서비스를 적용·확장하고 있다”며 “소버린 AI는 국내에 머무는 개념이 아니라 글로벌로 확장될 수 있다”고 말했다.

성 총괄은 “‘모두를 위한 AI’는 단일 파운데이션 모델로 완성되지 않는다”며 “이를 뒷받침하는 인프라와 AI 에이전트, 서비스 플랫폼이 유기적으로 결합돼야 한다”고 강조했다. 이어 “AI는 누구나 쉽게 접근할 수 있어야 하며, 국가 산업 경쟁력을 근본적으로 강화하는 방향으로 발전해야 한다”고 덧붙였다.

/윤소진 기자(sojin@inews24.com)

[독자AI 대전] 네이버클라우드 "텍스트 넘어 시각·청각 통합…모두를 위한 AI 실현"

텍스트, 시각·청각 등 다양한 감각 통합…‘옴니 모델’ 전략 발표
HyperCLOVA X 옴니·추론 모델 2종 오픈소스 공개
모델성능·비용효율성·실용성 확보한 '소버린AI' 개발

주요뉴스

댓글 쓰기 ^제목 [독자AI 대전] 네이버클라우드 "텍스트 넘어 시각·청각 통합…모두를 위한 AI 실현"

댓글-

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순

텍스트, 시각·청각 등 다양한 감각 통합…‘옴니 모델’ 전략 발표 HyperCLOVA X 옴니·추론 모델 2종 오픈소스 공개 모델성능·비용효율성·실용성 확보한 '소버린AI' 개발

주요뉴스새로고침

댓글 쓰기 제목 [독자AI 대전] 네이버클라우드 "텍스트 넘어 시각·청각 통합…모두를 위한 AI 실현"

뉴스톡톡 인기 댓글을 확인해보세요. 정렬 인기순 최신순

텍스트, 시각·청각 등 다양한 감각 통합…‘옴니 모델’ 전략 발표
HyperCLOVA X 옴니·추론 모델 2종 오픈소스 공개
모델성능·비용효율성·실용성 확보한 '소버린AI' 개발

주요뉴스

댓글 쓰기 ^제목 [독자AI 대전] 네이버클라우드 "텍스트 넘어 시각·청각 통합…모두를 위한 AI 실현"

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순