실시간 뉴스



카카오브레인, 사람 닮은 AI로 세상 바꾼다…"교육·헬스케어 진출" [IT돋보기]


"언어모델에 이미지 생성모델 더해 재미있는 사례 만들겠다"

[아이뉴스24 장가람 기자]카카오브레인이 초거대 인공지능(AI)를 활용해 교육과 헬스케어 사업에 진출한다. 글로벌 최대 규모 멀티모달(Multi-modality) 데이터셋 구축과 함께 모델도 함께 공개해, 난제성 이슈 해결에 앞장선다는 목표다.

김일두 카카오브레인 대표가 초거대 AI로드맵을 발표했다. 사진은 김일두 카카오브레인 대표 [사진=카카오브레인]
김일두 카카오브레인 대표가 초거대 AI로드맵을 발표했다. 사진은 김일두 카카오브레인 대표 [사진=카카오브레인]

20일 카카오브레인은 온라인을 통해 기자간담회를 개최해 초거대 AI 로드맵과 핵심 기술 연구 계획, 방향성에 대해 설명했다. 지난 17일 진행한 '오픈 미니 컨퍼런스'의 연장선 상이다.

앞서 카카오는 오픈소스로 초거대 AI 모델 'KoGPT(코지피티)'와 'minDALL-E(민달리)'를 공개했다.

'minDALL-E'는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1천400만장의 텍스트와 이미지 세트를 사전 학습하고 13억개의 파라미터(매개변수, 학습 데이터 저장소)를 가지고 있다.

'KoGPT'는 오픈 AI 언어 모델 GPT-3의 한국어 특화 버전이다. 60억개의 매개변수와 2천억개 토큰(token)의 한국어 데이터를 바탕으로 구축했다.

◆"세상을 바꾸는 기술로 의미 가질 수 있도록 도전"

AI가 인식을 넘어 추론까지 가능해질 경우 여러 난제를 해결해 줄 수 있기 때문이다. 카카오브레인은 신약 개발 역시 AI의 능력이 극대화될 수 있는 분야라고 판단했다.

김일두 카카오브레인 대표는 "단백질 접힘 문제의 경우 대규모 경우의 수를 따져야한다"라며 "올해 단백질 구조가 예측됐다고 하면, 내년에는 구조가 정교화되는 것, 아주 더 복잡한 단백질까지도 예측이 되는 것도 당연히 이뤄질 것"이라고 판단했다.

더 나아가 구조만 예측하는 것이 아니라 물질들끼리 상호작용하는지도 인공지능을 통해서 예측할 수 있을 것으로 봤다.

김 대표는 "AI신약 개발 스타트업에 우리가 50억원을 투자해, 공동 연구 사업을 진행하는 형태로 진행해보려고 한다"라며 "카카오브레인의 AI 역량을 쏟아 아주 중요한 부분부터 AI로 대체해, 신약 개발 프로세스를 간소화시켜 질병에 대응하는 수준을 높이고 삶의 질을 제고하겠다"라고 밝혔다.

최근에 설립된 카카오 사내 독립 기업(CIC) 헬스케어와의 협업점도 적극적으로 모색한다. 이미지와 텍스트를 동시에 이해하는 데이터셋을 활용해 재미있는 사례를 만들어, 고도화 시켜 내년에 대중에게 공개하는 것이 목표다.

김일두 대표는 "사람 같은 AI를 만든다고 하면, 결국은 디지털 휴먼이 되어가는 과정이다"라며 "사람이 해야 하는 역할을 대체하는데 강한 고부가가치를 줄 수 있는 영역이 교육과 헬스케어"라고 강조했다.

다만 교육과 관련해 사업 내용에 대해서는 구체적인 언급을 피했다. 그는 "언어 교육 및 코딩 교육 등에서 AI가 도와줌으로서 큰 혁신을 일으킬 것"이라고 짧게 밝혔다.

이어 "상반기 정도에는 신약 개발 외 초거대 AI를 활용해 준비하고 있는 사업에 대해서도 공개할 수 있을 것"이라고 말했다.

◆'KoGPT' 성능, 네이버 공개 최고 수준 모델보다 높아

'하이퍼클로바'로 초거대 AI 포문을 연 네이버와의 차별점도 밝혔다. 김일두 대표는 "우리는 언어 모델만 하는 것이 아니라, 언어와 이미지를 섞거나 이미지 생성 등 멀티 모델이다"라고 설명했다.

그러면서 "언어모델의 경우 무작정 사이즈를 키우다 보면 속도도 느려지고 연구 개발이나 비용이 증가하는 등의 단점도 늘어난다"라며 "우리는 이 정도 수준이면 쓸 수 있겠다 하는 규모가 있는데, 그 규모의 언어 모델을 타사 최고 크기 규모 언어모델과 비등한 수준으로 만들기 위해 더 노력하고 있다"라고 강조했다.

김 대표는 지난 11월 공개한 한국어 언어 모델 'KoGPT'를 사례로 들며 "우리의 성능이 일부 태스크에서 네이버가 공개한 최고 수준의 모델보다 높기도 하다"라고 덧붙였다.

실용적인 구간에 집중해 현재는 60억 파라미터 혹은 300억 파라미터 모델에 집중하고 있지만, 내년에는 800억 파라미터 모델도 공개한다. 파라미터는 AI가 딥러닝으로 학습한 데이터가 저장되는 곳을 말한다. 많으면 많을수록 정교한 학습을 할 수 있어 AI의 연산 능력을 가늠할 수 있다.

이어 그는 "멀티모달 민달리는 14억개지만, 내부적으로는 10배 더 큰 모델을 연구 중에 있다"라고 덧붙였다.

/장가람 기자(jay@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 카카오브레인, 사람 닮은 AI로 세상 바꾼다…"교육·헬스케어 진출" [IT돋보기]

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스