[아이뉴스24 장가람 기자]살바토르 달리의 '시간의 지속성'이 'Pop style of the Persistence of Memory(팝아트 스타일의 기억의 지속)' 명령어 하나로 팝아트 형태로 계속해 생성된다. '민달리(minDALL-E)', 카카오브레인의 초거대 인공지능(AI) 기반 이미지 생성모델이 그린 그림이다.
카카오브레인은 17일 오픈 미니 컨퍼런스를 통해 AI, 머신러닝, 메타버스 등 카카오브레인 최신 연구 성과·기술 노하우·미래 비전 등을 공유했다.
우선 처음으로 공개한 민달리는 카카오의 오픈 AI의 달리(DALL-E)를 누구나 접근하기 쉽게 작은 사이즈 모델로 만든 것이다. 1천400만장의 텍스트와 이미지 세트를 사전 학습해, 이용자가 텍스트로 명령어를 입력하면 실시간으로 명령어에 맞는 이미지를 만들어준다.
검색을 통해 이미지를 찾아내는 것이 아니라, AI가 스스로 명령을 이해하고 직접 이미지를 그린다. 민달리는 작품의 장르만 바꾸는 것이 아니라, 새롭게 재해석해 그려낼 수도 있다.
카카오브레인은 이런 인공지능의 발달이 교육과 헬스케어 등의 분야의 난제성 이슈를 많이 해결할 수 있을 것으로 기대 중이다. 인식 모델을 넘어 지능이 배제돼 정답이 정해져 있는 문제 해결에 명확한 답을 내릴 수 있을 것이란 기대다.
김일두 카카오브레인 대표는 "데이터에 대한 인식과 데이터 모델링 기법의 향상은 수많은 경우의 수를 탐색해야 하는 문제를 잘 풀려나가게 할 것"이라며 "단백질 접힘 문제를 포함해 다양한 과학적 난제 등 인류의 발전에 기여할 것"이라고 말했다.
더 나아가 그는 인공지능이 추론까지 가능하면 정말 사람과 같은 인공지능을 만들어 낼 수 있을 것으로 기대했다.
카카오브레인은 이런 상상을 현실화하기 위해 대규모 모델에서도 도전 중이다. 최근에는 60억 파라미터에 한국어 언어 모델을 오픈소스로 공개한 것에 이어서 300억 파라미터의 한국어 언어 모델(KoGPT) 역시 오픈소스로 공개했다. 이미지 생성 모델 민달리 역시도 오픈소스로 이번 주에 공개했다.
KoGPT은 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여주는 모델이다. 예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약 가능하다.
언어 모델과 생성 이미지 생성 모델 등이 섞인 재밌는 사례들을 만들어 내는 것이 향후 목표다.
김 대표는 "많은 자극이 카카오브레인에 그리고 AI 학계 그리고 스타트업들에 필요하다"라며 "많은 스타트업들과 연구 기관에서 관심과 에너지를 모아서 세상을 바꿀 고민을 함께 해나갔으면 좋겠다"라고 발표했다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기