구글 클라우드, 카카오브레인에 초거대 AI 언어 모델 개발 역량 강화


클라우드 TPU로 거대 모델 학습 프로세스 구축

[아이뉴스24 박진영 기자] 구글 클라우드는 카카오의 인공지능(AI) 연구 자회사 카카오브레인이 구글 클라우드의 맞춤형 머신러닝 하드웨어 '클라우드 TPU'를 도입해 초거대 AI 언어 모델 'KoGPT'의 연구개발 역량을 강화했다고 26일 발표했다.

구글 클라우드 로고 [사진=구글 클라우드]

카카오브레인이 최근 공개한 KoGPT는 미국의 AI 연구기관 오픈AI가 개발한 딥러닝 기반 자연어처리(NLP) AI 모델 'GPT-3'의 한국어 특화 버전이다.

KoGPT 모델을 학습시키는 데에는 수십억 이상의 데이터와 모델 파라미터(매개변수)가 활용됐다.

카카오브레인은 대규모 데이터 및 모델 학습에 적합한 리소스를 확보하기 위해 기존의 GPU 서버 환경에 클라우드 TPU를 추가로 도입했다.

'클라우드 TPU'는 구글 클라우드 AI와 맞춤형 고속 네트워크를 기반으로 기업의 혁신을 가속화한다.

카카오브레인은 클라우드 TPU를 도입해 대규모 모델 학습 시 발생하는 네트워크 병목 현상을 해결하고 60억 개의 파라미터와 2천억 개 토큰에 달하는 한국어 데이터를 빠르게 처리했다.

이를 통해 언어 모델 연구 및 개발에 소요되는 시간을 단축하고 효율적인 모델 학습 프로세스를 구축할 수 있었다.

뛰어난 사용 편의성과 확장성 역시 카카오브레인이 클라우드 TPU를 선택한 중요한 요소였다고 회사측은 설명했다.

특히, 최소한의 코드 변경으로 최대 2천48개의 연산 노드까지 손쉽게 확장할 수 있다. 또 별도의 인프라를 설치할 필요 없이 퍼블릭 클라우드 환경에서 모든 시스템을 사용할 수 있기 때문에 KoGPT의 개발 시간과 비용을 동시에 절감할 수 있었다.

카카오브레인은 향후 클라우드 TPU를 활용해 텍스트, 이미지, 오디오 등 다양한 의사소통 채널을 활용한 멀티모달 모델을 연구개발할 계획이다.

나아가 기억의 저장 및 학습된 지식 갱신 등 기존 딥러닝 모델의 한계를 극복하는 연구를 통해 사회 문제 해결에 노력할 예정이다.

김일두 카카오브레인 대표는 "구글 클라우드에서 제공하는 클라우드 TPU는 딥러닝에 최적화되어 있어 짧은 기간 안에 고효율의 학습 파이프라인을 구축할 수 있었다"며 "구글 클라우드와 지속적으로 협력해 초거대 AI 모델의 연구 효율을 한층 더 끌어올릴 예정"이라고 밝혔다.

최기영 구글 클라우드 코리아 사장은 "앞으로도 구글 클라우드의 강력한 AI 및 머신러닝 인프라를 기반으로 한국 기업과 연구 기관이 다양한 분야에서 혁신을 가속화할 수 있도록 적극 지원하겠다"고 강조했다.

/박진영 기자(sunlight@inews24.com)







포토뉴스