[아이뉴스24 도민선 기자] 일상에서 인공지능(AI) 비서가 도움을 주는 일이 점점 더 많아지고 있다. 음악감상과 길 안내는 물론이고 음식배달과 교육, 영화 추천 등 용도도 다양하다.
시장을 선점하려는 경쟁도 치열하다. 해외는 물론 국내도 이동통신 3사를 비롯해 네이버, 카카오 등 포털까지 가세한 상태. 저마다 장점을 앞세워 가입자 확보에 총력전을 펼치고 있다.
이중 KT(대표 황창규) AI 스피커 기가지니는 20년 음성연구의 결과물을 반영, 차별화로 국내 사업자 중 가장 많은 이용자 확보에 성공한 경우. AI 기가지니 가입자는 현재 80만명 수준으로 연말까지 150만명 확보가 목표다.
AI서비스는 이용자가 많아질수록 품질이 향상되는 게 특징. 많은 가입자를 자랑하는 기가지니의 진화가 기대되는 대목이다. 그렇다면 현재 KT AI 수준은 어느정도일까.
17일 오전 KT의 AI테크센터가 위치한 서초구 우면동 KT연구개발센터를 찾았다.
KT는 국내 AI생태계를 선도하고 기술을 고도화하기 위해 지난해 7월 이곳에 AI테크센터를 열었다.
건물 2층에 위치한 센터에는 ▲AI 기술 연구와 협력을 위한 AI 크래프트샵(AI Craft Shop) ▲국내외 단말과 서비스를 벤치마킹 할 수 있는 체험 스페이스(Experience Space)▲ AI 교육을 위한 아카데미 라운지(Academy Lounge) ▲ 음성 성능평가실 등을 갖추고 있다. 이 곳에서 KT와 제휴사 개발자들이 AI 연구개발역량을 높이고 있다.
특히 KT는 지난해 AI테크센터를 열며 100억원을 들여 AI연구용 슈퍼컴퓨터를 도입하기도 했다. 100만개 이상의 GPU코어가 들어간 이 컴퓨터는 연산량 기준 세계 400위권에 해당한다.
◆"KT, 20년간 음성대화 연구"
KT는 AI스피커와 결합한 IPTV셋톱박스를 지난해 1월 국내 첫 선보인 바 있다. 뒤이어 AI스피커를 출시하는 등 대상을 확대하는 중이다.
박재형 KT AI테크센터 수석연구원은 "인간이 정보를 인식할 때 시각을 70%, 청각을 20% 정도 사용한다"며, "음성만으로는 부족한 정보를 제대로 전달하기 위해 스피커에 IPTV를 더한 기가지니를 출시하게 됐다"고 말했다.
AI스피커 서비스 핵심은 역시 음성인식 기술이다. 20년 음성대화 등을 연구해온 KT로서는 강점을 지닌 분야다.
현재 KT는 고객센터 등에서 얻은 음성데이터를 STT(Speech-to-text) 기술과 셀바스AI사의 TTS(Text-to-speech) 엔진을 통해 구현, AI서비스를 제공하고 있다.
인간의 말을 기계가 알아듣는 게 STT(Speech to Text), 명령을 해석해 답을 만드는 DM(Dialog Management), 그리고 생성된 답변을 음성으로 변경하는 것을 TTS(Text to Speech)라 할 수 있다. 올 하반기에는 자체 TTS엔진도 도입할 계획이다.
박재형 수석연구원은 "KT는 여러 사업을 수행해오며 20여 년간 음성대화를 연구해왔고, 이것이 음성인식 기술의 바탕이 됐다"고 말했다.
현재 KT는 이 같은 음성인식률이 95% 이상으로 판단하고 있다. 셋톱박스 형태의 경우 TV 소리에 반응할 수 있어 더 정교한 음성인식 기술이 필요하다.
박재형 수석연구원은 "타사 제품과는 달리 IPTV가 결합된 제품이다보니 TV 소리에 AI가 반응할 우려가 있어 상대적으로 둔감하게 세팅해놨다"며, "그동안 수집한 음성데이터에 실내에서 발생하는 잡음을 합성해 인식률을 높이는 연구를 진행하고 있다"고 말했다.
특히 당초 기가지니는 AI스피커와의 자연스러운 대화가 가능하도록 설계됐다. 특히 다른 제품과 달리 AI스피커가 먼저 말을 거는 기능까지 구현했다. 현재 이를 보완하는 연구도 진행중이다.
박 수석연구원은 "지난해 기가지니를 출시할 때 스피커가 먼저 말을 거는 기능을 넣어뒀지만, 고객불만 등 우려가 있어 잠가뒀다"며, "홈IoT로 연동된 도어락 등을 이용하면 능동적인 대화도 시도해볼 수 있을 것"이라고 기대했다.
실제로 최근 AI스피커 이용이 늘면서 오작동 등 관련 이용자 불만도 심심찮게 불거지고 있다. KT 역시 이 같은 문제가 불거질 수 있다는 점에 주목, 기술 고도화에 더욱 신경쓰고 있다.
박 수석연구원은 "이런 사례는 사업자가 더 많은 답변을 하기 위해 벌어질 수 있는일"이라며, "대화를 해석하는 복잡한 과정에서, 보다 넓게 해석을 해서 유사 도메인으로 답변을 하다보니 예상치 못한 일이 벌어질 수 있다"고 분석했다.
이어 "AI면 서비스도 자동으로 만들어야 하는 것으로 생각하기 쉬운데 지금은 AI가 학습만 자동으로 하는 단계이고 서비스까지 만들 수는 없다"고 말했다. AI가 고도화되려면 아직 인간의 손길이 더 필요하다는 얘기다.
KT는 AI서비스를 보다 다양화하기 위해 영어 기능을 추가하고, 오는 7월 호텔용 기가지니 단말도 출시할 예정이다. 외국인 고객인 체크인을 하면 기기 언어를 설정하고, 한국인과 같은 서비스를 제공할 수 있다는 구상이다.
도민선 기자 domingo@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기