국산 AI데이터로, 자연스러운 한국어 대화 가능해진다
국산 AI데이터로, 자연스러운 한국어 대화 가능해진다
  • 김하늬 기자
  • 승인 2021.07.08 09:24
  • 댓글 0
이 기사를 공유합니다

[공학저널 김하늬 기자] 최근 인공지능(AI) 기술 분야에서도 복합대화 기술은 전 세계적인 추세다. 과거 기계 중심 입력 방식에서 인간 중심의 자연스러운 입력 방식으로 기술이 진화하고 있다.

복합대화 기술은 음성, 표정, 동작, 제스처 등 둘 이상의 요소를 사용해 통합적 맥락을 인식, 표현하는 AI 대화 처리 기술이다. AI와 인간 소통에 있어 영상, 텍스트, 음성 등 각 단일 모달을 융·복합한 방식으로, 단일 모달 성능의 한계를 보이는 AI와의 의사소통 문제를 개선했다는 점에서 눈길을 끌고 있다.

멀티모달 인터페이스는 텍스트 외에도 음성, 제스처, 시선, 표정, 생체신호 등 여러 입력 방식을 융합해 인간과 컴퓨터 사이에 자연스러운 의사소통이 가능한 사용자 친화형(user- friendly) 기술이라고 할 수 있다.

감정과 동작을 표현하는 멀티모달 대화를 위한 상호 작용 표현기술, 몰입감을 높이고 정확한 의미 파악을 지원하는 복합 데이터 기반 정보 추출·추론 기술을 그 예시로 들 수 있다.

한국전자기술연구원(KETI)에서는 지난 2017년부터 영상·음성·자연어 딥러닝 모델을 멀티모달 정보로 추상화해 내용 파악, 필요한 정보를 선제적으로 제공하는 자율지능 디지털 동반자 연구를 진행 중이다.

상황 인지를 기반으로 하는 대화 중심 인간로봇 교류 엔진 연구에서도 복합 데이터 입출력을 통한 대화 관리와 대화 흐름 제어 기술 개발이 중점적으로 이뤄지고 있다.

영상, 음성 등 다양한 형식의 데이터를 입력받아 각종 상황이해 관련 정보를 산출해 활용하며, 로봇을 통한 발화와 제스처를 동시에 표현하는 멀티모달 교류 제어 기술 개발을 통해 AI 기술의 인간 수준의 교류와 소통을 지원 중이다.

최근 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 ‘인공지능학습용 데이터 구축사업을 통해 KETI는 한국 드라마·영화를 대화 중심으로 분석해 21시간 10분 분량의 데이터셋을 구축, 동영상 클립에 다양한 의미정보를 저장, 인공지능 멀티모달 분석·표현 기술 연구에 활용할 수 있도록 공개했다.

일반적으로 기업 등에서 서비스 개발을 목적으로 사용하는 영상처리용 데이터는 외국 공개 데이터를 활용한다. 국내 환경을 반영하지 못한 데이터로 인해 해외 데이터로 구축된 국내 AI 기술은 편향성과 차별성을 보이고 있다.

이러한 국내 AI 공개 데이터의 한계를 극복하기 위해 KETI는 AI 연구 환경을 지원하고, 한국어·국내 인공지능 전문가의 지속적인 확대를 위해 정부 차원의 중장기적 인공지능 공개 데이터 확대와 공개 데이터의 질적 개선에 활용할 계획이다.

국내에서 축적된 이러한 복합대화 데이터는 영상 기반 객체 인지, 영상 기반 이미지 설명 자동 생성 기술, 스토리텔링, 대화 모델, 성별 분류, 나이 인식, 감정 인식 등에 활용 가능하다.

이를 위해 KETI는 최근 최첨단 언어처리 모델 ‘KE-T5’를 공개했다.

언어모델은 대용량 텍스트로부터 자기 지도 학습(Self-supervised learning) 방식으로 범용적 의미를 미리 학습해 모델화하고 이를 다양한 언어처리 태스크에 활용하는 AI 모델링 방식이다.

KE-T5는 구글 언어모델 알고리즘 T5를 기반으로 구축한 언어처리 모델로 한국어와 영어처리에 모두 활용할 수 있는 자기지도학습 방식 이중 언어처리 모델이다.

KE-T5는 최초의 한국어 데이터 중심 T5 계열 모델이자 언어의 의미 인식 특성과 표현 특성을 모두 포함하고 있다는 점에서 특징적이다.

AI 소수학습(Few-shot learning)을 지원해 소수 학습데이터만으로 다양한 언어처리에서 높은 성능을 보이기 때문에 구축비용 대비 활용성이 높다.

KETI는 텍스트 종류와 학습 규모에 따라 16종의 모델을 무상으로 배포해 개발자가 개발환경과 엔진 특성에 따라 선택해서 활용할 수 있도록 했다.

KETI 인공지능연구센터 신사임 센터장(사진)은 “영어 중심의 사전학습 언어처리 기술은 그동안 높은 구축비용으로 기업에 부담이었다”며 “KE-T5 규모를 계속해서 대형화 하고 있고 결과물을 지속적으로 공개해 원천 언어처리 기술 분야 발전과 사업화 지원을 위해 앞장설 것”이라고 전했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.