AI학습용 데이터 구축도 노하우가 필요하다
AI학습용 데이터 구축도 노하우가 필요하다
  • 강영호 기자
  • 승인 2020.11.02 14:01
  • 댓글 0
이 기사를 공유합니다

[공학저널 강영호 기자] 최근 한국판 뉴딜 사업의 발표로 주목을 받고 있는 데이터 라벨링에 대한 관심이 매우 높다.

AI(인공지능) 시대 핵심은 바로 데이터로 꼽힌다. 뛰어난 AI 알고리즘이더라도 양질의 데이터 없이는 학습이 불가능하기 때문이다. AI학습을 통한 서비스, 기술의 고도화를 위해서는 수많은 양질의 데이터가 뒷받침돼야 한다.

이러한 양질의 데이터는 향후 스마트시티를 비롯해 자율주행, 스마트팩토리, 스마트안전 등 AI로 수행할 수 있는 다양한 서비스모델의 기반이 될 전망이다.

과학기술정보통신부는 이러한 고품질의 학습 데이터를 ‘스마트 데이터’로 정의하고, AI를 계속 성장시킬 수 있는 스마트 데이터 플랫폼을 개발하기 위해 최근 ‘AI 학습용 데이터 구축 사업’을 시행하고 있다.

AI 학습용 데이터 구축 사업은 코로나19로 촉발된 경기침체에 대응하기 위해 중소벤처, 스타트업, 학계 등 민간의 인공지능 기술과 서비스, 관련 산업을 육성하는 사업이다. 양질의 AI 데이터를 구축·활용해 데이터 선순환 환경을 조성하고, AI 선도국가로 도약하기 위한 취지로 기획됐다.

지역의 수요를 반영한 자유주제 AI 학습용 데이터 선정 과정을 거쳐 이번 사업에 선정된 ㈜미디어그룹사람과숲은 산업안전 AI데이터 구축을 맡아 수행 중이다.

항공 활주로 내 이상 물체 감지를 위한 객체 데이터와 공사현장 안전장비 인식 데이터, 화재 발생 예측 데이터를 구축하고 있으며, 이미지, 영상데이터를 주축으로 객체인식 기술과, AI데이터셋 구축, 사전예측 알림 시스템까지 데이터를 기반으로 다양한 기술과 서비스, 비즈니스모델을 개발 중이다.

특히 미디어그룹사람과숲은 오랜 노하우로 적립된 데이터 구축 프로세스를 보유하고 있다.

데이터수집부터 가공, 데이터의 검증과 AI 응용서비스 개발·활용까지 단계적이고 체계적인 프로세스를 통해 다양한 사업 모델을 제시하고 있다.

각 단계·분야별 전문가를 구성해 향후 AI 알고리즘 개발과 품질 관리 방안까지 가이드라인을 통해 데이터 품질을 검증하는 것이 특징이다.

미디어그룹사람과숲은 지난 20년간 개방형 데이터와 VR·AR(가상·증강현실) 데이터 구축, 아카이브 시스템 개발 전문 기업으로 입지를 다져왔다.

특히 한국정보화진흥원(NIA)이 주관하는 ‘자율주행을 위한 인식기술개발용 영상 DB 개방 사업’(2018년)과 ‘한국형사물이미지 AI 데이터 구축’(2019년) 등을 수행하며 AI 산업 관련 데이터셋을 민간과 학계, 연구기관에 개방하는 역할을 해왔다.

미디어그룹사람과숲이 그간 구축한 공개 DB는 산업·기술 분야 외에도 사회문화적 성장 동력으로도 작용할 수 있다.

지난 2019년 ‘한국형사물이미지 AI 데이터 구축’ 과제를 통해 국가지정 유적건조물(탑, 성곽, 가옥 등) 260만장, 상품(신발, 가방, 지갑, 잡화 등) 80만장, 35개 도시 랜드마크 20만장, 총 360만장의 빅데이터를 구축했다. 이를 통해 한국 정서에 맞춘 AI 데이터 구축과 서비스 강화에 기여했다는 평가를 받고 있다.

미디어그룹사람과숲 장희돈 이사(사진)는 “올해를 기점으로 데이터구축·AI기술과 서비스 개발 기업으로서의 도약을 위해 착실히 준비 중”이라며 “대한민국의 양질의 데이터를 구축해 AI 산업의 발전에 크게 기여하는 게 목표”라고 전했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.