데이터 어노테이션, AI로 손쉽게
데이터 어노테이션, AI로 손쉽게
  • 김하늬 기자
  • 승인 2020.06.18 17:06
  • 댓글 0
이 기사를 공유합니다

[공학저널 김하늬 기자] 시장조사 기업 IDC에 의하면 세계 데이터 시장 규모는 올해 2100억 달러(약 242조원)로 팽창하며, 세계 데이터의 양도 지난 2016년 16제타바이트(ZB)에서 오는 2025년 163ZB로 10배 이상 증가할 것으로 전망되고 있다.

많은 기업에서는 데이터의 효과적인 활용과 데이터를 기반한 다양한 서비스 제공에 기대를 걸고 있지만, 데이터의 수집·분석부터 가공까지의 과정은 결코 쉬운 일이 아니다.

기업에서 데이터가 없다고 하는 것은 사실 데이터 자체의 부족보다는 ‘어노테이션(Annotation·주석 작업)’된 데이터의 부족을 의미한다. 때문에 의미 있는 데이터의 가공은 데이터 산업의 핵심이라고 할 수 있다.

많은 AI기업의 개발 프로세스는 데이터 확보/관리, 데이터 어노테이션, AI학습, 서비스화로 분류된다. 보통 기업의 인적자원은 개발조직, 연구조적, 사업조직으로 나뉘어 있어 데이터 어노테이션을 수행할 조직이 부족한 것이 현실이다.

데이터 사이언티스트가 AI프로젝트에 투입되는 시간의 총 비율에서 데이터 준비 시간은 80%이며 그중 어노테이션의 비중은 25%을 차지한다.

AI기업에서 데이터 어노테이션까지 직접 진행할 경우, 프로젝트마다 어노테이션 Tool을 개발하거나 일시적인 작업 인력을 충원/교육/관리해야 하는 등, 그 비용이 외주 이용보다 훨씬 높아진다.

또한, 수만개의 데이터에 라벨링을 해야 하는 어노테이션 작업에 기술력이 없으면, 단순 노동 집약적 업무가 되기 때문에 빠른 시간 내에 저 비용으로 어노테이션을 하기 위해서는 AI의 도움이 필요하다.

동일한 AI모델 기준으로 데이터 투입량에 따른 정확도 차이 약 18%라는 연구결과에서 볼 수 있듯이 AI는 연구만으로는 불가하며, 학습 데이터가 많을수록 정확도가 높아진다.

점차 AI가 고도화되면서 세분화 된 어노테이션 데이터의 필요성이 증가하고, 그 주기도 짧아질 전망이다. 이에 따라 산업 경쟁이 치열해질수록 어노테이션 수요가 확장될 것으로 예측되고 있다.

이러한 상황을 효과적으로 개선해 최근 주목받는 기업으로 떠오른 ㈜에이모(AIMMO)는 자체적인 어노테이션 tools, 내부 전문 작업 인력, 외부 Crowd 작업 인력, 품질 관리 프로세스 등 어노테이션에 적합한 환경을 갖추고 있어, 빠른 시일 내에 대량의 데이터를 고품질로 어노테이션하는 작업을 수행하는 기업이다.

에이모의 tools은 이미지, 비디오, 3D Point Clouds, 텍스트, 음성 등의 다양한 비정형 데이터를 어노테이션할 수 있다는 장점을 갖고 있다.

특히 단순히 raw-data를 가공하는 것이 아니라, 고객사의 AI 솔루션/엔진의 방향에 대한 이해에서 출발하기 때문에 많은 기업들의 니즈를 다양하게 반영할 수 있다는 측면에서 눈길을 끌고 있다.

에이모의 비즈니스 영역은 AI 필수 3요소인 Model, Computing Power, Big Data 중 데이터를 어노테이션해 스마트 데이터로 가공하는 데 주력하고 있다.

이를 통해 에이모는 지난 2019년 말 기준 40여개 파트너사와 다양한 데이터에 대한 프로젝트를 진행, 1억 건(instance 기준)이 넘는 어노테이션 실적을 달성했다.

향후 에이모는 자체 개발 플랫폼에서 고객들이 tools을 활용해 직접 어노테이션을 할 수 있는 엔터프라이즈 버전을 상반기 출시할 예정이다. 민감정보로 반출이 불가한 데이터, 혹은 직접 학습데이터를 생산하는 기업에게 도움이 될 것으로 기대를 모으고 있다.

에이모 오승택 대표이사(사진)는 “AI 확대의 걸림돌이 될 수 있는 스마트 데이터 비즈니스 영역을 커버해 다양한 산업 부문에서 AI가 더욱 상용화될 수 있도록 기여하겠다”며 “이를 위해 에이모는 고객의 데이터 유형에 맞게 다양한 어노테이션 tools와, AI를 활용한 효율적인 어노테이션 tools를 지속적으로 개발하고 있다”고 말했다.

그는 이어 “데이터의 필요성과 활용성에 대한 방안으로 정부가 주관하는 공공사업, AI 스타트업과 중소기업들의 학습 데이터 확보를 지원하고 있다”며 “이와 같은 지원사업에 학습 데이터 수요 기업들이 에이모의 어노테이션 서비스를 이용한다면 좋은 기회가 될 것“이라고 덧붙였다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.