국내 연구진이 개발한 시각지능 구현 핵심 알고리즘, 오픈소스로 풀린다

최태우 기자 / 기사승인 : 2019-12-12 13:05:13
  • -
  • +
  • 인쇄
ETRI, 학습용 데이터세트 약 10만장 분량도 추가 배포
▲ ETRI 연구진이 개발한 SC-FEGAN 기술을 이용해 악세사리를 착용하지 않았던 사진에(왼쪽) 간단한 스케치를 통해 자연스럽게 귀고리를 착용한 사진으로 만든 모습(오른쪽) [사진=ETRI]

[IT비즈뉴스 최태우 기자] 한국전자통신연구원(ETRI)이 사물 인식, 행동 추적과 같은 시각 인공지능(AI) 구현에 필요한 핵심기술인 백본 네트워크(VoVNet)와 편집 프로그램 없이 사물을 실제와 비슷하게 모사하는 편집기술(SC-FEGAN)을 공개했다. 시각 AI 구현에 필요한 학습용 데이터세트 약 10만장 분량도 추가 공개했다.


ETRI가 이번에 공개하는 백본 네트워크는 사진 속 객체의 특징을 찾아내 정보를 추출-분석하면서 인공신경망으로 모델을 만들어내는 기술이다. 사물의 검출이나 객체 부분별 분할인식, 안면인식 등 다양한 기능을 구현할 수 있어 시각지능 구현을 위한 필수기술이다.

연구진이 공개하는 또 하나의 핵심기술은 편집 프로그램 없이도 사진 속의 사람 얼굴을 편집할 수 있는 기술(SC-FEGAN)이다. 올해 2월 깃허브(Github)에 오픈소스로 공개한 초기 버전에서 업데이트됐다.

얼굴 사진에 특화돼 다양한 편집이 가능한 알고리즘으로 인공 데이터를 만들고 이를 판별해 현실과 비슷한 이미지를 모사하는 딥러닝 기법 중 하나인 갠(GAN) 기술이 사용됐다.

GAN은 이미지를 합성하거나 변환하는데 효과적이지만 사용자의 의도나 조건 등을 반영하지 못한다는 단점이 있었으나, ETRI 연구진은 기술을 보완해 입력값을 넣어 원하는 결과를 낼 수 있도록 개발했다고 설명했다.

시각지능을 학습하는데 필요한 높은 품질의 데이터도 공개했다. 공개된 데이터세트는 전봇대, 신호등, 자동차 등 CCTV에 주로 녹화되는 도심환경에 주로 등장하는 사물 이미지로 구성됐다. 지난해 관련 자료를 공개해오면서 현재 공개된 누적 데이터세트는 약 20만장 수준이다.

ETRI 박종열 시각지능연구실장은 “국내 시각지능 기술이 급속도로 성장하고 있지만 외국 의존도가 높아지고 있어 관련 기술을 공개해 국내 산·학·연이 경쟁력 있는 기술을 확보하고 생태계 조성을 위해 적극 지원할 예정”이라고 밝혔다.

연구진은 향후 시각지능 핵심 기반 기술과 고품질의 데이터를 지속 공개하는 한편, 얼굴 뿐 아니라 냉장고, 가구 등 다른 객체를 대상으로도 쉽게 편집을 할 수 있도록 기술 고도화를 추진할 계획이다.

 

[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS