배너
닫기

산업동향

배너

[2015 머신비전세미나] 딥러닝, 지능화로 사람 수준 근접…인식률 97%

  • 등록 2014.12.30 14:49:21
URL복사

컴퓨터 비전을 위한 딥러닝


딥러닝은 컴퓨터 인공지능 학습법 중의 하나이다. 딥러닝은 컴퓨터가 알아들을 수 있는 형태로
표현하고 이를 학습에 적용하기 위해 많은 연구가 진행되고 있으며, 이러한 노력의 결과로
딥 뉴럴 네트워크, 딥 빌리프 네트워크, 콘벌루션 뉴럴 네트워크와 같은 다양한 딥러닝
기법들이 컴퓨터비전 분야에 적용되어 최첨단의 결과들을 보여주고 있다.
딥러닝은 구글이 앞서가고 있으며, 최근 페이스북이 연구팀을 인수하거나 자체 개발팀을
운영하면서 바짝 추격하고 있다. 딥러닝 기술이 어디까지 왔는지,
KAIST 김준모 교수가 머신비전 세미나에서 발표한 내용을 정리했다.


▲ 김준모 교수


물체인식(Object Recognition)이란 영상 내의 객체가 무엇인지 인식하는 것을 말한다.
그러나 물체인식은 아직 사람 얼굴을 잘 구별 못 한다. 같은 물체라도 보는 각도와 조명에 따라 다른 결과물이 나온다. 또한, 크기, 변형, 배경 잡음에 따라 다르게 보여 진다. 이러한 문제를 해결하기 위해 지금도 연구 진행 중이다.


딥러닝 이전 시대 물체 인식… 구글리스가 대표적


물체인식 애플리케이션 중 가장 중요한 분야가 이미지 서치(Image Search)이다.
인터넷에서 보고 싶은 이미지를 검색하는 기능인데, 대표적으로 구글 이미지가 있다. 초창기 구글 이미지는 물체인식이 잘 안 되었기 때문에 텍스트를 치면 웹페이지 검색을 통해 해당 이미지를 연결해 주었다. 요즘엔 기술 성능이 좋아지면서 물체인식이 가능해졌다.
또 다른 애플리케이션으로는 개인이 소장하고 있는 디지털 콘텐츠 관리이다. 여행을 다니며 많은 사진을 찍어왔을 때 PC 기반 구글 피카사를 이용하면 자동으로 인식·태킹·분류할 수 있다.
다음으로 이미지 기반 검색이다. 구글리스가 대표적이며, 이미 안드로이드 모바일 폰에 탑재되어 있다.
딥러닝 이전 시대에 등장한 구글리스는 사진을 찍어서 그것으로 인터넷 검색할 수 있는 기능이다. 상품로고(OCR 코드), 바코드, 관광지 랜드마크 등을 검색할 때 주로 사용되며, 자동차, 고양이, 아이스크림 등은 검색이 불가능하다.
물체인식 기술 동향을 살펴보면, 2001년에는 간단한 필터 뱅크를 사용하여 얼굴 특징을 추출함으로써 실시간(15프레임/sec) 얼굴 검출이 가능했다.
얼굴 검출 기술은 지금은 성숙된 기술이 되었고 디지털카메라의 오토 포커스 기능에 활용되고 있다.
얼굴인식 기술은 딥러닝 이전 시대로 보면, 조명이 컨트롤된 경우 인식률은 99% 이상이었으나, 조명이 컨트롤 되지 않은 경우는 인식률이 92%로 낮아졌다.
물체인식도 딥러닝 이전 시대는 101개의 물체 중에 “이것이 무엇인지 맞춰보라”고 했을 때 정확히 맞출 확률은 63%로 10번 중의 4번은 오답이었다. 물체인식 기술의 풀어야 될 과제이다.


딥러닝이란


그렇다면 딥러닝이란 무엇인가? 우선, 정의를 내려 보면 딥 네트워크(딥 뉴럴 네트워크)를 트레이닝해서 어떤 일을 하는 절차이다. 여기서 딥 네트워크(Deep Network)란 인풋과 아웃풋 사이에 숨어 있는 히든 레이어가 2개인 것을 말하며, 히든 레이어가 없거나 1개면 쉘로우 네트워크(Shallow Network)이다.
뉴럴 네트워크의 역사를 보면, 1세대(1958년~)는 퍼셉트론(perceptron) 방식이었고, 2세대(1986년~)는 멀티레이어 퍼셉트론 방식이었다. 이때는 정답이 틀린 에러를 역전파함으로써 뉴럴 네트워크를 훈련시키는 기술이었다. 즉, 쉘로우 네트워크를 사용하고 있었다.
20년이 지나서야 3세대(2006년~)인 딥러닝이 나왔다. 힐튼 교수에 의해 소개된 딥 빌리프네츠(Deep Belief Nets)였다.
그 후 1989년에 얀 리쿤과 그의 동료들은 오류역전파 알고리즘에 기반하여 우편물에 손으로 쓰여진 우편번호를 인식하는 딥 뉴럴 네트워크(Deep Neural Network)를 소개했다. 최근에는 콘벌루션 뉴럴 네트워크(Convo-lutional Neural Network) 기반의 딥러닝 알고리즘이 뛰어난 성능을 발휘하고 있다.


구글·페이스북 양강구도


딥러닝의 최근 이슈는 아무래도 스탠포드대학의 앤드류 Ng 교수와 구글이 함께한 딥러닝 프로젝트 ‘구글 브레인’일 것이다.
이 프로젝트는 뉴럴 네트워크가 유튜브 비디오를 보는 것만으로 ‘고양이’와 같은 높은 수준의 콘셉트를 인식할 수 있게 된 것으로 유명하다. 실험에서 앤드류 Ng 교수는 16,000개이 컴퓨터 프로세스와 10억 개 이상의 뉴럴 네트워크 그리고 딥 뉴럴 네트워크를 이용하여 유튜브에 업로드 되어 있는 1000만 개 넘는 비디오 중 고양이 인식에 성공했다.
구글 브레인이라는 프로젝트에서 알 수 있듯이 구글은 딥러닝 분야에 앞서나가고 있다. 2012년 12월에 레이 커즈와일이 풀타임 엔지니어링 디렉터로 구글에 합류했고, 2013년 3월에는 힐튼 교수의 회사 DNN리서치가 구글에 인수합병 됐다. 또한, 2014년 1월에는 딥마인드 테크놀로지스를 6,500억 원에 구글이 인수했다.
최근 인공지능의 새로운 강자로 떠오르고 있는 페이스북이 구글의 독주에 도전장이 냈다. 페이스북은 딥러닝 전문가 마르크스 아우렐리오 랑자또를 구글에서 스카우트했고, 2013년에는 딥러닝의 대가인 얀 리쿤 교수를 AI Lab 헤드로 채용했다. 얀 리쿤 교수는 딥러닝 창시자 3명 중의 한 명이다. 페이스북은 딥러닝을 사용하여 뉴스 피드와 페이스북의 ‘킬러 앱’(killer app)인 최근 업데이트 개인 목록(persona-lized list of recent updates)을 더 발전시킬 수 있다고 보았다.
또한, 딥러닝은 사용자들이 사진들을 정리하고 페이스북에 올릴 사진을 선택하는 것도 도와줄 수 있을 것으로 기대했다. 한편 페이스북은 최근 얼굴인식을 사람 수준만큼 잘할 수 있는 ‘CVPR 2014’를 소개했다. CVPR 2014는 97%의 인식률을 보인 것으로 알려졌다.
그 외에도 마이크로소프트, 바이두, IBM 등도 연구팀을 인수하거나 자체 개발팀을 운영하면서 업적들을 만들어 내고 있다.


정리 임근난 기자 (fa@hellot.net









배너










주요파트너/추천기업