LG AI연구원이 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 ‘CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식) 2023’에서 이미지 검색 시장에 변화를 가져올 ‘캡셔닝 AI(Captioning AI)’를 처음 공개했다. ‘생성형 AI’ 상용화 서비스인 ‘캡셔닝 AI’는 ‘인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI’로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다. LG AI연구원은 AI가 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 ‘제로샷 이미지 캡셔닝(Zero-shot Image Captioning)’ 기술을 적용했다. ‘제로샷 이미지 캡셔닝’은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경, 인물, 행동 등 이미지 상의 다양한 요소와 특징을 인식하고, 그 관계를 이해하고 설명할 수 있게 하는 기술이다. ‘캡셔닝 AI’는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다. ‘캡셔닝 AI’는 문장이나 단어의 길이
지난해에 이어 올해 1만 명 이상의 AI 전문가가 참여할 것으로 예상돼 구글, 애플, 테슬라, 네이버, 카카오 등 굴지의 기업들이 캐나다 밴쿠버에서 열리는 세계 최대 인공지능(AI) 학회에 모여 AI 인재 영입에 나선다. 업계에 따르면, 현지시간 18일부터 22일까지 캐나다 밴쿠버에서 열리는 '국제 컴퓨터 비전 및 패턴 인식 학회(CVPR) 2023'에 117개 기업과 기관이 부스를 차리고 AI 인재 채용에 나선다. CVPR는 세계 최대 공학 학술단체인 국제전기전자공학회(IEEE)와 국제컴퓨터비전재단(CVF)이 공동 주최하는 컴퓨터 비전 분야 세계 최대 학회다. 올해 발표되는 논문만 2359개에 달하며, 지난해에 이어 올해에도 1만 명 이상의 AI 전문가가 참여할 것으로 전망된다. 이들 인재의 채용 기회를 열어주기 위해 본 학회 행사와 함께 20일부터 22일까지 열리는 엑스포는 IT 기업들이 자신들의 최신 기술을 소개하며 AI 인재를 영입하기 위한 각축장이 된다. 올해도 구글, 애플, 아마존, 퀄컴, 메타 등 세계적 IT 기업들이 엑스포에 부스를 차릴 예정이다. 여기에 비전 AI 응용기술로 자율주행이 주목받으며 테슬라, 아마존 자율주행 스타트업 죽스도 가장
스트라드비젼은 오는 6월 19일부터 24일까지 미국에서 개최되는 ‘2022 컴퓨터 비전 및 패턴 인식 컨퍼런스(이하 CVPR)’에 참석해 비전 인식 기술 공유와 인재 영입에 나선다고 밝혔다. CVPR은 세계 최대 기술 전문 단체인 전기전자공학자협회(IEEE)와 비영리 재단인 컴퓨터 비전 협회(CVF)가 1983년부터 공동 주최하는 컨퍼런스로, 인공지능(AI) 분야에서 가장 영향력 있는 국제학술대회다. 세계적인 연구기관들과 기업들이 컴퓨터 비전과 딥러닝 등 AI 분야에서의 새로운 기술과 연구 성과에 대해 논의한다. 이번 컨퍼런스는 19일부터 24일(현지시간)까지 미국 루이지애나주 뉴올리언스 모리얼 컨벤션 센터와 온라인에서 개최된다. 스트라드비젼은 지난 2019년 CVPR 워크샵에 참여해 자사의 딥러닝 기반 객체 인식 소프트웨어 솔루션을 선보였으며, 강봉남 박사의 ‘Hierarchical Feature-Pair Relation Networks for Face Recognition’로 최우수 논문상을 수상한 바 있다. 특히 올해는 6월 21일부터 23일까지 사흘간 ‘CVPR 엑스포’에서 현장 부스를 운영하며 스트라드비젼의 글로벌 인지도를 강화함과 동시에 비전 인식