카카오가 지식 기반의 일반 대화와 추론 모드를 모두 지원하는 하이브리드 멀티모달 언어모델을 통해 자체 AI 기술의 우수성을 지속 입증했다. 카카오(대표이사 정신아)는 지난 5일 가벼운 일상 대화부터 논리적 사고가 필요한 복잡한 문제 해결까지 하나의 모델로 처리할 수 있는 자체 개발 신규 AI 모델 'Kanana-v-4b-hybrid'의 성능을 공개했다고 밝혔다. 새로운 모델은 지난해 7월 허깅페이스를 통해 오픈소스로 공개한 'Kanana-1.5-v-3b'를 토대로 개발됐다. 단순히 이미지를 텍스트로 변환하거나 이를 설명하는 수준을 넘어 사람처럼 정보를 종합하고 계산하며 스스로 검산하는 자기 점검 과정을 거치는 것이 특징이다. 이를 통해 인공 지능 모델이 가진 환각 현상을 최소화할 수 있으며, 이 밖에도 복잡한 형태의 표나 영수증, 수학 문제 등 까다롭고 복합적인 문제나 상황에서 발생하기 쉬운 계산 실수나 조건 누락을 획기적으로 줄이고 정확도를 한층 높였다. Kanana-v-4b-hybrid 모델의 높은 성능을 위해 카카오는 단계별로 정교하게 설계된 학습 과정을 적용했다. ▲기초 학습 ▲장문 사고 사슬(Long CoT) ▲오프라인 강화학습 ▲온라인 강화학습으로
아무리 많은 데이터를 학습해도 인공지능(AI)은 사람의 의도를 정확히 이해하지 못하는 경우가 많다. 사람의 선호를 반영하기 위해 활용되는 비교 학습 방식 역시 판단이 모호한 상황에서는 오히려 AI를 혼란스럽게 만드는 한계가 있었다. KAIST는 전기및전자공학부 김준모 교수 연구팀이 인간의 선호를 효과적으로 반영하면서도 데이터 효율성과 학습 안정성을 크게 높인 강화학습 프레임워크 ‘TVKD(Teacher Value-based Knowledge Distillation)’를 개발했다고 17일 밝혔다. 기존 AI 학습 방식은 ‘A가 B보다 낫다’는 식의 선호 비교 데이터를 대량으로 수집해 모델을 학습시키는 구조였다. 이 과정에서 많은 데이터가 필요하고, 선호 판단이 불명확한 경우 학습 안정성이 떨어진다는 문제가 지속적으로 제기돼 왔다. 연구팀은 이러한 한계를 극복하기 위해, 사람의 선호를 먼저 충분히 학습한 ‘교사(Teacher) 모델’이 핵심 정보를 ‘학생(Student) 모델’에 전달하는 방식을 제안했다. 이는 복잡한 내용을 정리해 설명해 주는 가정교사와 유사한 개념으로, 연구팀은 이를 ‘선호 증류(Preference Distillation)’라고 명명했다. T
3D 포인트 클라우드(Point Cloud) 기반 인공지능(AI) 모델이 학습해야 하는 데이터량을 크게 줄이면서도 성능을 유지할 수 있는 기술이 개발됐다. 자율주행차와 로봇 등 대규모 3D 데이터를 다루는 분야에서 학습 시간과 연산 비용을 줄이는 데 큰 도움이 될 것으로 기대된다. UNIST 인공지능대학원 심재영 교수팀은 3D 포인트 클라우드 데이터를 효과적으로 압축해 학습 효율을 높이는 ‘데이터 증류(dataset distillation)’ 기술을 개발했다고 1일 밝혔다. 데이터 증류는 대규모 학습 데이터에서 핵심 특징만을 추출해 ‘요약 데이터’를 만드는 기술이지만, 3D 포인트 클라우드는 점의 순서가 정해져 있지 않고 물체가 회전된 경우가 많아 적용이 어려운 형태로 꼽혀 왔다. 요약 데이터의 완성도를 높이려면 원본 데이터와 비교·매칭 과정이 필수지만, 이러한 특성 때문에 엉뚱한 부위가 비교되거나 같은 물체도 서로 다른 물체로 인식되는 문제가 발생한다. 연구팀은 이 문제를 해결하기 위해 두 가지 핵심 기술을 결합했다. 첫째, 순서가 일정하지 않은 점 데이터의 의미 구조를 자동으로 정렬해주는 손실 함수(SADM)를 적용했다. 둘째, 물체의 회전 각도를 AI가
AI 전문기업 바이브컴퍼니는 13일 서울 한남동 본사에서 생성AI 선도인재양성사업 2025년도 성과공유회를 열고 산학협력을 통해 추진한 2년차 연구성과를 공개했다고 밝혔다. 과학기술정보통신부와 정보통신기획평가원이 주관하는 생성AI 선도인재양성 사업은 2027년까지 총 145억 원 규모의 예산이 투입되는 국가 연구개발 사업이다. 바이브컴퍼니는 2024년 주관기관으로 선정돼 고려대, 서울대, 국민대, 연세대 등과 함께 생성AI 기반 응용 기술과 인재양성 연구를 진행해왔다. 이번 성과공유회에서는 바이브컴퍼니의 사업 운영성과, 대학별 연구 성과, 내년도 계획 발표 등이 진행됐다. 고려대학교 연구팀은 멀티모달 모델의 환각 문제를 개선한 Tri-layer Contrastive Decoding 기술을 선보였다. 이 기술은 모델 내부 층별 인식 특성을 조정해 추가 학습 없이도 사실 기반 정확도를 향상시키는 방식으로, 글로벌 벤치마크 POPE, MME, AMBER에서 정확도 최대 10% 향상, 환각률 최대 38% 감소 성과를 기록했다. 또한 자연어처리 분야 최고 권위 학회인 EMNLP 2025에 채택되며 연구 성과를 인정받았다. 서울대학교는 통계정보 검색 및 시각화 기술을,
보통 그림과 글자가 함께 있을 때 사람의 시선이 그림에 먼저 가는 것처럼, 여러 감각을 동시에 활용하는 ‘멀티모달 인공지능’도 특정 데이터에 더 크게 의존하는 경향이 있다. KAIST 연구진은 이러한 한계를 극복해, 그림과 글자를 모두 고르게 인식해 훨씬 더 정확한 예측을 가능케 하는 새로운 멀티모달 인공지능 학습 기술을 개발했다. KAIST는 전기및전자공학부 황의종 교수 연구팀이 다양한 데이터 유형을 한 번에 처리해야 하는 멀티모달 인공지능이 모든 데이터를 고르게 활용할 수 있도록 돕는 새로운 학습 데이터 증강 기술을 개발했다고 14일 밝혔다. 멀티모달 인공지능은 텍스트, 영상 등 여러 데이터를 동시에 활용해 판단하지만, 기존 AI 모델은 특정 정보(예: 텍스트 또는 이미지)에 치우쳐 판단하는 경향이 있었다. 이로 인해 예측 정확도가 떨어지고, 실제 환경에서의 일반화 성능이 제한되는 문제가 있었다. 연구팀은 이러한 편향을 해결하기 위해 일부러 서로 어울리지 않는 데이터를 섞어서 학습에 사용했다. 이를 통해 인공지능은 특정 데이터에만 의존하지 않고, 글과 그림, 소리 등 모든 정보를 균형 있게 활용하는 방법을 학습하게 된다. 또한 품질이 낮은 데이터는 보완하
더에스엠씨가 포항공과대학교(POSTECH) 인공지능연구원과 손잡고 생성형 AI 공동 연구에 나선다. 양 기관은 25일 산학 공동 연구 협약(MOU)을 체결하고, 생성형 AI 기반 기술 개발과 산업 적용을 가속화하기 위한 협력 체계를 마련했다고 밝혔다. 이번 협약은 생성형 AI가 콘텐츠 산업을 비롯해 다양한 산업 분야에 빠르게 확산하는 가운데, 학계와 산업계의 긴밀한 협력을 통해 국내 디지털 생태계를 고도화하고 글로벌 경쟁력을 확보하는 것을 목표로 한다. 양측은 앞으로 AI 데이터 확보 및 핵심 기술 공동 개발, 인력 및 기술 자원 교류, AI 기반 공동 연구 프로젝트 발굴, 기술 사업화 협력 등 다각적인 협업을 이어갈 계획이다. 더에스엠씨는 구글, 메타, X 등 글로벌 플랫폼의 공식 파트너사로, 생성형 AI를 콘텐츠 제작과 마케팅 자동화에 접목해 차별화된 역량을 보유하고 있다. 특히 업계 최초로 ‘AI Labs’, ‘AI Studio’와 같은 전문 조직을 운영하며, AI 기술을 실제 콘텐츠 제작 현장에 적용해 왔다. 포항공대 인공지능연구원은 국내 최고 수준의 AI 연구 기관으로 평가받으며, 이론 연구를 넘어 산업 응용과 실증 기반 연구에 강점을 지니고 있다.
엔비디아 젠슨 황 CEO “투자는 미국 과학의 토대 만들고 경제·기술 리더십 강화해” 미국 로렌스버클리국립연구소(Lawrence Berkeley National Laboratory)가 차세대 슈퍼컴퓨터 ‘다우드나(Doudna)’를 공개했다. 이 슈퍼컴퓨터는 엔비디아의 새로운 베라 루빈(Vera Rubin) 아키텍처를 기반으로 구축됐으며, 미국 고성능 컴퓨팅(HPC) 분야의 선도적 위치를 강화하기 위한 핵심 투자다. 다우드나는 노벨상 수상자이자 크리스퍼 유전자 가위 기술의 선구자인 제니퍼 다우드나(Jennifer Doudna)의 이름을 따 명명됐다. 미국 에너지부(Department of Energy, DOE)의 후원 아래 개발된 이 시스템은 과학적 발견을 가속화하고, 글로벌 도전에 대응하기 위한 최첨단 연구 도구로 활용될 전망이다. 젠슨 황(Jensen Huang) 엔비디아 CEO는 “지속적인 투자는 미국 과학의 토대이자 경제와 기술 리더십을 강화하는 힘”이라며 다우드나의 출범 의미를 강조했다. 제니퍼 다우드나 역시 “다우드나의 탄생은 생물학이 중요한 전환기에 접어들고 있다는 상징적 의미를 지닌다”고 소감을 밝혔다. 다우드나는 기존 슈퍼컴퓨터와 달리 시뮬레이
[헬로티] 미디어젠은 포항공과대학교 인공지능연구원과 ‘AI 데이터 기반 공동연구 및 사업화 협력 추진’ 관련 상호 협력 양해 각서를 체결했다고 밝혔다. ▲포항공대 인공지능연구원 전경 미디어젠과 포항공대 인공지능연구원은 AI 공동 연구 및 사업화 과정에서 인공지능 데이터 확보와 기술 고도화를 위해 협력해 각 기관이 보유한 기술, 데이터, 인력 등을 적극적으로 활용할 계획이다. 이를 통해 AI 기술 개발을 가속화하고 원천 기술을 발굴해 인공지능 분야 기술 경쟁력 향상에 주력할 예정이라 전했다. 미디어젠은 음성 및 언어 AI 전문 연구소인 남즈(NAMZ) 연구소를 운영하고 있다. 또한 다양한 인공지능 학습을 위한 음성 데이터 수집을 수행하면서 인공지능 데이터 확보를 해왔다. AI 음성인식 기술을 활용한 스마트 콜봇, 인공지능 영어 교육, 공항철도 스마트 음성 발권 서비스 등을 진행하고 있다. 포항공대 인공지능 연구원은 인공지능, 빅데이터, 사물 인터넷 등 미래 핵심 기술을 중점적으로 연구하며 교육과 연구의 융합 시너지 효과를 바탕으로 산업체와 적극적으로 협력해 새로운 산학협력 모델을 창출하고 있다. 고훈 미디어젠 대표는 “세계적인