저사양의 기기에서도 거대언어모델(LLM)을 구동하는 최적화 서비스 공식 오픈 기존 하드웨어 교체 없이 빠른 추론 속도와 높은 성능 구현 ‘눈길’ 노타가 거대언어모델(LLM) 최적화 서비스를 공개했다. 이번 서비스는 저사양의 기기에서도 거대언어모델(LLM)을 구현하는 기술로, 디바이스 사양에 관계 없이 LLM과 시각언어모델(VLM)을 최적화하는 점이 특징이다. 사측은 모델의 성능은 유지하면서도 빠른 추론 속도를 가능하게 하는 것을 핵심 강점으로 내세운다. 해당 기술은 생성형 AI(Generative AI)가 하드웨어에 빠르게 적용되는 시장 환경에 맞춰, 클라우드 및 온디바이스(On-device) 환경 등에서 자유롭게 구동된다. 노타 측은 가전제품·모빌리티 등 하드웨어 교체 비용이 부담되는 기업들이 최신 성능의 LLM 서비스를 도입하게 됐다고 강조했다. 또한 다양한 칩셋에서 호환이 가능하고, 복잡한 파라미터를 가진 LLM의 높은 최적화 난이도에 대응할 수 있다. 경량화를 통해 메모리·연산 효율을 향상시키고, LLM 사용에 따른 디바이스 전력 및 클라우드 운영 비용 절감 효과 또한 강점이다. 더불어 기존 하드웨어를 그대로 활용하기 때문에 별도의 인프라 투자 없이
생성형 AI의 성능을 가르는 핵심 요소로 ‘데이터 품질’이 부상하면서 데이터 전처리 기술의 중요성이 더욱 커지고 있다. 글로벌 시장조사기관 마켓앤마켓에 따르면 AI 학습 데이터 세트 시장은 연평균 27.7% 성장해 2029년 95억 8천만 달러 규모에 이를 전망이다. 시장 확대와 함께 AI의 신뢰도와 정확성은 LLM 자체보다 학습 데이터의 품질에 달려 있다는 점이 부각되고 있다. 잘못된 데이터는 AI의 ‘환각 현상(Hallucination)’을 유발해 결과물의 신뢰도를 떨어뜨리기 때문이다. 이러한 흐름 속에서 사이냅소프트는 AI 문서 구조 분석 솔루션 ‘사이냅 도큐애널라이저’를 효율적으로 공급하고 있다. 이 솔루션은 원본 문서의 구조와 맥락을 분석해 AI가 이해하기 가장 적합한 형태로 데이터를 변환·정제하는 역할을 한다. 단순 텍스트 추출을 넘어 문서의 제목·표·이미지·단락 등 시각적 구성과 논리적 순서를 식별하는 정교한 시각적 구조 분석(VSA) 기술을 갖췄다. 분석된 데이터는 마크다운(MD), JSON 등 정형 데이터로 변환되어 맥락을 보존하면서 LLM 학습 효율을 극대화한다. 사이냅 도큐애널라이저는 이미 다양한 산업 현장에서 활용되고 있다. 최근 한국주
SDT는 오는 9월 30일부터 10월 2일까지 서울 코엑스에서 열리는 ‘코리아랩 어텀 2025’(KOREA LAB Autumn 2025)에 참가해 순수 국내 기술로 개발한 초정밀 연구장비 라인업을 공개한다고 26일 밝혔다. 코리아랩 어텀은 기초과학, 응용과학, 공학, 의학 등 다양한 분야의 연구·실험 장비와 분석 과학기기를 선보이는 전문 전시회다. SDT는 이번 전시에서 외산 장비 의존도가 높은 국내 연구 시장을 겨냥해 ▲실시간 원소분석 장비(LIBS) ▲액침냉각 시스템(AquaRack) ▲초정밀 계측장비 3종(TTMU, CCU, PGU) ▲극저온 냉각기(CryoRack)를 선보인다. LIBS 장비는 레이저 유도 플라즈마 분광 기술을 적용해 고체, 액체, 분말 시료를 전처리 없이 분석하며, 머신비전 기반 입자 모니터링으로 분석 신뢰도를 높였다. AquaRack은 데이터센터와 고성능 컴퓨팅 환경용 액침냉각 시스템으로, GPU 서버를 비전도성 액체에 담가 열을 제어한다. 공랭식 대비 40% 이상 에너지를 절감(PUE 1.2 이하)할 수 있어 AI 연산 환경에 적합하다. 양자 연구 국산화를 위한 계측장비 3종도 공개된다. CCU는 세계 유일의 20채널 동시 계측을
맨디언트 컨설팅(Mandiant Consulting)이 엔드포인트 탐지·대응(EDR) 에이전트가 설치되지 않은 어플라이언스에 BRICKSTORM 백도어를 설치하는 다수의 공격을 탐지·대응했다고 발표했다. 이번 사례는 UNC5221 및 중국 연계 위협 행위자들이 연루된 것으로 추정되며 고급 포렌식 회피 기법과 멀웨어 변형을 활용해 평균 393일간 탐지되지 않은 채 유지된 점이 특징이다. 이러한 공격은 법률회사·SaaS 제공업체·기술기업 등 핵심 인프라를 겨냥해 지속적 액세스를 확보하고 가치 있는 지적재산권(IP)과 민감 데이터를 탈취하는 데 목적을 둔다. 조사 결과 공격자들은 VMWare vCenter·ESX 호스트 등 새로운 장치 플랫폼을 악용했고 메모리 내 변조, 맞춤형 드로퍼, 난독화 기법을 통해 탐지를 회피한 정황이 확인됐다. 백도어는 장기간 액세스를 유지하도록 설계돼 시작 스크립트 변조와 백도어 배포로 초기 대응을 회피했으며 이 과정에서 피해 조직의 권한을 확보해 해당 권한이 SaaS 고객으로 확장되거나 향후 제로데이 취약점 발굴에 악용될 수 있다는 위험 신호도 포착됐다. 이번 공격의 배후로 지목된 UNC5221은 과거 ‘실크 타이푼(Silk Typh
위블록, ‘코리아블록체인위크’서 RWA 투자 플랫폼 MVP 2 전격 공개 아발란체 협력 첫 결실, 테스트넷 기반 부동산 투자 시뮬레이션 구현 핀테크 기업 위블록(WeBlock)이 국내 최대 블록체인 행사인 ‘코리아블록체인위크 2025(KBW 2025)’에서 자사의 두 번째 최소기능제품(MVP 2)을 공개하며 국내 실물자산(RWA) 토큰화 시장의 선도적 입지를 강화했다. 이번에 선보인 MVP 2는 지난해 9월 글로벌 블록체인 플랫폼 아발란체(Avalanche)와 체결한 기술 협력 MOU 이후 첫 성과물로, 아발란체 테스트넷 환경에서 구현됐다. 사용자는 스테이블코인을 활용해 실물 부동산 투자 과정을 안전하게 시뮬레이션할 수 있으며, 복잡하게 느껴질 수 있는 RWA 투자 경험을 직관적이고 간단하게 체험할 수 있도록 설계됐다. 시뮬레이션 기초 자산은 글로벌 F&B 브랜드가 장기 임차 중인 프라임급 상업용 건물이다. 안정적인 임대 수익과 낮은 공실률을 기반으로, 일반 투자자도 디지털 환경에서 신뢰성 있는 ‘건물주 경험’을 체감할 수 있도록 한 것이 특징이다. 단순한 기술 실험을 넘어 실질적 가치에 기반한 투자 패러다임을 제시했다는 점에서 업계의 주목을 받고 있
데이터브릭스가 오픈AI와의 전략적 협력을 통해 글로벌 기업에 프론티어 AI를 제공한다. 데이터브릭스는 26일 오픈AI와 다년간 파트너십을 체결하고 데이터브릭스 데이터 인텔리전스 플랫폼(Data Intelligence Platform)과 자사 AI 제품인 에이전트 브릭스(Agent Bricks)에 오픈AI 모델을 네이티브로 통합한다고 밝혔다. 이번 협업 규모는 1억 달러(약 1천4백억 원)로, 데이터브릭스를 사용하는 전 세계 2만여 고객사 모두가 오픈AI 모델을 멀티 클라우드 환경에서 즉시 활용할 수 있게 됐다. 이번 협력을 통해 기업은 데이터브릭스 에이전트 브릭스를 기반으로 오픈AI 최신 모델 GPT-5를 프로덕션 환경에서 사용할 수 있다. GPT-5는 코딩, 수학, 글쓰기, 추론 전반에서 최고 성능을 제공하는 모델로 고객사는 자사 거버넌스 데이터와 결합해 고품질 AI 애플리케이션과 에이전트를 개발, 평가, 확장할 수 있다. 특히 데이터 이동 없이 기존 데이터 환경에서 즉시 활용 가능하다는 점이 차별점이다. 기업들은 데이터 분석과 실행, 복잡한 워크플로우 자동화, 보안과 거버넌스 기준 충족 등 다양한 과제를 동시에 해결해야 한다. 데이터브릭스는 오픈AI 모델
클라우데라는 델 테크놀로지스와 협력해 공동 솔루션 ‘AI-in-a-Box’를 고도화했다고 26일 밝혔다. 이번 고도화는 클라우데라 데이터 플랫폼과 델 오브젝트스케일(Dell ObjectScale)을 통합해 확장성, 거버넌스, 비용 효율성을 강화한 프라이빗 AI 시스템을 구현한 것이 특징이다. AI 도입의 가장 큰 장애물은 다양한 데이터 저장 위치와 복잡한 접근 구조다. 클라우데라의 ‘AI의 진화: 기업용 AI와 데이터 아키텍처의 현황’ 조사에 따르면, 글로벌 리더는 프라이빗 클라우드(63%), 퍼블릭 클라우드(52%), 데이터 웨어하우스(42%)를 활용하고 있었고, 국내 리더는 프라이빗 클라우드(55%), 퍼블릭 클라우드(51%), 온프레미스 분산(48%)을 사용하는 것으로 나타났다. 클라우데라는 데이터가 분산돼 있으면 안전성과 일관성이 떨어져 AI 워크로드 적용과 의사결정이 어려워진다고 지적했다. 이에 따라 델과 함께 모든 정형·비정형 데이터를 단일 저장소에 모아 빠르고 안전하게 접근할 수 있는 환경을 제공한다. 클라우데라 사용자는 델 오브젝트스케일을 AI 워크로드에 최적화된 S3-호환 객체 스토리지로 활용할 수 있다. 클라우데라는 자사의 데이터 플랫폼과
에퀴닉스가 AI 서밋을 열고 차세대 AI 혁신을 지원하는 분산형 AI 인프라(Distributed AI Infrastructure)를 공개했다. 이번 발표에는 ▲분산형 AI 구축을 위한 전용 백본 ▲글로벌 AI 솔루션 랩 ▲패브릭 인텔리전스(Fabric Intelligence)가 포함됐다. 기업이 에이전틱 AI 등 차세대 AI 툴을 도입하려면 기존 IT 아키텍처에 대한 재검토가 필요하다. 에퀴닉스의 분산형 AI 인프라는 자율적 추론과 학습이 가능한 지능형 시스템을 지원하도록 설계됐다. 에퀴닉스는 전세계 77개 시장, 270개 이상 데이터센터를 연결하는 네트워크를 보유해 대규모 워크로드를 처리할 수 있는 환경을 제공한다. 존 린 에퀴닉스 최고 비즈니스 책임자는 “AI가 분산되고 동적으로 진화하는 상황에서 안전하고 효율적인 대규모 연결이 관건”이라며 “에퀴닉스 플랫폼은 데이터를 사용자와 더 가까운 곳으로 이동시켜 기업이 기회를 신속히 활용할 수 있도록 돕는다”고 말했다. 패브릭 인텔리전스는 AI 및 멀티클라우드 워크로드를 지원하는 소프트웨어 계층으로, 2026년 1분기 출시될 예정이다. 이 기능은 에퀴닉스 플랫폼에 실시간 인식과 자동화를 더해 AI 오케스트레이션
씨이랩 XAIVA Cloud (출처 : 씨이랩) 씨이랩은 소상공인을 위한 클라우드형 AI CCTV 서비스 ‘엑스아이바 클라우드(XAIVA Cloud)’를 공식 출시했다고 26일 밝혔다. 엑스아이바 클라우드는 기존 매장 CCTV에 AI 영상 분석 기술을 적용해 보안 이상 징후 감지부터 운영 데이터 분석까지 제공하는 매장 관리 솔루션이다. 야간 침입, 진열물 파손, 고객 안전사고 발생 시 점주는 카카오 알림톡과 앱 푸시를 통해 실시간 알림을 받을 수 있다. 씨이랩은 자사 영상 데이터 처리 기술을 적용해 평균 99% 탐지 정확도와 프레임당 0.01초 미만의 분석 속도를 구현했다. 장시간 CCTV 영상을 직접 확인하지 않아도 매장 내 상황을 즉시 파악할 수 있어 운영 효율성과 안전성을 높일 수 있다는 설명이다. 서비스는 보안 기능을 넘어 출입 인원수, 시간대별 혼잡도 등 경영 지표도 함께 제공한다. 이를 통해 소상공인은 매장 운영 전략을 수립하고 매출 증대에 필요한 데이터를 활용할 수 있다. 비용 측면에서도 기존 CCTV 장비를 그대로 활용할 수 있어 초기 설치 부담이 없고, 별도 약정이나 위약금 없이 월 구독형 요금제로 이용 가능하다. 기존 CCTV 서비스 대비
정밀 계측 기술 분야에서 국내 산학 협력의 새로운 모델이 등장해 주목된다. 아미텍코리아(Ametek Korea) Zygo 사업부와 국민대학교 글로벌 선도연구센터(ERC)가 공동으로 주최한 ‘Zygo Certified Testing Lab’ 지정 행사가 9월 성공적으로 마무리됐다. 이번 지정은 한국 내 정밀 측정 기술 발전과 글로벌 경쟁력 강화를 위한 중요한 이정표로 평가된다. 이번 행사는 국민대 창의공과대학 학장이자 ERC 로봇 기능성 스킨 및 초감각 연구센터를 이끄는 임시형 교수, 신소재공학과 홍승현 부교수, Zygo 본사의 Kurt Redlitz 기술 부사장, 최영환 Zygo 코리아 지사장, 권용재 과장 등이 참석한 가운데 진행됐다. 행사에서는 정밀 계측 기술이 미래 산업 혁신을 뒷받침할 핵심 역량임이 강조됐으며 학계와 산업계의 협력 강화가 향후 글로벌 표준화를 이끄는 기반이 될 것이라는 전망이 제시됐다. 이번 협력으로 양 기관은 로봇 분야 첨단 스킨 및 미세구조 정밀 측정, 차세대 이차전지 표면 분석을 중심으로 공동 연구를 본격화한다. 특히 Zygo의 간섭계 현미경 기반 초정밀 3차원 비접촉 솔루션을 국내 연구 현장에 도입함으로써 산업계 전반의 정밀 계
‘오디오투페이스’ 오픈 소스 공개...게임·3D 아바타 제작 가속화 엔비디아가 게임 및 3D 애플리케이션의 아바타 제작을 지원하는 얼굴 애니메이션 기술 ‘오디오투페이스(Audio2Face)’를 오픈 소스로 공개했다. 오디오투페이스는 음성의 억양과 음소를 분석해 실시간 얼굴 애니메이션과 립싱크를 생성하는 기술로, 게임과 고객 서비스용 3D 캐릭터 제작에 활용된다. 해당 기술은 오디오 입력을 기반으로 표정과 감정을 정밀하게 구현해 캐릭터가 사람처럼 대화하고 반응할 수 있게 한다. 엔비디아는 이번에 오디오투페이스 모델과 소프트웨어 개발 키트(SDK), 훈련 프레임워크까지 오픈 소스로 공개했다. 이를 통해 개발자는 엔비디아의 기존 모델을 각자의 서비스 환경에 맞게 미세 조정하거나 맞춤형 애플리케이션을 구현할 수 있다. 학생, 연구자, 독립 개발자 역시 최신 코드에 접근해 학습과 연구, 응용 개발에 활용할 수 있다. 이미 업계에서는 오디오투페이스를 활용한 사례가 늘고 있다. 컨바이(Convai), 코드마스터즈(Codemasters), 인월드 AI(Inworld AI), 넷이즈(NetEase), 리얼루전(Reallusion), 퍼펙트월드 게임즈(Perfect World
AMD가 보안 중심 엔터프라이즈 AI 기업 코히어(Cohere)와 글로벌 협력을 확대한다고 24일 밝혔다. 이번 협력 강화로 코히어 고객들은 ‘커맨드 A(Command A)’, ‘커맨드 A 비전’, ‘커맨드 A 번역 모델’, ‘노스(North)’ 등 주요 AI 제품군을 AMD 인스팅트(Instinct) GPU 기반 인프라에서 활용할 수 있다. 이를 통해 전 세계 기업과 소버린 AI 프로젝트는 성능과 총 소유 비용(TCO) 측면에서 더 많은 선택지를 확보하게 된다. AMD는 코히어의 노스 플랫폼을 자사 내부 엔터프라이즈 AI 포트폴리오에 통합할 계획도 밝혔다. 이에 따라 코히어의 기술은 AMD 내부와 엔지니어링 AI 워크로드에서 핵심적으로 활용될 예정이다. 닉 프로스트 코히어 공동 설립자는 “AMD 인스팅트 GPU에서 코히어 모델과 노스를 사용할 수 있게 되면서 협력 관계가 한층 확대됐다”며 “공공과 민간 고객들이 우리의 보안 최적화 AI 제품군을 AMD 인프라에서 실행하면 훨씬 더 큰 유연성을 얻게 될 것”이라고 말했다. 그는 “AMD는 AI 인프라를 통해 매력적인 TCO를 제공하기 때문에 전 세계 소버린 AI 프로젝트에서 중요한 선택지가 될 것”이라고 덧붙
다양한 문제 풀이 궤적과 의도 사례 (출처 : GIST) (왼쪽부터)GIST AI융합학부 김선동 교수, 김세진 박사후연구원, 황산하 석사과정 졸업생, 이승필 석사과정생, 전기전자컴퓨터공학과 이호성 학사 졸업생 (출처 : GIST) 광주과학기술원(GIST) 김선동 교수 연구팀이 사람의 문제 풀이 과정 속 ‘의도’를 추정·정렬하는 학습 알고리즘과 생성모델을 결합해 사람처럼 다양한 풀이 과정을 만들어내는 데이터 증강 기법을 제안했다. 연구팀은 이를 통해 단순 정답 산출을 넘어 인간과 유사한 추론 능력을 갖춘 인공지능을 구현했다고 25일 밝혔다. 기존 인공지능은 주어진 문제의 정답 도출에는 강점을 보였지만, 인간처럼 단계적 사고 과정을 거치는 추론 능력은 부족했다. 연구팀은 인간이 문제 해결 과정에서 겪는 시행착오와 다양한 풀이 전략에 주목했다. 특히 풀이 과정에는 단순한 행동의 나열이 아닌 목표와 전략, 즉 ‘의도’가 담겨 있다는 점에서 착안했다. 연구팀은 문제 풀이 과정을 세분화해 각 단계의 의도를 추정하고 이를 정렬하는 알고리즘을 개발했다. 이어 생성모델 중 하나인 지플로우넷(GFlowNet)을 활용해 다양한 풀이 경로를 생성하는 데이터 증강 기법을 적용했다.
레노버가 중소기업을 위한 새로운 엔터프라이즈급 AI 레디 IT 솔루션을 발표했다. 이번 솔루션은 사전 테스트와 검증을 거친 서버, 소프트웨어, 사용량 기반 가격 모델을 결합해 중소기업이 복잡성 없이 현대적 IT를 도입하고 확장할 수 있도록 지원한다. 안내형 설정과 내장 보안을 통해 노후화된 인프라를 신속히 현대화하며, 도입 첫날부터 기업의 성장과 혁신을 촉진할 수 있다는 점을 강조했다. 중소기업은 제한된 자원으로 AI를 활용해 경쟁력을 유지해야 하는 과제에 직면해 있다. 레노버는 이에 대응해 확장 가능한 솔루션을 제공하며 설치 즉시 성능을 발휘하고 실질적 가치를 구현하는 것을 목표로 한다. 수미르 바티아 레노버 인프라스트럭처 솔루션 그룹(ISG) 아시아태평양 사장은 “오늘날 중소기업은 치열한 경쟁 환경 속에서 비용을 통제하면서 IT를 현대화해야 하는 과제에 직면해 있다. 레노버는 복잡성과 비용이라는 전통적 장벽을 제거하는 솔루션으로 이들이 최신 기술을 따라갈 수 있도록 돕고 있다”고 말했다. 이어 “레노버의 SMB 포트폴리오는 IT의 획득·배포·관리를 단순화해 도입 첫날부터 혁신과 운영 효율을 높인다. 유연하고 안전하며 도입이 쉬운 AI 레디 엔터프라이즈급
세일즈포스가 지난난 24일 서울 롯데월드타워 SKY31 컨벤션에서 ‘AI & CX 페스타 2025’를 개최했다. 이번 컨퍼런스는 자율형 AI 에이전트 플랫폼 ‘에이전트포스(Agentforce)’와 ‘서비스 클라우드’를 중심으로 고객경험 혁신 전략과 산업별 성공 사례를 공유하는 자리로 마련됐다. ‘AI & CX 페스타’는 고객 서비스와 고객경험 분야를 대상으로 한 세일즈포스의 연례 행사다. 올해는 ‘AI가 바꾸는 고객 서비스의 미래’를 주제로 상담 자동화, 고객 데이터 통합, 멀티 채널 운영 등 기업이 직면한 서비스 혁신 과제를 해결하기 위한 실행 전략이 제시됐다. 반복 상담으로 인한 서비스 비효율과 고객 불만 누적 문제를 AI 에이전트로 대응하는 방안이 집중 조명됐다. 행사는 세일즈포스 코리아 박양교 클라우드 영업 부문장의 환영사로 시작됐다. 이어 ‘서비스 에이전트(Agentforce for Service)’의 기능과 운영 사례가 발표됐다. 서비스 에이전트는 음성을 포함한 다양한 채널에서 자율 상담을 수행해 상담원의 부담을 줄이고 고객 응대의 일관성과 만족도를 동시에 강화할 수 있도록 설계됐다. 기업은 이를 통해 고객의 요구에 실시간으로 대응하