
플럭스.1 콘텍스트 모델을 RTX GPU에 최적화하기 위해 텐서RT와 양자화 기술 도입
엔비디아가 생성형 이미지 모델 고도화를 위해 세계적인 AI 연구소 블랙 포레스트 랩스와 손잡았다. 양사는 '플럭스.1 콘텍스트(FLUX.1 Kontext)' 이미지 모델을 엔비디아 RTX GPU에 최적화해 직관적이고 빠른 이미지 생성 및 편집 환경을 제공한다고 밝혔다.
플럭스.1 콘텍스트는 텍스트와 이미지 프롬프트를 모두 지원하며, 캐릭터 일관성 유지, 부분 편집, 스타일 전환, 실시간 피드백 등 고급 편집 기능을 내장한 오픈 웨이트 기반 생성 모델이다. 기존에는 컨트롤넷 등 복잡한 구성요소를 조합해야 했지만, 플럭스.1 콘텍스트는 단일 모델로 자연어 기반의 고급 이미지 생성과 편집을 지원한다.
엔비디아는 이 모델을 RTX GPU에 최적화하기 위해 텐서RT와 양자화 기술을 도입했다. 그 결과 VRAM 요구 사항은 낮추고 추론 속도는 2배 이상 높여, RTX 기반 로컬 환경에서도 고성능 이미지 생성을 구현하도록 했다. FP8 양자화는 RTX 40 시리즈에, FP4 양자화는 RTX 50 시리즈에 각각 최적화했으며, SVD퀀트(SVDQuant)를 활용해 모델 크기 축소와 품질 유지의 균형을 맞췄다.
플럭스.1 콘텍스트는 현재 컴피UI(ComfyUI)와 자체 플레이그라운드에서 바로 사용 가능하며, 8월에는 엔비디아 NIM 마이크로서비스 버전도 출시될 예정이다. 고급 사용자를 위한 샘플 코드와 데모디퓨전(DemoDiffusion) 리포지토리도 조만간 공개된다.
이 모델은 특히 시각적 콘셉트를 기반으로 창작의 방향성을 자연스럽게 안내할 수 있어, 디자이너와 콘텐츠 제작자들이 보다 창의적으로 작업할 수 있는 환경을 제공한다. 블랙 포레스트 랩스는 모델의 모든 가중치를 허깅페이스 플랫폼에 공개하며, 텐서RT 최적화 버전 역시 함께 제공 중이다.
한편, 엔비디아는 지난주 공개된 구글의 소형 언어모델 ‘젬마 3n(Gemma 3n)’도 RTX GPU 및 젯슨(Jetson) 플랫폼에서 실행 가능하도록 최적화해 엣지 AI와 로보틱스 분야에서도 AI 가속화의 저변을 넓히고 있다. 오는 7월 17일까지 G-어시스트 플러그인 해커톤을 통해 맞춤형 AI 도구 제작을 장려하고 있다.
이번 협업은 생성형 이미지 편집 기술이 전문가 중심에서 대중으로 확장되는 데 중요한 전환점이 될 것으로 보이며, 엔비디아는 향후에도 고성능 AI 컴퓨팅 인프라와 오픈 생태계를 기반으로 생성형 AI 대중화를 가속화할 계획이다.
헬로티 서재창 기자 |