닫기

기획특집

배너

[5월의 AI ①] 3천억 대규모 투자 끌어낸 생성형 AI, 실행 전략은?

URL복사


생성형 AI에 대한 바람이 거세게 불고 있다. 전문가들은 챗GPT 등장으로 촉발된 생성형 AI 기술이 단순히 유행에 그치지 않을 것으로 전망한다. 국내에서도 생성형 AI를 새로운 미래 먹거리로 낙점한 분위기다. 지난 4월, 정부는 올해 3901억 원 투자를 통해 생성형 AI 경쟁력 확보에 나섰다. 정부는 구체적인 실행 전략을 공개하며, 업계와 민간에 이익이 돌아가기 위한 목적을 내비쳤다. 



생성형 AI의 잠재력, 대규모 투자 끌어내다 

 

정부는 전문 분야 AI와 한국어 사용 AI 플랫폼 부문 경쟁력 확보를 위해 올해 3901억 원을 투자하겠다고 밝혔다. 지난 4월 과학기술정보통신부(이하 과기정통부)는 대통령 직속 디지털플랫폼정부위원회가 연 ‘디지털플랫폼정부 실현계획 보고회’에서 이러한 내용을 담은 초거대 AI 경쟁력 강화 방안을 발표했다. 

 

민간 기업이 주도하고 정부가 지원하는 초거대 AI 협력 생태계를 구축해 의료, 법률, 상담 등 분야의 AI 응용 서비스를 고도화하고, 2026년까지 AI 생태계 핵심인 서비스형 소프트웨어 기업 1만 개를 육성할 계획이다. 과기정통부는 우선 AI 산업 경쟁력 확보를 위해 데이터, 소프트웨어, 컴퓨팅 자원을 주축으로 한 핵심 인프라 확충에 나선다. 또한, 해외 생성형 AI에 맞서 전문 분야에서 AI 경쟁력을 확보한다. 

 

정부는 내년부터 시작하는 ‘AI 5대 플래그십 프로젝트’에서 법률 의견서나 진료 소견서 작성 지원, 학술 연구에 참고문헌·통계 등 제시, 외국인 대상 한국어 교육 등 분야에서 응용 AI 서비스를 육성한다. 고품질 데이터를 획득-품질관리-활용-재생산하는 데이터 경제 생태계를 목표로 교통, 안전, 에너지, 도시 등 4대 중점 분야가 연결되는 디지털 트윈을 구축한다. 

 

이후 단계적으로 의료, 환경, 행정 등 전 분야로 확대할 계획이다. 국민과 기업 수요는 높았지만 공개하지 않았던 사업자 등록번호, 자동차 등록정보 등 핵심 데이터도 국민이 원하는 방식으로 개방된다. 이뿐 아니라 초거대 생성 AI의 한계 돌파를 위해 학습 능력을 높이고 신뢰성을 강화하는 방향으로 AI 기초 연구도 추진된다. 

 

정부는 올 초 시동을 건 신경망처리장치(NPU) 팜 실증 사업과 K-클라우드 프로젝트를 통해 데이터처리 가속기 등의 컴퓨팅 인프라도 강화할 계획이다. AI 전문인력을 늘리고 역량을 강화하기 위해 올해부터 2027년까지 AI 대학원 등에서 석박사 등 정규과정 인재 6만5000여명을 양성하고 일반 국민 100만 명을 대상으로 초거대 AI 활용 방법을 안내한다.

 

정부는 AI 확산에 따라 디지털 신질서가 필요한 시기라고 보고 범국가 AI 혁신 제도·문화 정착에 힘쓰겠다고도 밝혔다. AI 법제정비단, AI 윤리포럼 운영을 통해 AI 확산에 따른 윤리 이슈 대응 방안을 모색하고 초거대 AI 개발, 활용 측면에서 지식 재산권, 개인정보, 산업 법령과 같은 규제와 일자리 감소 문제 등을 점검할 계획이다. 

 

AI 남용 대비한 ‘개인정보 보호’ 강조

 

개인정보보호위원회(이하 개인정보위)는 디지털플랫폼정부위원회가 디지털플랫폼정부 실현계획을 보고하는 자리에서 올해 6월까지 ‘AI 데이터 안전 활용 정책방향’을 수립하겠다고 밝혔다. 디지털플랫폼정부위는 민간 초거대 AI 인프라에 정부 문서, 보도자료를 학습시켜 정부 전용 AI를 만들어 이를 복지, 민원 업무 전반에 적용하겠다는 계획을 내놨다. 

 

이에 개인정보위는 올해 6월까지 데이터 수집-AI 학습-서비스 제공 등 전 과정에서 지켜야 할 개인정보 보호원칙과 데이터 처리기준을 제시할 방침이다. 특히 AI 학습을 위해 공개돼 있는 정보나 사용자가 생성한 데이터가 빈번하게 수집되는 만큼 이에 대한 명확한 원칙을 세울 계획이다. 또한, AI 학습 시 적절한 가명처리 기준을 제시하고, 영상·음성 등 비정형 데이터의 가명처리 방법도 안내한다. 

 

개인정보위는 지난 3월 개인정보 전송요구권이 도입된 데 따른 후속 전략도 6월까지 수립한다. 개인정보 전송요구권은 1∼2년 후 전 분야에 적용될 예정이다. 개인정보위는 개인정보 전송요구권 행사를 보장하기 위한 세부 제도와 온라인 플랫폼, 핵심 인프라를 구축하며, 데이터가 서로 다른 산업 간에도 막힘없이 이동하도록 데이터 형식을 표준화한다. 이와 함께 의료, 유통 등 분야부터 개인정보 전송요구권 서비스를 추진하고 홍보를 강화하면서 단계적으로 확대할 계획이다. 

 

개인정보위는 이런 체제가 전 분야로 확산하면 2027년 기준 국내 데이터 산업 시장 규모가 기존 전망보다 20% 이상 추가 성장할 것으로 예측했다. 이뿐 아니라 개인정보 전송을 안전하게 하도록 식별·인증·보안체계를 수립하고, 형사처벌 등 제재로 데이터 유출·위변조 행위를 방지한다. 아울러 공공부문의 개인정보 처리 시스템 감독도 강화할 방침이다. 

 

대대적 개편되는 AI 학습용 데이터 정책

 

단순·반복 작업 중심이었던 데이터 라벨링 중심의 AI 학습용 데이터 정책을 초거대 AI 학습용 핵심 데이터 구축으로 전환하기로 했다. 이를 통해 양질의 대규모 텍스트 200종을 확보한다는 목표다. 이는 책 15만 권 분량에 해당한다. 과기정통부는 단순·반복 작업 중심의 기존 데이터 라벨링 물량을 축소하고 챗GPT와 같은 초거대 AI 모델 지원을 목표로 데이터 라벨링 사업을 추진하겠다고 밝혔다. 

 

정부는 2017년부터 언어, 이미지, 영상, 음성 등 분야에서 AI 학습 데이터를 구축 중이다. 올해 모두 2805억 원을 투입해 헬스케어, 교통·물류, 재난·안전·환경, 농·축·수산, 제조, 로보틱스, 문화·관광, 스포츠, 교육, 법률, 금융, 지식재산 등 분야에서 신규 데이터 150종을 구축할 예정이다. 

 

이 가운데 데이터 34종은 초거대AI 지원 데이터로 구분해 구축된다. 이미지 데이터 48종은 생성형 AI 학습에 활용되도록 이미지를 묘사·설명하는 캡션 정보를 추가 입력된다. 과기정통부는 문화관광, 스포츠, 법률 등 특화 분야에서 AI 도입을 목표로 관련 데이터 구축 비중을 지난해 19%에서 올해 25%로 높이기로 결정했다. 아울러 법률안 검토 보고서 요약 데이터, 119 신고 접수 음성 데이터 등 국회·소방과 같은 공공 분야에서 보유한 데이터의 민간 이용 확산을 지원한다.

 

올해 사업 주관기관 114곳을 선정할 예정이며, 데이터 1종당 구축 비용으로 연간 최대 17억 원 지원한다. 과기정통부는 4월 말부터 지난해 데이터 라벨링 사업을 통해 구축한 데이터 310종을 품질 검증을 거쳐 순차적으로 개방한다고 덧붙였다. 

 

헬로티 서재창 기자 |









배너










주요파트너/추천기업