정부가 인공지능(AI) 기반 방송미디어 산업 혁신을 위해 총 2만여 시간에 달하는 고품질 방송영상 AI 학습용 데이터를 확보했다.
방송미디어통신위원회(위원장 김종철)는 한국전파진흥협회(회장 홍범식)와 함께 7일 서울에서 '25년 방송영상 인공지능 학습용 데이터 구축 사업 성과공유회'를 열고, 그간 구축한 AI 학습용 데이터를 공개했다.
방미통위는 방송미디어 산업의 AI 혁신을 위해 고품질 학습용 영상 데이터 확보가 중요하다고 판단, 방송사가 보유한 뉴스·다큐멘터리·드라마 등 방대한 방송영상 자료를 AI 학습용 데이터로 전환하는 사업을 지난해 추진했다.
이번 사업에는 총 200억 원의 예산이 투입됐다. 200만 시간이 넘는 방송 원본 데이터 중 4만여 시간을 엄선해 정제 및 가공을 거쳤으며, 철저한 품질 검증을 통해 최종적으로 AI 학습용 고품질 영상 2만 3천113시간, 약 460만 개의 데이터 세트를 구축했다고 방미통위는 설명했다.
방송사가 보유한 방송영상 자료는 우리 사회 역사와 문화를 바탕으로 언어, 행동, 소리, 이미지 등 복합적 상황 정보를 풍부하게 담고 있어 AI 학습을 위한 최적의 원천데이터로 평가받는다.
이번에 구축된 데이터는 방송콘텐츠 제작 현장의 효율성을 높일 수 있는 AI 관련 서비스 개발은 물론, 제조·의료·재난·교통 등 타 산업 전반의 AI 개발에 활용돼 국가 AI 경쟁력 강화에 기여할 전망이다.
성과공유회에서는 서울과학기술대학교 박구만 교수가 '방송미디어 분야 인공지능 데이터 기술 동향 및 전망'을 주제로 강연했다. 이어 사업에 참여한 방송사들이 데이터 구축 과정과 주요 성과, 향후 AI 전환을 위한 중장기 전략을 공유했다.
방미통위 박동주 사무처장은 축사를 통해 "이번 사업이 방송미디어 산업의 AI 혁신을 위한 소중한 첫걸음이 될 것"이라며 "앞으로도 국내 방송미디어 산업이 AI를 발판 삼아 재도약할 수 있도록 관련 정책과 사업을 지속 추진하겠다"고 말했다.
이날 성과공유회에는 한국방송공사(KBS), 문화방송(MBC), MBC 충북, KT ENA 등 4개 주관 방송사와 네이버 클라우드, LG AI 연구원 등 AI 전문기업 관계자, 관련 분야 전문가, 일반 국민 등 100여 명이 참석했다.
한편, 방미통위는 이번 사업을 통해 확보된 데이터가 방송 제작 현장의 AI 도입을 가속화하고, 다양한 산업 분야에서의 AI 기술 발전에 기여할 것으로 기대하고 있다. 특히 방송영상 데이터가 가진 역사적·문화적 가치를 AI 학습에 활용함으로써 우리 사회의 맥락을 이해하는 지능형 서비스 개발이 가능해질 전망이다.


