국가데이터처(처장 안형준)는 6월 25일 대전 통계센터에서 '2026 국가데이터연구 심포지엄'을 열었다. 2011년부터 이어져 온 이 심포지엄은 지난해 국가데이터연구원 출범을 계기로 국가통계 방법론뿐 아니라 데이터와 인공지능 전반으로 주제를 확장해 연구 성과와 전문 지식을 공유하는 자리로 발전했다.
이번 행사는 'AI시대, 국가통계·데이터의 새로운 가치와 활용'을 주제로, 인공지능 대전환이 가속화되는 환경에서 핵심 자원인 데이터의 가치와 품질·통합을 재조명하고 국가통계 혁신을 위한 인공지능 활용 방안을 논의하는 장이 됐다.
기조강연에서 서울대학교 행정대학원 고길곤 교수는 '인공지능 학습 데이터 전환과 통계적 추론의 공진화'를 주제로 발표했다. 그는 인공지능과 결합한 통계추론 시대에 국가데이터의 의미와 학습데이터로의 전환을 강조하고, 국가데이터연구원의 미래 역할과 연구 방향을 제시했다.
이어진 분과 세션은 '인공지능과 데이터 품질', '인공지능 활용 통계 혁신', '데이터 융합과 정보보호' 등 세 가지 소주제로 구성됐다. 각 세션에서는 총 7편의 연구 및 실증 사례 발표와 전문가 토론이 진행됐다.
첫 번째 세션 '인공지능과 데이터 품질'(좌장: 안성원 책임연구원, 소프트웨어정책연구소)에서는 인공지능 성능의 핵심 요소인 데이터 품질에 대해 논의했다. 한국지능정보사회진흥원(NIA) 유호진 팀장은 '인공지능 학습데이터 품질관리 및 검증 체계' 발표를 통해 대규모 고품질 학습 데이터의 중요성과 비정형 데이터 품질 확보 방안을 제안했다. 국가데이터연구원 김정민 사무관은 '구글리서치 데이터 품질관리 관련 연구 동향 및 시사점'을 통해 사례 연구를 바탕으로 인공지능 데이터 구축과 관리의 필요성을 강조했다. 토론에는 세명대학교 강하예진 교수와 국가데이터처 이선희 과장이 참여했다.
두 번째 세션 '인공지능 활용 통계 혁신'(좌장: 연세대 임종호 교수)에서는 인공지능 기반 방법론을 적용한 통계 생산과 실증 사례가 소개됐다. 카이스트 김란우 교수는 '거대언어모델을 활용한 설문조사의 현재와 한계' 발표에서 대규모 언어 모델(LLM)을 활용한 합성 응답과 이용 사례를 살펴봤다. 국가데이터연구원 이석민 사무관은 '감염병 사망 예측을 위한 인공지능 적용 연구'에서 인공지능 기반 사인분류 예측과 정책 대응형 서비스 확장 방안을 제시했다. 보건사회연구원 이기호 부연구위원은 '인공지능 기반 조사데이터 품질 제고 방안'에서 국가통계 품질관리의 지능화·자동화 방안을 제안했다. 충남대 김주연 교수, 한림대 김동현 교수, 홍익대 정용찬 교수가 토론자로 나서 활발한 논의를 펼쳤다.
마지막 세션 '데이터 융합과 정보보호'(좌장: 국가데이터처 김수영 과장)에서는 데이터 활용 가치를 높이고 안전하게 활용하는 방안을 논의했다. 국가데이터연구원 박성률 연구관은 '데이터 통합 방법 체계화 및 실증 연구' 발표에서 파편화된 데이터의 연계성과 활용성을 높이기 위한 데이터 통합 프로세스 도입을 제안했다. 국가데이터처 심규호 사무관은 '인공지능 학습용 데이터를 위한 정보보호 신기술 연구 개발 현황'에서 데이터 보호 신기술에 대한 국내외 현황과 범정부 데이터 연계 활용 필요성을 강조했다. 한국보건사회연구원 이혜정 연구위원과 주식회사 크립토랩 이영기 연구원이 토론에 참여해 심도 있는 의견을 교환했다.
안형준 국가데이터처장은 개회사에서 "인공지능 성능은 데이터 품질과 신뢰성에 의해 결정되고, 정확하고 체계적으로 구축된 국가통계와 데이터는 인공지능 시대에 중요한 공공 인프라가 되고 있다"며 "이번 심포지엄에서 논의된 다양한 의견을 반영해 데이터 품질 향상과 새로운 데이터 가치 창출을 위한 국가데이터 연구를 지속적으로 확대해 나가겠다"고 밝혔다.
이번 심포지엄은 온라인으로도 중계됐으며, 누리집(dsri-symposium.kr)을 통해 실시간 참여와 의견 제시가 가능하다. 심포지엄 관련 자세한 내용과 발표 자료도 같은 누리집에서 확인할 수 있다.


