국가데이터처(처장 안형준)가 6월 25일 대전 통계센터에서 'AI시대, 국가통계‧데이터의 새로운 가치와 활용'을 주제로 '2026 국가데이터연구 심포지엄'을 개최했다. 이번 행사는 현장 참석과 온라인 생중계로 동시에 진행되었으며, 민간과 학계, 정부 관계자 등 다양한 전문가들이 참여해 AI 시대 데이터의 가치와 활용 방안을 논의했다.
2011년부터 시작된 이 심포지엄은 작년 국가데이터연구원 출범을 계기로 주제를 국가통계 방법론에서 데이터와 인공지능 전반으로 확장했다. 특히 AI 대전환이 가속화되는 환경에서 핵심 자원인 데이터의 품질과 통합, 그리고 국가통계 혁신을 위한 AI 활용 방안에 초점을 맞췄으며, 다양한 연구 성과 발표와 토론이 이어졌다.
기조강연에서는 서울대학교 행정대학원 고길곤 교수가 '인공지능 학습 데이터 전환과 통계적 추론의 공진화'를 주제로 발표했다. 고 교수는 AI와 결합한 통계추론 시대에 국가데이터의 의미와 학습데이터로의 전환을 강조하고, 국가데이터연구원의 미래 역할과 연구 방향을 제언했다.
이어진 분과 세션은 'AI 데이터 품질', 'AI 활용 통계 혁신', '데이터 융합과 정보보호' 세 가지 주제로 나뉘어 총 7편의 연구 및 실증 사례 발표와 전문가 토론이 진행됐다.
첫 번째 분과 'AI 데이터 품질'(좌장: 안성원 책임연구원, 소프트웨어정책연구소)에서는 AI 성능의 핵심 요소인 데이터 품질에 대해 논의했다. 한국지능정보사회진흥원(NIA) 유호진 팀장은 'AI 학습데이터 품질관리 및 검증 체계' 발표를 통해 대규모 고품질 학습 데이터의 중요성과 비정형 데이터의 품질 확보 방안을 제안했다. 이어 국가데이터연구원 김정민 사무관은 '구글리서치 데이터 품질관리 관련 연구 동향 및 시사점'을 주제로 AI 데이터 구축과 관리의 필요성을 사례를 들어 설명했다. 토론에는 세명대학교 강하예진 교수와 국가데이터처 이선희 과장이 참여했다.
두 번째 분과 'AI 활용 통계 혁신'(좌장: 임종호 교수, 연세대)에서는 AI 기반 방법론을 통계 생산에 적용한 실증 사례가 소개됐다. 카이스트 김란우 교수는 '거대언어모델을 활용한 설문조사의 현재와 한계' 발표에서 거대언어모델(LLM)을 활용한 합성 응답과 이용 사례를 살펴봤다. 국가데이터연구원 이석민 사무관은 '감염병 사망 예측을 위한 AI 적용 연구'를 통해 AI 기반 사인분류 예측과 정책 대응형 서비스 확장 방안을 제시했다. 보건사회연구원 이기호 부연구위원은 'AI 기반 조사데이터 품질 제고 방안'에서 국가통계 품질관리의 지능화·자동화 방안을 제안했으며, 충남대 김주연 교수, 한림대 김동현 교수, 홍익대 정용찬 교수가 토론에 나서 활발한 논의를 펼쳤다.
세 번째 분과 '데이터 융합과 정보보호'(좌장: 김수영 과장, 국가데이터처)에서는 데이터 활용가치를 높이고 안전하게 활용하는 방안을 논의했다. 국가데이터연구원 박성률 연구관은 '데이터 통합 방법 체계화 및 실증 연구' 발표에서 파편화된 데이터의 연계성과 활용성 제고를 위한 데이터 통합 프로세스 도입을 제안했다. 국가데이터처 심규호 사무관은 'AI 학습용 데이터를 위한 정보보호 신기술 연구 개발 현황'에서 데이터보호 신기술의 국내외 현황과 범정부 데이터 연계 활용 필요성을 강조했다. 토론에는 한국보건사회연구원 이혜정 연구위원과 주식회사 크립토랩 이영기 연구원이 참여해 의견을 교환했다.
안형준 국가데이터처장은 개회사를 통해 "AI의 성능은 데이터 품질과 신뢰성에 의해 결정되고, 정확하고 체계적으로 구축된 국가통계와 데이터는 AI 시대에 중요한 공공 인프라가 되고 있다"며 "이번 심포지엄에서 논의된 다양한 의견을 반영해 데이터 품질 향상과 새로운 데이터 가치 창출을 위한 국가데이터 연구를 지속적으로 확대해 나가겠다"고 밝혔다.
이번 심포지엄은 온라인 중계가 병행됐으며, 누리집(dsri-symposium.kr)을 통해 실시간 참여와 의견 제시가 가능했다. 또한 심포지엄 관련 자세한 내용과 발표 자료도 같은 누리집에서 확인할 수 있다.


