국가데이터처는 6월 25일 대전 통계센터에서 '2026 국가데이터연구 심포지엄'을 개최했습니다. 2011년부터 시작된 이 심포지엄은 작년 국가데이터연구원 출범을 계기로 국가통계 방법론뿐 아니라 데이터와 인공지능 전반으로 주제를 확장해 연구성과와 전문지식을 공유하는 장으로 자리 잡았습니다.
이번 행사는 'AI시대, 국가통계·데이터의 새로운 가치와 활용'을 주제로 열렸으며, 현장 참석과 온라인 중계가 병행됐습니다.\n\n기조강연에서 서울대학교 고길곤 교수는 '인공지능 학습 데이터 전환과 통계적 추론의 공진화'를 주제로, AI와 결합한 통계추론 시대에 국가데이터의 의미와 학습데이터로의 전환을 강조했습니다. 또한 국가데이터연구원의 미래 역할과 연구 방향을 제언했습니다.\n\n첫 번째 분과인 '인공지능과 데이터 품질' 세션에서는 AI 성능의 핵심 요소인 데이터 품질이 집중 논의됐습니다.
NIA 유호진 팀장은 대규모 고품질 학습 데이터의 중요성과 비정형 데이터 품질 확보 방안을 제안했고, 국가데이터연구원 김정민 사무관은 구글 리서치의 데이터 품질관리 사례를 통해 AI 데이터 구축과 관리의 필요성을 강조했습니다. 토론에는 세명대 강하예진 교수와 국가데이터처 이선희 과장이 참여했습니다.\n\n두 번째 분과 '인공지능 활용 통계 혁신'에서는 AI 기반 방법론을 통계 생산에 적용한 사례들이 소개됐습니다.
카이스트 김란우 교수는 거대언어모델(LLM)을 활용한 설문조사의 현재와 한계를 발표했고, 국가데이터연구원 이석민 사무관은 AI를 활용한 감염병 사망 예측과 사인분류 연구를 제시했습니다. 보건사회연구원 이기호 부연구위원은 조사데이터 품질 제고를 위한 AI 활용 방안을 발표했으며, 충남대 김주연 교수, 한림대 김동현 교수, 홍익대 정용찬 교수가 토론에 나서 활발한 의견을 나눴습니다.\n\n마지막 분과 '데이터 융합과 정보보호'에서는 데이터 활용 가치를 높이면서 안전하게 관리하는 방안이 논의됐습니다.
국가데이터연구원 박성률 연구관은 파편화된 데이터의 연계성과 활용성을 높이기 위한 데이터 통합 프로세스 도입을 제안했고, 국가데이터처 심규호 사무관은 AI 학습용 데이터 보호를 위한 신기술 국내외 현황과 범정부 데이터 연계 필요성을 강조했습니다. 한국보건사회연구원 이혜정 연구위원과 크립토랩 이영기 연구원이 토론에 참여해 심도 있는 의견을 교환했습니다.\n\n안형준 국가데이터처장은 개회사를 통해 "AI 성능은 데이터 품질과 신뢰성에 의해 결정되고, 정확하고 체계적으로 구축된 국가통계와 데이터는 AI 시대에 중요한 공공 인프라가 되고 있다"며 "이번 심포지엄에서 논의된 다양한 의견을 반영해 데이터 품질 향상과 새로운 데이터 가치 창출을 위한 연구를 지속적으로 확대하겠다"고 밝혔습니다.


