질병관리청 국립보건연구원은 7월 1일 '초정밀 헬스케어 인공지능 연구개발 중장기 로드맵 2035'를 수립했다고 밝혔다. 이 로드맵은 유전체, 임상 데이터, 실시간 건강정보 등 다양한 헬스케어 데이터를 결합한 차세대 초정밀 헬스케어 기술 개발의 청사진을 제시한다.
초정밀 헬스케어란 개인의 유전체와 건강정보, 일상에서 수집되는 연속적인 생체·행동 데이터 등을 통합 분석해 초개인화된 맞춤형 건강관리 솔루션을 실시간으로 제공하는 기술과 서비스를 말한다. 이는 기존 정밀의료가 환자군 단위로 접근한 것과 달리 개인 단위(N-of-1)로 건강 상태를 분석하고 전 생애주기에 걸쳐 선제적 건강관리를 제공하는 체계다.
이번 로드맵은 급속한 고령화와 만성질환 증가, 디지털 헬스케어 및 정밀의료 시장 확대 등 변화하는 보건의료 환경에 대응하기 위해 마련됐다. 국민 개개인의 건강상태와 유전적·환경적 특성을 종합적으로 고려하는 초정밀 헬스케어 체계 구축을 목표로 한다.
국립보건연구원은 그동안 구축한 대규모 코호트와 바이오뱅크를 기반으로 임상·역학, 의료영상, 라이프로그, 유전체 등 바이오빅데이터가 통합·연계된 세계 최고 수준의 한국형 인공지능 학습용 통합 건강정보 데이터 45종(100만 명분)을 구축할 예정이다.
이번 로드맵은 '데이터가 치료가 되는 시대, 헬스케어 인공지능 강국 선도'를 비전으로 제시했다. 신뢰, 혁신, 체감, 통합의 4대 핵심 가치를 바탕으로 국민이 일상에서 체감할 수 있는 헬스케어 인공지능을 개발하고 산·학·연·병이 함께하는 협력 생태계를 구축하고자 한다.
국립보건연구원은 이를 위해 4대 핵심 추진 전략을 마련했다. 첫째, 코호트 기반 대규모 한국형 멀티모달 인공지능 학습용 데이터를 확보한다. 둘째, 목적형 헬스케어 멀티·옴니모달 데이터셋을 구축한다. 셋째, 초정밀 헬스케어 인공지능 기술 개발 및 실증 연구를 추진한다. 넷째, 공유·개방을 통한 초정밀 헬스케어 AI 생태계를 조성한다.
멀티모달 데이터는 동일인에게서 얻은 임상·역학, 의료영상, 라이프로그, 멀티오믹스 등 서로 다른 유형의 데이터를 특정 시점으로 연계·통합한 데이터를 의미한다. 옴니모달 데이터는 개인의 다양한 멀티모달 데이터를 시간의 흐름에 따라 연속적으로 통합·축적하여 개인의 상태 변화를 시계열적으로 반영하는 데이터다.
로드맵은 기술 성숙도와 헬스케어 현장의 수요를 고려하여 2035년까지 추진 단계를 3단계로 구성했다. 1단계(2027~2029년)는 도약기로 데이터 자원화에 집중한다. 2단계(2030~2032년)는 가속기로 모델 지능화를 추진한다. 3단계(2033~2035년)는 완성기로 가치를 실현한다. 우선 2032년까지 향후 6년간에 걸쳐 데이터 자원화 및 모델 지능화를 위한 핵심 과제들을 추진할 예정이다.
구체적으로 1단계에서는 기 구축 코호트 기반 멀티모달 데이터를 확대 수집하고 바이오뱅크 인체 자원으로부터 바이오데이터를 생산한다. 여기에는 임상유전체와 연계된 뇌영상, 라이프로그, 멀티오믹스, 심전도, 음성, 걸음걸이, 의료 동영상 등 다양한 데이터가 포함된다. 2단계에서는 코호트 기반 시계열 멀티모달 데이터에 레이블링과 주석 가공 등을 통해 헬스케어 AI 연구에 최적화된 플래그쉽 AI-Ready 데이터셋을 구축한다. 이 데이터셋은 참조용, 교육용, 검증평가용, 합성데이터, 범용 헬스케어 AI 솔루션 연구개발용 등 목적별로 구성된다.
2035년에는 한국인의 건강·질병 특성을 반영한 글로벌 수준의 한국형 인공지능 학습용 데이터를 구축하고, 헬스케어 분야 인공지능 및 유전체 기술 혁신을 통해 국민 개개인에게 초개인화된 실시간 맞춤형 건강관리와 질병 예측·예방 서비스를 제공할 수 있을 것으로 기대된다.
남재환 국립보건연구원장은 "초정밀 헬스케어 인공지능은 개인별 건강위험을 더 정밀하게 예측하고 예방과 치료의 정확도를 높이는 핵심 기술"이라며 "앞으로 국민이 체감할 수 있는 AI 기반 미래의료 기술 혁신을 위하여 본 로드맵을 차질 없이 추진하겠다"고 밝혔다.
임승관 질병관리청장은 "세계 최고 수준의 바이오 빅데이터와 초정밀 헬스케어 인공지능 기술을 융합하여 국민 모두가 차별 없이 혜택을 누릴 수 있는 건강 및 질병 관리 서비스 개발에도 최선을 다하겠다"고 말했다.
이번 로드맵은 사업 목적과 내용, 비전 체계를 체계적으로 제시한다. 사업의 목적은 초정밀 헬스케어 실현을 위한 한국형 대규모 인공지능 학습용 데이터셋 구축 및 헬스케어 AI 기술 활용 체계를 구축하는 것이다. 주요 내용은 코호트 기반 멀티모달 AI 학습용 데이터 확보, 목적형 헬스케어 멀티·옴니모달 AI 데이터셋 구축, 초정밀 헬스케어 AI 활용 기술 개발, AI 학습용 데이터 공유·개방 체계 구축 등이다.
데이터 공유·개방은 단계적으로 확대된다. 1단계(2027~2029년)에는 18종의 데이터셋을 구축해 40%를 공개하고, 2단계(2030~2032년)에는 35종을 구축해 80%를 공개하며, 3단계(2033~2035년)에는 45종 전체를 100% 공개할 계획이다.
이번 로드맵은 한국형 데이터 주권 확보, 한국형 헬스케어 AI 기본모델 정립, 초정밀 헬스케어 AI R&D 선도, 헬스케어 AI 강국 도약을 성과 목표로 설정했다. 특히 코호트 특화 AI 공동연구자 및 옴니모달 헬스케어 AI 기본모델 개발을 통해 질병 예측과 예방, 치료의 정확도를 획기적으로 높일 것으로 기대된다.
이번 로드맵 수립으로 국민 개개인의 건강 데이터가 치료로 이어지는 시대를 열기 위한 첫걸음이 마련됐다. 앞으로 10년간의 중장기 계획을 통해 한국이 헬스케어 인공지능 분야에서 글로벌 선도국가로 도약할 수 있을지 주목된다.


