'누락' 유전형 정보, '양자컴퓨팅 기반 기술'로 채워 넣는다

농촌진흥청(청장 이승돈)은 농생명 핵심 빅데이터인 유전형 정보의 빠진 부분(결측치)을 더욱 정확하게 복원하는 양자컴퓨팅 기반 기술인 '큐임퓨터(QuImputer)'를 개발했다고 11일 밝혔다.

유전형 정보는 생물별 유전체 특징을 담고 있어 유용 유전자 탐색, 디지털 육종, 농생명 인공지능 개발 등 다양한 연구의 핵심 기반 데이터로 활용된다. 하지만 높은 분석 비용이나 시료 확보의 어려움 등으로 일부 유전형 정보가 누락되는 문제가 빈번하게 발생한다.

유전형 정보가 빠지면 어떤 개체가 중요한 유전적 특징을 가지고 있었는지 놓칠 우려가 있다. 예를 들어, 누락된 유전형 정보에 고온에서도 잘 견디는 특징이 포함돼 있다면 해당 작물의 가치를 분석 과정에서 놓칠 수 있다.

기존에는 빠진 유전형 정보를 복원하기 위해 주변 단서와 유전체 전체의 패턴을 바탕으로 빈 곳에 들어갈 가능성이 높은 답을 추정하는 통계학 기반 기술을 사용했다. 하지만 이 방법은 정보가 빠진 부분이 길게 이어지거나 집단에서 드물게 나타나는 희귀 변이에서는 정확도가 떨어지는 한계가 있었다. 특히, 빠진 부분이 많을수록 가능한 유전형 조합의 수가 기하급수적으로 늘어나 기존 컴퓨터로는 문제를 해결하기 어려웠다.

이에 연구진은 기존 방식보다 유전형 복원 정확도를 높인 양자컴퓨팅 알고리즘을 세계 최초로 개발했다. 양자컴퓨팅은 양자역학 원리를 이용해 많은 조합을 가진 최적화 문제를 새로운 방식으로 다루는 차세대 컴퓨팅 기술이다.

큐임퓨터는 유전변이들이 함께 유전되는 경향(연관 불균형, LD), 변이가 집단에서 나타나는 빈도(대립유전자 빈도, AF), 변이 사이의 거리 등을 양자컴퓨터로 계산해 가장 자연스러운 유전형을 찾아 넣는 방식이다. 연구진은 먼저 농촌진흥청의 초고성능컴퓨터인 나비스(NABIS) 2호기의 양자컴퓨터 시뮬레이터를 이용해 알고리즘을 만들고 시험했다. 이후 미국 IBM사가 제공하는 실제 양자컴퓨터를 이용해 검증하고, 제대로 작동함을 확인했다.

이 기술을 적용한 결과, 기존 방법보다 희귀 변이 분석에서 복원된 희귀 변이의 정밀도가 29.97%포인트 높게 나타났다. 연구진은 이 기술의 특허출원(출원번호: 10-2026-0097395)을 완료했다.

농촌진흥청은 양자컴퓨팅 기술이 고도화되면 양자컴퓨팅 전용으로 개발해 디지털 육종과 유용 유전자 탐색 등 다양한 농업 난제를 해결할 수 있을 것으로 전망했다.

농촌진흥청 슈퍼컴퓨팅센터 이태호 센터장은 “이 기술은 양자컴퓨팅 기반의 최적화 방식으로 복잡한 생명 빅데이터 문제를 풀어내는 새로운 접근 가능성을 찾은 사례”라며, “앞으로 유전형 정보를 다루는 모든 연구 현장에서 활용할 수 있을 것으로 기대된다.”라고 말했다.

한편, 큐임퓨터는 기존 통계 기반 방법인 Beagle을 완전히 대체하기보다 상호보완적으로 결합하는 하이브리드 전략이 결측된 유전체 데이터를 복원하는 데 의미를 가진다. 이 기술은 저커버리지 벼 유전체 데이터에서 희귀·저빈도 변이 복원과 희귀 변이 누락 감소에 강점을 보였다.

주요 용어를 살펴보면, 유전체는 생물이 가진 모든 유전정보인 DNA 염기서열 전체를 의미하고, 유전형은 특정 유전체 위치에서 한 개체가 가진 유전정보의 상태를 말한다. SNP(단일염기다형성)는 유전체의 특정 위치에서 염기가 개체마다 다르게 나타나는 변이를 뜻하며, 희귀·저빈도 변이는 전체 집단에서 낮은 빈도로 나타나는 유전변이를 가리킨다. 연관 불균형(LD)은 가까운 유전변이들이 함께 유전되는 경향을 설명하는 개념이다.



출처: 대한민국 정책브리핑 [원문보기]

⚖️ 본 콘텐츠는 AI가 재구성한 것으로, 저작권은 원 저작자(대한민국 정책브리핑)에게 있습니다. 저작권자 요청 시 즉시 삭제됩니다.