농촌진흥청(청장 이승돈)이 농업 연구의 핵심 데이터인 유전형 정보에서 누락된 부분을 더욱 정확하게 복원하는 양자컴퓨팅 기반 기술을 세계 최초로 개발했다. 이 기술은 ‘큐임퓨터(QuImputer)’로 명명됐으며, 기존 컴퓨터로는 풀기 어려웠던 복잡한 유전 정보 문제를 양자컴퓨터의 원리로 해결했다는 점에서 주목받고 있다.
유전형 정보는 생물의 유전체 특징을 담고 있어 고온에 강한 작물이나 질병 저항성 유전자를 찾는 디지털 육종 연구의 기초 자료로 활용된다. 하지만 높은 분석 비용이나 시료 확보의 어려움 때문에 데이터의 일부가 빠지는 경우가 잦았다. 예를 들어, 내열성 같은 중요한 유전적 특징이 포함된 부분이 누락되면 연구 과정에서 해당 작물의 가치를 놓칠 위험이 있다.
기존에는 누락된 유전형 정보를 복원하기 위해 통계학 기반 기술이 사용됐다. 주변 데이터와 유전체 전체의 패턴을 바탕으로 빈자리에 들어갈 가능성이 높은 값을 추정하는 방식이다. 하지만 이 방법은 정보가 빠진 구간이 길거나 집단에서 드물게 나타나는 희귀 변이에서는 정확도가 현저히 떨어졌다. 특히 누락된 부분이 많을수록 가능한 유전형 조합의 수가 기하급수적으로 늘어나 기존 컴퓨터로는 문제 자체를 해결하기 어려웠다.
연구진은 이런 한계를 극복하기 위해 양자컴퓨팅 알고리즘을 도입했다. 양자컴퓨팅은 양자역학 원리를 이용해 많은 조합을 가진 최적화 문제를 새로운 방식으로 다루는 차세대 컴퓨팅 기술이다. 큐임퓨터는 유전변이들이 함께 유전되는 경향(연관 불균형), 변이가 집단에서 나타나는 빈도, 변이 사이의 거리 등을 양자컴퓨터로 계산해 가장 자연스러운 유전형을 찾아 넣는 원리다.
개발 과정에서 연구진은 먼저 농촌진흥청의 초고성능컴퓨터인 나비스(NABIS) 2호기의 양자컴퓨터 시뮬레이터를 이용해 알고리즘을 만들고 시험했다. 이후 미국 IBM사가 제공하는 실제 양자컴퓨터를 통해 검증을 마쳤으며, 알고리즘이 제대로 작동하는 것을 확인했다.
실제 성능은 뚜렷했다. 이 기술을 적용한 결과, 기존 방식보다 희귀 변이 분석에서 복원 정밀도가 29.97%포인트 높게 나타났다. 이는 그동안 통계 방식으로는 정확히 잡아내기 어려웠던 희귀 변이 정보를 양자컴퓨팅으로 효과적으로 복원할 수 있음을 보여준다.
큐임퓨터의 기본 작동 방식은 다음과 같다. 하나의 분석 창(window) 안에 있는 여러 결측 SNP(단일염기다형성)를 서로 연결된 네트워크로 보고 동시에 최적화한다. 각 결측 SNP를 양자 큐비트에 대응하는 변수로 바꾼 뒤, 대립유전자 빈도와 연관 불균형 같은 생물학적 정보를 하나의 에너지 함수에 입력한다. 그런 다음 현재 관측된 데이터에 가장 잘 맞는 유전형 조합을 최적해로 선택하는 방식이다.
이 기술은 기존 프로그램인 Beagle의 완전한 대체재가 아니라 상호보완적으로 사용될 수 있다. 연구진은 Beagle이 전역적으로 결측을 추정하는 방식과 큐임퓨터의 로컬 최적화 방식을 결합하는 하이브리드 전략이 결측 유전체 데이터를 복원하는 데 더욱 의미 있을 것으로 보고 있다.
농촌진흥청은 양자컴퓨팅 기술이 고도화되면 이번에 개발한 큐임퓨터를 디지털 육종과 유용 유전자 탐색 등 다양한 농업 난제를 해결하는 전용 도구로 활용할 수 있을 것으로 전망했다. 연구진은 이미 이 기술에 대해 특허출원을 완료했다.
농촌진흥청 슈퍼컴퓨팅센터 이태호 센터장은 “이 기술은 양자컴퓨팅 기반의 최적화 방식으로 복잡한 생명 빅데이터 문제를 풀어내는 새로운 접근 가능성을 찾은 사례”라며 “앞으로 유전형 정보를 다루는 모든 연구 현장에서 활용될 수 있을 것으로 기대된다”고 밝혔다.


