동북아시아인 참조 유전체 데이터베이스에는 한국인 850명을 포함한 몽골인 384명, 일본인 396명, 중국인 91명, 홍콩인 58명 등 총 1779명의 전장 유전체 분석(Whole-genome Sequencing, WGS) 정보와 유전변이 정보가 포함되어 있다. 이는 한국, 몽골, 일본, 중국 등 동북아시아 4개국을 대표할 수 있는 참조 유전체 데이터베이스 중 최대규모다.
공동 연구팀은 동북아시아인 참조 유전체 데이터베이스에 주성분 분석(principal component analysis)과 어드믹스쳐(admixture) 분석을 진행한 결과, 한국인, 일본인, 중국인, 몽골인은 서로 다른 유전체 구성을 보였으며, 특히 한국인의 유전체 구성은 다른 동북아시아인의 유전체 구성과 뚜렷하게 구분되는 것으로 나타났다. 연구팀은 "동북아시아인과 같은 대륙별 인종뿐 아니라 국가별 인종에 대한 참조 유전체 구축이 필요함을 나타내며, 무엇보다 한국인에 대한 참조 유전체 데이터베이스의 필요성과 유의성을 과학적으로 입증한 중요한 결과"라고 말했다.
새롭게 구축한 동북아시아인 참조 유전체 데이터베이스는 ‘NARD 임퓨테이션' 사이트를 통해 누구나 자유롭게 이용할 수 있다.
분당서울대학교병원 서정선 석좌교수는 “이번 연구를 통해 동북아시아인의 유전적 특성을 확인했을 뿐만 아니라 전 세계적으로 독보적인 정확도를 자랑하는 참조 유전체 데이터베이스를 구축하는 데 성공했다”며 “현재 1만 명 규모의 동북아시아인 2차 참조 유전체 데이터베이스 분석이 마무리되어 내년 초 추가로 공개할 예정이며, 이를 통해 동북아시아인 질병 관련 유전자 발굴 및 질병 예측에 크게 기여할 수 있을 것으로 기대한다”고 전했다.
한편 이번 연구 결과는 오픈 액세스 저널인 ‘유전체 의학(Genome Medicine, 영향력 지수 10.886)’ 온라인판에 10월 22일 자에 게재됐다.