[아이뉴스24 최상국 기자] 김종일 교수(서울대학교 의과대학 유전체의학연구소, 생화학교실), 임선화 교수(강원대학교 생화학교실), 박진호 교수(서울대학교 의과대학 가정의학교실) 등이 이끄는 연구진이 동아시아인을 위한 유전체 참조 패널 (Northeast Asian Reference Database, NARD2)을 새로 만들어 공개했다.
연구진은 또한 이를 사용한 전장유전체연관분석 (GWAS) 연구를 통해 동아시아인에게만 나타나는 새로운 변이를 확인했다는 연구결과를 발표했다.
연구진이 제작한 새로운 참조 패널은 1만4천393명의 전장유전체 시퀀싱(WGS) 데이터를 포함하고 있으며 이중 1만1천명이 동아시아인으로, 현존하는 패널 중에서 가장 많은 동아시아인을 포함하고 있다.
연구진은 이 패널을 질병관리본부로부터 분양받은 7만2천298명의 한국인 유전체 데이터에 적용한 결과 키, 체질량지수(BMI), 혈압, 당뇨 관련 형질에 대해 39개의 새로운 변이와 다양한 유전자에 대한 연관성을 밝혔다.
연구진은 NARD2 패널을 gmi.snu.ac.kr/imputation에 누구나 사용할 수 있도록 공개하고, 유전체 연구를 진행하는 동아시아인에게 중요한 자료가 될 것으로 기대한다고 밝혔다.
전장유전체연관분석(GWAS)은 인간 유전체 전체 영역에 대해 다수의 유전체 변이와 특정 형질의 연관성을 통계적으로 분석하는 기법이다. 각종 질병이나 특성의 유전자를 찾기 위해 가장 흔하게 사용되는 방법이지만, 대규모의 샘플과 유전형 분석이 필요하다.
대신 이미 전장유전체서열을 알고 있는 참조 샘플이 많이 있을 경우, 이를 미리 학습시키면, 개인의 유전체서열 일부만 있어도 나머지 서열에 대한 추정이 가능해 분석 비용을 줄일 수 있다. 이렇게 추정하는 방법을 임퓨테이션(imputation)이라고 하는데 이를 위해서는 미리 확보해 놓은 참조 데이터가 필수적이다.
이전까지 발표된 참조 패널은 동아시아인이 상당히 적게 포함돼 이를 그대로 동아시아인에 적용하면 유추할 수 있는 유전형의 정확도가 떨어진다. 이번 연구진이 발표한 패널은 현존하는 패널 중에서 가장 많은 동아시아인을 포함하고 있다. 연구진은 대규모의 다른 참조 패널과의 비교를 통해 NARD2가 한국인에서 임퓨테이션의 정확도가 가장 높다는 사실을 확인했다.
이번 연구는 의생명과학 저널인 ‘사이언스 어드밴시스(Science Advances)’ 최신호에 온라인 출간됐다.(논문명: A whole-genome reference panel of 14,393 individuals for East Asian populations accelerates discovery of rare functional variants.)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기