메뉴바로가기본문바로가기

동아사이언스

"한국인 생각보다 다양하다" 1000명 게놈 분석 결과

통합검색

"한국인 생각보다 다양하다" 1000명 게놈 분석 결과

2020.05.28 03:00
인간 남성 게놈(유전체). 23쌍의 염색체로 이뤄져 있다. 개인별 차이는 물론 인구집단별 차이도 존재한다.- 사진 제공 NIH
인간 남성 게놈(유전체). 23쌍의 염색체로 이뤄져 있다. 개인별 차이는 물론 인구집단별 차이도 존재한다.- 사진 제공 NIH

한국인 1000명의 게놈(유전체) 정보와 건강 정보를 연관지어 분석한 연구 결과가 나왔다. 해외에서는 이미 1000~10만 명 이상의 게놈 정보를 수집해 의료 연구에 활용하는 국가가 있지만, 한국에서 1000명 이상의 게놈을 모아 분석한 것은 처음이다. 

 

박종화 울산과학기술원(UNIST) 생명과학부 교수와 최연송, 전성원, 박영준 연구원, 이세민 UNIST 게놈산업기술센터(KOGIC) 센터장(생명과학부 교수)팀은 한국인 1만 명의 게놈 데이터를 임상 정보와 함께 확보해 분석하는 ‘울산 만 명 게놈 사업’의 일환으로 수집된 첫 데이터 1007명 등 1094명의 게놈(Korea1K)을 건강 정보와 함께 분석한 뒤 그 결과를 국제학술지 ‘사이언스 어드밴시스’ 27일자에 발표했다.

 

이번 분석 결과를 보면 기존 전세계인 게놈 데이터베이스에 등록되지 않은 새로운 변이가 총 3900만 개 발견됐다. 변이 가운데 3분의 1은 한국인 집단에서 한 번씩만 발견되는 희귀한 유전적 변이로 한국인의 다양성이 높다는 사실이 확인됐다. 연구팀은 데이터를 10배 늘려서 한국인 내의 다양한 유전적 특징을 정확히 파악해 위암 등 질병의 예측 정확도를 높이고 보다 효과가 좋은 치료제를 개발하는 데 도움을 주겠다고 밝혔다.

 

●기존 데이터베이스에 없던 새 변이 3900만 개 발견

울산 만 명 게놈 사업은 전국민 1만 명의 게놈 정보를 확보하고, 이를 건강 설문조서 결과와 임상정보와 함께 연관해 분석하는 정밀의료 연구사업이다. 유전자 변이를 통해 한국인에게서 발견할 수 있는 다양한 유전적 특징을 파악하고, 이를 바탕으로 암이나 유전 질환 등에 더 취약한 변이를 확인해 유전 정보로 질병을 예측하는 정확도를 높이는 게 목표다. 유전적 특징에 따라 치료제 등이 더 잘 듣거나 잘 듣지 않는 경우도 있으므로, 좀더 성공 확률이 높은 치료제를 선별하는 데에도 도움이 될 것으로 기대를 모으고 있다. 과학기술정보통신부와 울산시가 지원하고 있다. 현재 약 4000명의 데이터를 확보해 해독한 상태이며 올해 말까지 1만 명의 데이터를 확보한다는 계획이다. 

 

이번 연구는 확보된 4000여 명 중 1007여 명의 데이터를 분석하고 기존에 공개된 87명의 한국인 변이 연구 결과를 합쳐 새롭게 건강 정보와 함께 분석한 결과다. 

 

주요 연구진이 한 자리에 모였다. 왼쪽부터 이세민 교수, 최연송 연구원, 전성원 연구원, 박영준 연구원, 박종화 교수다. UNIST 제공
주요 연구진이 한 자리에 모였다. 왼쪽부터 이세민 교수, 최연송 연구원, 전성원 연구원, 박영준 연구원, 박종화 교수다. UNIST 제공

먼저 기존의 게놈 데이터베이스에 등록되지 않은 새로운 변이를 다수 확인했다. 현재 게놈 분야 ‘국제 표준’은 영국과 미국이 2003년 여러 명의 게놈 데이터를 모아 완성한 ‘인간참조표준게놈’이다. 세계 각국이 해독한 게놈 정보를 이 게놈과 비교해 새로운 변이가 있을 경우 변이는 등록된다. 그런데 이번에 한국인 1000명의 게놈을 분석한 결과, 기존에 어느 나라 게놈에서도 나온 적이 없는 변이가 3900만 개 이상 발견됐다. 이 가운데 34.5%는 1000명 중에서 단 한 명만 지니는 독특한 변이로 파악됐다. 


박 교수는 전화 통화에서 “다른 국가와 절대적으로 비교하긴 어렵지만, 예상보다 훨씬 많은 수”라며 “흔히 한국인이 비교적 동질적인 집단이라고 널리 이야기하지만, 실은 매우 다양한 유전적 특징을 지닌 사람이 모인 집단이라는 사실이 드러났다”고 말했다. 이세민 센터장은 “이들 변이는 아직 기능이 제대로 밝혀지지 않았다”라며 “이들의 역할은 추후 더 많은 게놈 데이터가 확보돼야 파악될 수 있을 것”이라고 말했다.

 

질병을 예측하는 능력도 뛰어난 것으로 나타났다. 연구팀은 이번 1000명의 게놈 데이터와 일본인, 동아시아인, 유럽인, 아프리카인 등의 데이터를 이용해 암 예측 능력을 비교했다. 이미 공개된 한국인 위암 환자의 암 게놈 데이터를 기준으로 놓고, 각 집단에서 변이가 발견되는 빈도를 통해 암을 일으킬 가능성이 있는 변이를 예측한 뒤 정확도를 비교하는 방법이었다. 그 결과 한국인 1000명 데이터를 사용했을 때 암조직 변이를 예측하는 정확도가 가장 높았다. 한국인 1000게놈 데이터를 이용하면 게놈 연구 정확도를 높일 수 있다는 뜻이다. 최연송 KOGIC 연구원은 “1000명 게놈 데이터의 실용적 가치를 증명했다”고 말했다.


중성지방, 갑상선 호르몬 수치 등 11개 건강검진 결과를 그 사람의 게놈 속 변이와 연관지어 분석한 전장 유전체 연관 분석(GWAS)도 했다. 11개 건강 검진 항목은 15개 게놈 영역 467개 유전자 변이와 관련이 있는 것으로 나타났다. 4개 영역은 이번에 새롭게 발견됐고, 9개 영역에서는 기존보다 더 상관관계가 높은 변이를 발견했다. 연구팀은 “기존 GWAS 연구와 달리 한국인 게놈 전체를 대량으로 읽어 분석해 유전적 연관성을 더 정확히 파악할 수 있었다”고 말했다.

 

다만 일각에서는 이렇게 특정 국가 국민을 대상으로 많은 게놈 정보를 수집해 의료 분석을 하는 연구에 대해 “집단보다는 개인차가 더 중요하므로 큰 의미가 없다”는 비판을 일부 하기도 한다. 이에 대해 박 교수는 “유전적 차이는 실체가 있다"며 "그것이 개인적 차이든 집단든 통계적으로 확인할 필요는 있다”고 말했다. 그는 “예를 들어 신종 코로나바이러스 감염증(COVID-19, 코로나19) 치명률이 국가별 또는 인종별로 다르게 나타나는데, 유전적 차이가 있을지 비교하려면 게놈 데이터가 필요하다”고 말했다.

 

한국인 1000명의 게놈 정보를 이용해 암 분석을 개선하는 과정을 묘사했다. UNIST 제공
한국인 1000명의 게놈 정보를 이용해 암 분석을 개선하는 과정을 묘사했다. UNIST 제공

울산 만 명 게놈 사업은 참여자의 자발적 참여로 게놈 정보와 의료 정보를 수집했으며 익명화, 가명화 절차를 통해 개인정보를 보호했다. 이번에 구축된 1000명의 데이터는 5MP(메가바이트) 크기 노래 파일 2억 개를 저장할 수 있는 1PB(페타바이트. 1PB는 1000조 바이트) 용량이다. 연구팀은 이 10배인 1만 명의 빅데이터를 저장, 분석할 수 있는 저장시설과 슈퍼컴퓨터를 UNIST 안에 구축했다 


연구팀은 분석 결과 가운데 한국인 내 변이 빈도 결과를 웹페이지(1000genomes.kr)에 공개해 다른 연구자도 자유롭게 활용하도록 했다. 연구팀은 앞으로 1만 명까지 게놈 및 임상 데이터를 추가로 확보, 분석해 한국인의 유전자 표현형 분석, 질병 예측에 필요한 정밀의료 데이터를 마련할 예정이다. 


박종화 교수는 “이번 연구는 다양한 국가 인종 문화 배경의 사람들이 게놈 기반 공공 빅데이터를 구축하기 위해 시작됐다”며 “한국 국민은 물론 인류 전체가 널리 활용하기를 기대한다”고 말했다. 
 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

17 + 6 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스