주메뉴바로가기.. 본문바로가기

유전체 빅데이터로 질병 유전자 80% 예측…신약 개발 비용·시간 확 줄인다

카카오스토리 네이버밴드 구글플러스

2018년 03월 26일 17:53 프린트하기

남덕우 울산과학기술원(UNIST) 생명과학부 교수팀이 최근 개발한 유전체 빅데이터 분석 알고리즘(GSA-SNP2)을 이용한 질병 유전자 예측 시뮬레이션 결과를 보고 있다. 이 알고리즘은 질병 유전자 후보군을 기존보다 2~5배 많이 발굴해낼 수 있다. - UNIST 제공
남덕우 울산과학기술원(UNIST) 생명과학부 교수팀이 최근 개발한 유전체 빅데이터 분석 알고리즘(GSA-SNP2)을 이용한 질병 유전자 예측 시뮬레이션 결과를 보고 있다. 이 알고리즘은 질병 유전자 후보군을 기존보다 2~5배 많이 발굴해낼 수 있다. - UNIST 제공

국내 연구진이 유전체 빅데이터를 이용해 질병에 관여하는 유전자 후보군을 기존보다 2배 이상 많이 발굴해낼 수 있는 분석법을 개발했다. 신약 개발과 질병 연구에 들어가는 비용과 시간을 획기적으로 줄일 수 있을 전망이다.

 

울산과학기술원(UNIST)은 수학자 출신 남덕우 생명과학부 교수 연구팀이 1만 명 미만의 적은 유전체 데이터만으로도 질병 유전자 후보군을 신속하고 정확하게 찾아낼 수 있는 통계 알고리즘 ‘GSA-SNP2’를 개발했다고 26일 밝혔다.

 

기존 통계적 방법으로는 찾아낼 수 있는 질병 유전자 후보군이 전체의 10~40%에 불과했다. 나머지는 오랜 시간에 걸친 실험을 통해 밝힐 수밖에 없었다. 하지만 GSA-SNP2를 활용하면 특정 질병에 관여하는 유전자 후보군을 80% 가까이 밝힐 수 있는 것으로 나타났다. 남 교수는 “이 후보군에 대해 우선적으로 검증을 할 수 있기 때문에 그만큼 실험의 효율을 높일 수 있다”고 설명했다.

 

이미 발병에 관여하는 유전자 군을 알고 있는 당뇨병에 대해 예측 시뮬레이션을 한 결과, GSA-SNP2는 시중 최고 성능의 ‘마그마(MAGMA)’ 알고리즘보다 당뇨병 유전자를 2배 더 많이 찾아냈다. 가장 많이 쓰이는 알고리즘인 ‘마젠타(MAGENTA)’보다는 5배 이상 많았다. 
  
유전자 후보군 식별에 필요한 데이터 분량도 줄였다. 기존에는 유의미한 질병 유전자 후보군을 가려내려면 최소 1만 명의 유전체 데이터가 필요했다. GSA-SNP2를 활용할 경우 수천 명 단위에서도 질병 유전자 후보군을 정확하게 찾아낼 수 있다. 분석 시간은 일반 노트북PC 기준 2분 남짓으로, 같은 조건에서 30분~10일 이상 걸렸던 기존 알고리즘보다 훨씬 효율적이다.
 
기존 알고리즘은 유전체 빅데이터에서 개개인의 염기서열 차이를 나타내는 ‘스닙(SNP)’을 통계적으로 비교, 분석해 특정 질병과 관련된 유전자 후보군을 가려낸다. 남 교수는 “수십만에서 백만 개 이상의 스닙을 대상으로 해도, 부정확한 정보를 엄격하게 걸러내는 분석을 수행하고 나면 통계적으로 유의미한 스닙이 보통 수십 개에 그친다”며 “이런 결과로는 질병의 유전적 요인을 일부밖에 설명할 수 없다는 한계가 있다”고 설명했다.
 
이런 문제를 해결하기 위해 GSA-SNP2는 이미 질병과 상관관계가 높게 나타난 스닙을 제외한 나머지 스닙들을 대상으로 한 번 더 분석한다. 때문에 기존 분석에서는 묻혀 있었던 후보군을 새롭게 발굴해낼 수 있다. 그러면서도 오답을 내놓을 확률은 마젠타, 마그마와 마찬가지로 0에 가까웠다.
 
남 교수는 “GSA-SNP2 알고리즘을 적용하면 다양한 질병 유전자 후보군을 다수 발굴할 수 있을 것”이라며 “신약 개발, 질병 연구 등에 기여하는 유용한 도구가 되리라 기대한다”고 밝혔다.
 
연구 결과는 국제학술지 ‘뉴클레익 에이시드 리서치’ 19일자 온라인판에 게재됐다.

카카오스토리 네이버밴드 구글플러스

2018년 03월 26일 17:53 프린트하기

 

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

2 + 8 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스