메뉴바로가기본문바로가기

동아사이언스

"데이터는 정확히 알고 있다. 바이러스가 어디서 왔는지"…오픈데이터로 코로나 추적

통합검색

"데이터는 정확히 알고 있다. 바이러스가 어디서 왔는지"…오픈데이터로 코로나 추적

2020.03.11 17:32
국제인플루엔자데이터공유이니셔티브(GISAID)에 11일까지 올라온 317개 코로나19 게놈 데이터를 넥스트스트레인(Nextstrain.org)에서 바이러스 변이에 따른 전파 경로를 그렸다. 전세계 바이러스의 전파 양상을 시간 순으로 정밀하게 알 수 있다. 넥스트스트레인 화면 캡쳐
국제인플루엔자데이터공유이니셔티브(GISAID)에 11일까지 올라온 317개 코로나19 게놈 데이터를 넥스트스트레인(Nextstrain.org)에서 바이러스 변이에 따른 전파 경로를 그렸다. 전세계 바이러스의 전파 양상을 시간 순으로 정밀하게 알 수 있다. 넥스트스트레인 화면 캡쳐

신종 코로나바이러스 감염증(COVID-19, 코로나19)이 전세계로 확산하고 있다. 파죽지세인 바이러스를 막기 위해 과학자들은 전례 없는 새로운 전략으로 맞서고 있다. 데이터를 공개해 누구나 활용할 수 있게 하는 ‘오픈 데이터’ 정책이다. 의심환자 수와 검사 결과 등 기초적인 임상 데이터는 물론이고, 게놈(유전체) 등 전문적인 바이러스 정보도 그대로 올린다. 각국에서 나온 데이터는 바이러스의 확산을 막고 치료법을 강구할 원천이 되고 있다.


대표적인 오픈 데이터 사례는 바이러스의 기본 정보를 담고 있는 유전물질의 총체인 게놈이다. 각국은 환자의 시료에서 바이러스를 검출하면 게놈을 해독한다. 가래 등 이미 인체의 세포가 가득한 시료에서 작은 바이러스 게놈을 찾아 정확히 해독하는 일이 쉽지는 않지만, 이미 많은 국가에서 시행 중이다. 바이러스에 대한 기본적인 정보를 파악하기 위해서다.


코로나19를 일으키는 바이러스인 사스코로나바이러스-2(SARS-CoV-2)는 ‘리보핵산(RNA)’이라는 유전물질을 게놈으로 이용한다. 약 2만 9900개 정도의 RNA 조각(염기서열)이 모여 이 바이러스이 게놈을 구성한다. RNA 하나는 A, U, G, C 네 개의 염기서열 가운데 하나로 돼 있다. 비유하자면 코로나19 바이러스의 게놈은 2만 9900개의 글자로 이뤄진 책이다. 인간의 게놈이 디옥시리보핵산(DNA) 약 30억 개로 구성돼 있는 책인 것과 비교하면 미물이다.


하지만 이 미물의 게놈 정보는 바이러스의 특성을 파악하거나 감염 확산 상황을 조사할 때 대단히 유용하다. 예를 들어 바이러스의 게놈은 시간이 지날 때마다 조금씩 변한다. AUG였던 부분이 AUA로 하나가 변하는 식이다. 시간이 더 지나면 ACA로 두 개가 변할 수 있다. 9일 과학잡지 ‘사이언스’에 따르면, 코로나19 바이러스는 한 달에 평균 1~2개의 염기가 변이를 일으킨다.


이런 변이는 대부분 바이러스의 특성을 변화시키지 않는다. 정용석 경희대 생물학과 교수는 “바이러스는 소(작은)변이를 많이 일으킬 수 있지만, 이 때문에 바이러스의 특성이 크게 변하지는 않는다”며 “치료하거나 막기 어려워지는 것도 아니다”라고 말했다. 


하지만 변화 자체는 게놈에 누적된다. 이렇게 변한 수를 계산하면 바이러스가 얼마나 오래됐는지 알 수 있고, 반대로 이를 역추적해 바이러스가 지금부터 얼마나 먼저 나왔는지도 알아볼 수 있다. 중국 후베이성 우한 지역에 본격적으로 바이러스가 퍼지던 1월에 일부 과학자들이 “이미 지난해 11월부터 바이러스가 등장해 퍼지기 시작했다”고 주장했던 것도 이런 게놈 해독 연구 결과에 기반했다. 


게놈 정보는 퍼진 지역에 따라서도 조금씩 달라진다. 예를 들어 우한에서 서울로 퍼진 바이러스와 싱가포르에 퍼진 바이러스가 있다면, 이들의 게놈은 시간에 따라 각각 변한다. 이 때 이들이 같은 부위에 같은 변이를 보일 가능성은 낮다. 똑같이 1개가 변하더라도, 서울 바이러스는 AUG가 AUC로 변했다면, 싱가포르 바이러스는 UUG로 변하는 식이다. 이후 서울 바이러스는 인근 경기도로 가서 AUA로 다시 변이를 일으킬 수 있다. 따라서 바이러스 변이가 어디에 일어났는지를 보면 대략 바이러스가 어느 지역에서 온 것인지도 알 수 있다.

 

넥스트스트레인으로 317개 코로나19 바이러스 게놈의 계통도를 그린 결과다. 넥스트스트레인 캡쳐
넥스트스트레인으로 317개 코로나19 바이러스 게놈의 계통도를 그린 결과다. 넥스트스트레인 캡쳐

이렇게 게놈을 바탕으로 감염병의 전파 경로를 확인하는 학문을 ‘게놈 역학’이라고 부른다. 게놈 해독 기술이 발전하면서 나온 신기술이다. 이 학문이 가능하려면, 무엇보다 세계 곳곳에 많은 게놈 데이터가 있어야 한다. 흥미롭게도 누가 먼저랄 것도 없이 과학자들은 자료를 온라인에 올려 모으고 있다. 2008년 과학자들이 바이러스 정보를 신속히 공유하기 위해 구축한 비영리기구인 국제인플루엔자데이터공유이니셔티브(GISAID)에는 지난해 12월부터 현재까지 317개의 사스코로나바이러스-2 게놈 데이터가 올라와 있다. 게놈 전문가인 김태형 테라젠이텍스 바이오연구소 상무이사는 “아직 수가 많지는 않지만, 바이러스 1개당 게놈을 1만 개까지 해독해 아주 작은 미세변이까지 정확히 알 정도로 정밀도가 높다”고 말했다.


오픈 데이터는 오픈 소프트웨어를 통해 분석된다. 온라인에 공개된 분석 프로그램인 ‘넥스트스트레인’을 이용해 분석한 결과를 보면, 이를 보면 지난 4달 동안 전세계 국가에 퍼진 모든 바이러스의 ‘가계도’가 상세히 나온다. 또 각국의 바이러스 게놈이 어디에서 왔는지 지역별 분포도 확인할 수 있다. 


예를 들어 전체 대륙 중 가장 마지막에 코로나 19 환자가 나온 남미의 브라질의 경우, 바이러스의 ‘족보’를 확인해 보면 이탈리아와 영국에서 각각 건너왔다는 사실을 추정할 수 있다. 영국 바이러스는 중국에서 왔고, 이탈리아 바이러스는 중국에서 오스트리아를 거쳐 온 것으로 보인다. 43개의 데이터를 올려 가장 많은 데이터를 공유한 미국의 경우 대부분 중국에서 온 바이러스가 퍼진 것으로 추정된다. 흥미롭게도 현재 가장 많은 환자가 나오고 있는 북서부 워싱턴주 부근에 한국에서 간 것으로 보이는 바이러스도 하나 보고돼 있다. 다만 이미 그 일대에 지역감염이 이뤄진 뒤에 뒤늦게 건너간 바이러스로 보인다. 한국은 12개의 게놈 데이터를 제공했는데, 중국 후베이성과 광둥성, 베이징에서 최초 유입한 바이러스가 퍼진 것으로 추정된다.

 

가장 많은 데이터를 공유한 미국의 바이러스 유입 경로를 시각화했다. 주로 중국에서 온 바이러스가 지역 내에서 지역감염을 일으켰다. 흥미롭게도 중국에서 한국을 거쳐 간 바이러스도 하나 워싱턴주 부근에 보인다. 하지만 이 바이러스는 이미 지역감염이 일어난 뒤 유입된 것으로 추정된다. 게놈을 이용한 게놈역학은 정밀한 데이터로 감염병 확산 경로를 분석하고 예측하는 데 도움이 될 것으로 기대된다. 넥스트스트레인 캡쳐
가장 많은 데이터를 공유한 미국의 바이러스 유입 경로를 시각화했다. 주로 중국에서 온 바이러스가 지역 내에서 지역감염을 일으켰다. 흥미롭게도 중국에서 한국을 거쳐 간 바이러스도 하나 워싱턴주 부근에 보인다. 하지만 이 바이러스는 이미 지역감염이 일어난 뒤 유입된 것으로 추정된다. 게놈을 이용한 게놈역학은 정밀한 데이터로 감염병 확산 경로를 분석하고 예측하는 데 도움이 될 것으로 기대된다. 넥스트스트레인 캡쳐

게놈 해독 기술이 뛰어난 국가는 빠르게 해독 결과를 GISAID에 올릴 수 있다. 하지만 게놈 해독 비용이 부족하거나 기술이 없는 국가도 있다. 이를 위해 이들이 바이러스 게놈 해독을 하도록 표준 절차를 제공하고 교육하는 ‘아틱 네트워크’라는 프로젝트도 있다. 이들은 영국 생명공학기업 옥스퍼드 나노포어 테크놀로지가 개발한 휴대용 게놈 해독기 ‘미니온’을 이용해 게놈을 이틀 안에 해독해 GISAID에 올리도록 지원한다. 6일 공학잡지 ‘IEEE 스펙트럼’에 따르면, 브라질이 최근 이 프로젝트의 도움으로 게놈 해독 결과를 공유했다.


게놈 역학은 아직 세계 각국에서 감염병 방역 정책에 직접 이용되고 있지 않다. 하지만 방역 정책을 정할 때 큰 도움을 줄 수 있다는 게 전문가들의 주장이다. 김 이사는 “바이러스는 거짓말을 하지 않는다”며 “객관적인 정보로 기존 역학조사보다 빠르고 정확하게 감염 경로를 알 수 있어 향후 활용 가능성이 많다”고 말했다. 경우에 따라 길게는 일주일까지 미리 감염병 유행을 알 수 있다고도 말했다.


이를 위해서는 게놈 해독을 빠르게 해서 전세계와 공유할 필요성이 제기된다. 하지만 한국은 환자의 시료를 연구에 바로 이용하기에 규제가 까다로운 편이다. 김 이사는 “시료 속 바이러스 게놈을 확보하려면 기관연구윤리위원회(IRB)를 통해야 하는데, 의사들이 방역 현장에 나가 있는 상황이라 개최가 쉽지 않아 게놈 해독 결과도, 연구 논문도 국내에서 많이 나오지 못하고 있다”며 “감염병 등 시급한 문제에 한해서라도 연구 목적으로 시료 제공을 허용하는 방안도 검토할 필요가 있다”고 말했다.

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

15 + 4 = 새로고침
###
    * 21대 국회의원 선거운동 기간에는 실명확인 과정을 거쳐야 댓글을 게시하실수 있습니다..
    * 실명 확인 및 실명 등록 서비스는 선거운동기간 (2020. 4. 2 ~ 2020. 4. 14) 동안에만 제공됩니다.
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스