메뉴바로가기본문바로가기

동아사이언스

'출근자 많으면 확진자 늘어난다' 코로나19 방역에 도움 주는 데이터과학

통합검색

'출근자 많으면 확진자 늘어난다' 코로나19 방역에 도움 주는 데이터과학

2020.09.04 06:00
직장으로 인식되는 스마트폰 위치 데이터가 많은 지역일수록 감염병 확산이 빠르게 일어난다는 분석이 나왔다. 구글 블로그 제공
직장으로 인식되는 스마트폰 위치 데이터가 많은 지역일수록 감염병 확산이 빠르게 일어난다는 분석이 나왔다. 구글 블로그 제공

정부가 8월 중순부터 신종 코로나바이러스 감염증(COVID-19·코로나19)이 수도권을 중심으로 다시 확산하자 같은 달 19일부터 사회적 거리 두기 2단계 조치를 시행했다. 거리두기 격상 조치 이후 휴대전화 데이터를 분석한 결과 8월 23일부터 27일까지 이동량이 2단계 시행 전인 9일에서 13일까지에 비해 12% 감소한 것으로 나타났다. 정은경 중앙방역대책본부 본부장은 이달 2일 정례브리핑에서 이런 정보를 토대로 “국민들의 적극적인 거리두기 참여 덕분에 폭발적 확산이 억제되고 있다”고 밝혔다. 실제 지난달 30일부터 수도권에서 사회적 거리두기가 2.5단계로 더 강화된 가운데 확진자는 이달 2일 기준 나흘 연속 200명대로 주춤했고 3일에는 195명으로 줄었다. 

 

휴대전화 이동량과 감염자 확산이 어떤 관련이 있는지 아직 완벽히 규명되지는 않았다. 다만 이동량이 줄어들수록 확산세가 힘을 잃는다는 것이 현재까지 드러난 사실이다. 바이러스 전파 조건인 이른바 ‘3밀(밀집, 밀접, 밀폐)’ 환경을 줄여 감염병 전파가 잘 이뤄지지 않기 때문이다.   

 

실제 미국의 데이터 과학자들은 최근 완벽하지는 않지만 휴대전화 이동량 데이터와 감염률간의 관계를 일부 입증했다. 쉬브 세흐라 미국 하버드의대 교수와 조슈아 베이커 미국 펜실베이니아의대 교수 공동연구팀은 미국 내 휴대전화 사용자들의 데이터를 입수해 분석한 결과 직장에서의 활동량이 적을수록 코로나19 감염률이 낮아졌다는 결과를 국제학술지 ‘미국의사협회지(JAMA) 내과학’에 지난달 31일 공개했다.  

 

● “이동량 감소가 코로나19 전파율 낮춘다”

 

세흐라 교수와 베이커 교수 연구팀은 올해 4월부터 구글이 공개 중인 ‘구글 커뮤니티 이동 보고서’에 포함된 익명의 휴대전화 위치 데이터를 분석했다. 구글은 전 세계 휴대전화 이동 데이터를 취합해 주거지와 직장, 소매점, 식료품점, 공원, 교통시설 이동량으로 분류해 제공하고 있다. 미국 전역을 중심으로 연구팀이 분석한 결과 재택근무가 감염병 확산을 줄이는 효과가 입증됐다. 직장 이동량이 상위 25%로 많았던 지역은 하위 25% 지역보다 15일 후 코로나19 환자수가 30% 많았다. 반면 주거지에서의 이동량이 많이 보고된 지역의 경우 이동량 증가가 가장 적었던 지역에 비해 환자수가 늘어나는 증가율이 19%나 적은 것으로 분석됐다. 

 

베이커 교수는 “휴대전화 이동량 데이터 분석은 코로나19 감염 위험지역을 안내하고 방역에 필요한 의사결정에 도움을 줄 수 있다”며 “데이터는 미래 전염병 양상을 예측하거나 보건 조치가 사람들의 행동에 미치는 영향 분석을 돕는다”고 말했다.
 

● 증상은 물론 전파 범위·환자수 예측에도 활용되는 데이터사이언스

 

데이터를 활용한 코로나19 연구는 휴대전화 분석에만 그치지 않는다. 코로나19에 감염되면 후각과 미각을 상실한다는 사실도 대규모 연구 데이터 분석을 통해 밝혀냈다.


후각과 미각 상실은 코로나19 유행 초기 주요 증상으로 한때 논란이 됐다. 하버드대를 비롯한 국제 연구팀은 미국과 영국에서 250만명을 모집해 코로나19 증상 추적기 애플리케이션으로 매일 증상을 보고하도록 했다. 연구팀은 이렇게 수집한 데이터를 분석한 결과 코로나19 양성 판정을 받은 환자 가운데 65%가 후각과 미각 상실 증상을 겪었다는 사실을 알아내 국제학술지 ‘네이처 메디신’에 지난 5월 공개했다.

 

생활하수 분석 데이터를 활용해 코로나19가 전파된 범위를 분석하는 연구도 나왔다. 이탈리아 고등보건연구소(ISS)는 지난해 10월부터 올해 2월까지 생활하수 샘플 40개를 분석한 결과 일부 샘플에서 코로나19 바이러스의 RNA를 발견, 이탈리아의 바이러스 전파 범위를 특정하기도 했다.

 

미국 전역에서 코로나19 관련 증상을 검색한 빈도를 지역별로 표시했다. 미국 내에서 감염병이 빠르게 확산하던 3월 중 검색 빈도가 가장 높은 것을 볼 수 있다. 구글은 증상 검색 데이터베이스를 제공해 연구자들이 코로나19를 예측할 수 있도록 돕는다는 계획이다. 구글 제공

구글과 애플 등 대규모 데이터를 보유한 정보통신기술(ICT) 기업들도 코로나19 연구를 위한 데이터 수집과 공개, 연구 지원에 발벗고 나서고 있다. 애플은 전세계 이동량 보고서를 4월 공개한 바 있다. 구글은 이동량 보고서 외에도 이용자들이 검색한 기침과 발열, 호흡 곤란과 같은 코로나19 증상 400개 이상을 데이터베이스로 만들어 연구자들에게 제공한다고 이달 2일 밝혔다. 이는 미국 각 카운티에서 어떤 증상을 검색하는지를 실시간으로 수치화해 제공하는 것이다. 에브게니 가브릴로비치 구글헬스 선임연구원은 “연구자들은 검색량 데이터를 사용해 지역 내 코로나19 재유행을 미리 예측할 수 있는 지표를 찾아낼 수 있다”고 말했다.

 

● 국내에서도 초기부터 감염병 수리모델 연구 

 

코로나19 사태를 계기로 각종 데이터가 쌓이면서 데이터 과학이 이번 사태 해결의 열쇠를 쥔 주요한 대안으로 떠올랐다.  국내에서는 수도권을 비롯해 전국에서 사회적 거리두기 2단계 격상 조치 여부를 판단하는 데 감염병 수리모델이 큰 역할을 했다. 정은옥 건국대 교수는 8월 2일부터 21일까지 진행된 국내 코로나19 전파 양상이 지속된다면 8월 21일 이후 일일 신규 확진자가 최대 1182명까지 늘어날 수 있다는 연구결과를 내놨다. 감염재생산지수 데이터를 토대로 분석한 수리모델 결과다. 정은경 중앙방역대책본부 본부장도 지난 8월 말 코로나19 전국적 유행 위기 속에서 이같은 결과치들을 거론하며 사회적 거리두기 2단계에 적극 동참해 줄 것을 요청하기도 했다.  

 

데이터 과학이 방역에 도움을 주고 있지만 한계도 존재한다. 구글은 2008년 이미 독감 검색량을 분석해 독감을 예측하는 '독감 트렌드'를 내놓으며 감염병 관련 데이터를 선제적으로 제공했다. 그러나 2013년 미국 질병통제예방센터(CDC)가 발표한 공식 집계보다 2배 넘는 독감 환자수를 예측하면서 2015년에 서비스를 종료하기도 했다. 당시 독감이 평소보다 늦게 유행하면서 독감 검색 데이터가 많아졌는데 이를 독감이 유행한다고 착각한 것이다.

 

국내의 제한적인 데이터 공개가 수리모델 연구에 어려움을 준다는 지적도 있다. 유석현 건양대 예방의학교실 교수는 "정부에서는 환자가 확진된 날짜만 제공하는데 감염재생산지수를 찾으려면 증상이 나타난 날짜가 필요하다"며 "연구자들이 지자체에서 제공하는 확진자 동선 데이터를 일일이 찾아 헤매야 하는 어려움이 있다"고 말했다.

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

7 + 2 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기