메뉴바로가기본문바로가기

동아사이언스

[주말N수학] 데이터 사이언티스트, 데이터로 세상을 읽다

통합검색

[주말N수학] 데이터 사이언티스트, 데이터로 세상을 읽다

2020.05.16 15:00
 

카드부터 SNS, 웹 사이트까지! 데이터로 정보를 주고받고 흔적을 남기는 ‘데이터 시대’에 살고 있다고 해도 과언이 아니다. 데이터 분석의 활용도와 중요성도 커지고 있다. 단순히 데이터 해석에 그치지 않고 신제품 개발은 물론 신종 코로나바이러스감염증(COVID-19·코로나19) 확산 예측에까지 데이터 분석이 쓰이고 있다. 핀테크 기업 대표이사를 하다가 돌연 데이터 분석 전문 회사를 창업한 지윤성 데이터 사이언티스트를 만나 데이터의 중요성에 대해 들어봤다. 

 

Q. 데이터 관련 일을 하게된 계기는.


컴퓨터 공학을 전공하고 한글과컴퓨터에 입사해 클라우드 서비스와 관련된 일을 했다. 웹에서 문서 작업을 할 수 있도록 웹피스(웹+오피스)를 만들었는데, 이때 사용자들이 주로 만드는 문서나 작업 종류 등의 정보를 접할 수 있었다. 불현듯 이런 데이터들을 분석하면 더 나은 서비스를 만들 수 있을 거라는 생각이 들었다. 

 

29016년 구글의 인공지능(AI) 관련 기업 딥마인드가 개발한 바둑 AI '알파고'와 이세돌 9단의 대결 이후 빅데이터와 AI가 뜨면서 데이터 분야에 도전하기로 마음먹었다. 2017년 데이터를 분석해 컨설팅을 제공하는 회사 '링크브릭스'와 뉴스 팩트체크를 하는 회사 '뉴스톱'을 창업했다. 


Q. 현재 어떤 일을 하나.


인공지능과 기계학습으로 데이터를 분석하고, 분석 결과로 효율적인 마케팅 전략을 세우는 데이터 전문 회사 링크브릭스를 경영하고 있다. 


데이터 관련 회사는 대부분 프로그램 개발자가 창업한다고 생각하는 경향이 있는데, 링크브릭스는 데이터를 직접 분석하던 사람들이 모여 만든 회사다. 그래서 데이터를 분석하는 프로그램을 개발하기 보다 필요한 프로그램을 제공하는 회사와 기술 제휴를 맺어 그 프로그램으로 직접 데이터를 분석한다. 그리고 결과를 바탕으로 방향을 제시하는 컨설팅을 한다.


Q. 주로 어떤 분야의 데이터를 다루나.


의류, 신발 등을 판매하는 소매업체의 고객 분석을 많이 한다. 예를 들어 한국 시장 진출을 목표로 하는 해외 화장품 회사에게는 K-뷰티의 최신 트렌드를 분석한 데이터를 전달한다. 또 제품을 홍보하기 위해 인터넷 스타 등 '인플루언서'들과 콜라보를 기획한다면, 어떤 인플루언서와 해야 하는지 각종 데이터를 분석해 팔로워나 구독자를 가짜로 올린 인플루언서를 찾아 걸러 알려준다. 이런 분석은 짧은 시간 안에 폭발적으로 '팔로워' 수나 '좋아요' 수가 늘어난 사례를 찾을 수 있는 시계열 분석으로 한다. 분석 결과 현재 인플루언서 중 60%는 가짜였다.

 

Q. 다른 분석 사례가 있을까.


식음료 회사에는 SNS에 올라오는 글을 분석해 유행하는 음식 메뉴를 찾아 제시하고, 새로 나온 제품에 대한 소비자 반응도 전달한다. 또 테러와 관련된 키워드를 자주 언급하는 SNS 사용자를 찾아 위험 정도를 파악하고 추적하기도 하고 비슷한 방식으로 특정 지역의 범죄율이나 보안 정도를 추정하기도 한다. 최근엔 해외 기업과 함께 코로나19 바이러스의 확산 과정을 예측하기도 했다. 

 

Q. 코로나19 확산은 어떻게 예측하나.


생명과학 및 공학 분야의 주제를 정보통신 기술로 분석하는 분야를 생물정보학(바이오인포매틱스)이라고 한다. 2009년부터 뜨기 시작했는데, 이 분야에 사용하는 모형을 이용해 예측했다. 미국과 영국 연구진이 각각 만든 두 종류의 모형을 사용했는데 각 모형의 특성에 따라 더 정확하게 예측하는 값을 골라 데이터를 얻었다.


2020년 1월에 공개한 예측 결과에서는 코로나19가 세계보건기구(WHO)가 선포하는 감염병 최고 경고 등급인 ‘팬데믹’까지 진행할 것이라 예상했다. 실제로 3월 12일 WHO가 팬데믹을 선언했다. 당시 우리나라는 3월 말부터 4월이 정점일 것으로 예상하고, 감염자 수는 1만 명에서 1만 2000명 정도로 봤는데 예측이 맞아 떨어지고 있다.

 

 

 

Q. 학생들에게 데이터 분야 직종을 추천하는 이유는. 


다양한 분야에서 데이터를 다룰 줄 아는 인력을 구하는 전쟁이 벌어지고 있다.  아직 한국에서는 데이터 관련 인재가 부족해 사람을 구하기 힘들기 때문이다. 데이터 사이언스 대학원도 연 지 얼마 되지 않아 외국 인재들을 데려오고 있다. 지금 중고생인 독자들이 데이터 분야를 선택한다면 앞으로 정말 많은 기회가 있을 거라고 생각한다. 수학 문제를 풀듯 ‘이런 데이터를 분석하면 재밌는 결과를 얻을 수 있을 거야!’라든가, ‘많은 데이터에서 정보를 얻으려면 어떤 도구를 써야 할까?’와 같은 ‘상상’에 즐거움을 느끼는 독자라면 도전해 보라!

 

Q. 데이터 분야의 전망은.


이제 데이터 분석은 어딜가나 기본이 됐다. 자율주행이나 알파고 같은 새로운 서비스도 데이터를 분석하고 반영해 나온 결과이고, 우리나라의 대기업에서도 광고나 마케팅 등을 위해 빅데이터를 다룰 정도로 이미 광범위하게 쓰이고 있다.


하지만 여전히 많은 가능성이 열려 있다, 데이터를 다루는 기업은 크게 세 종류가 있다. 데이터를 분석하는 프로그램을 개발하는 회사, 데이터 분석을 통해 마케팅 전략을 세우는 회사, 마지막으로 분석 결과로 세운 전략을 실행하는 회사다. 


그런데 이 세 분야를 모두 아우르는 미국의 ‘팔란티어’ 같은 데이터 전문 기업은 아직 많이 없다. 앞으로 이런 기업이 많아질 것이라 예상한다. 링크브릭스를 우리나라의 팔란티어로 만드는 게 목표이기도 하다.


Q.데이터 사이언티스트를 꿈꾸는 학생들에게 조언한다면.


수학을 공부하는 것도 중요하지만, 데이터 사이언티스트로 활약하기 위해서는 다양한 분야에 관심이 많아야 한다. 만약 어떤 제품이 유행하면, 그 제품이 유행하는 이유를 사회 현상 등과 연결지어 읽어낼 수 있어야 한다. 그래서 여러 종류의 자료를 많이 듣고 보는 사람이 유리하다. 자신만의 흥미를 찾아 다양한 경험을 쌓고 주변을 잘 관찰해 보라. 

 

진로 가이드 데이터 사이언티스트 “다양한 경험을 쌓는 게 필수!”

 

중·고등학교 : 수학 문제를 풀어 답을 찾는 것도 중요하지만 왜 풀어야 하는지, 필요한 수식을 왜 사용해야 하는지 고민해 봐야 한다. 그리고 수학 문제를 어떻게 사회 현상과 연결지어 쓸 수 있을지도 생각해보면 좋다. 엑셀 등의 프로그램을 사용해 그래프를 그려 데이터 분석을 직접해볼 수도 있다. 예를 들어 게임 시간과 성적의 상관관계를 분석해볼 수도 있다. 주변에서 데이터를 분석해볼 만한 주제를 찾는 것도 좋다.

대학교 : 전공은 그리 중요하지 않다. 이공계나 인문계 상관 없이 온라인 무료 교육 과정을 듣거나 데이터를 다같이 분석해 결과를 공유하는 ‘케글’ 등의 사이트에서 활동하면서 스스로 공부할 수 있다. 배우면 누구든지 데이터 분석을 할 수 있답니다.

회사 : 회사가 가진 데이터로 어떤 정보를 얻을 수 있을지 끊임없이 고민해야 한다. 예를 들어 휴식 시간이 있는지 없는지, 있다면 얼마인지에 따라 생산성을 최대한으로 높일 수 있는 방법을 고민해볼 수 있다. 자신의 업무 효율을 높이기 위해 뭘 바꿔야 할지도 생각해볼 수 있다. 만약 좋은 아이디어가 떠오른다면 창업 아이템으로 쓸 수도 있다.

 

※관련기사

수학동아 5월호,  [진로체험] 지윤성 데이터사이언티스트, 데이터로 세상을 읽다

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

12 + 5 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스