메뉴바로가기본문바로가기

동아사이언스

[테크놀로지와 저널리즘] 구글이 ‘팩트’를 검증하는 방법

통합검색

[테크놀로지와 저널리즘] 구글이 ‘팩트’를 검증하는 방법

2016.10.19 15:00

#1. 컴퓨터가 알아서 편집하는 구글 뉴스


구글 뉴스 사이트에 접속하면 주요뉴스, 추천, 정치, 경제, 사회 등으로 구분된 기사들이 나열된다. 나열된 기사들을 보면서 관심이 가는 기사의 제목에 마우스 포인트를 오버하면 아래 방향의 화살표 두 개로 만들어진 아이콘이 활성화되고 그 아이콘에 마우스 포인트를 오버하면 아래 그림과 같이 “관련기사를 클릭하세요”라는 문구가 활성화된다.

 

구글 뉴스 캡처

아래 방향 화살표 두 개로 구성된 아이콘을 클릭하면 아래와 같은 페이지가 나온다. 이 그림은 2016년 10월 16일 오후 1시 구글 뉴스 사이트에 접속해 “한·중 어업지도단속공무원 교차승선…中 요청 잠정 중단” 관련한 기사의 실시간 관련 기사 버튼을 누른 후 나타난 페이지를 갈무리한 것이다.

 

구글 뉴스 캡처

그림 내용을 보면 알 수 있듯이 중국 어선의 불법 조업과 관련한 ‘실시간 관련기사’들을 먼저 제시하고 이중에서 다른 웹 사이트에서 가장 많이 인용한 기사인 ‘자주 인용된 뉴스’를 추가로 제시하고 있다. 관심이 가는 다른 기사들의 관련 기사들을 불러오면, ‘자주 인용된 뉴스’ 외에 ‘심층 뉴스’, ‘사설’ 등도 함께 볼 수 있다. 주목해서 봐야 할 부분은 그림 하단 빨간 상자 안 “이 페이지의 기사 선별 및 표시는 컴퓨터 프로그램에 의해 자동으로 결정됩니다”라는 문구다.

 

갈무리한 화면 속 모든 기사들은 사람이 아닌 컴퓨터가 자동으로 배치한 것이다. 구글은 비슷한 주제를 갖고 있는 기사들을 한 페이지에 묶은 후 그 성격에 따라 기사들을 구분까지 하고 있다. 이 과정은 모두 사람이 아닌 컴퓨터가 수행한다.


#2. 자동으로 결정되는 뉴스 기사의 형식


구글은 ‘실시간 관련기사’, ‘심층 뉴스’, ‘사설’, ‘자주 인용된 뉴스’ 등만 자동으로 구분하는 것이 아니다. 미국과 영국 지역에서는 이외에도 화제가 되는 뉴스(trending), 국내 취재(local Source), 해외 취재(From [location]), 많이 참조된 웹 콘텐츠(most Referenced), 위키피디아(wikipedia, 해당 뉴스의 맥락과 배경정보를 설명해주는 위키피디아 내용), 풍자 뉴스(satire), 당신이 선호하는 언론사 뉴스(your preferred source) 등의 형식을 자동으로 구분해 제공한다(☞ 관련내용 보기).

 

구글 뉴스 캡처

구글은 위 그림과 같이 이렇게 구분된 형식의 표식(label)을 뉴스 제목 앞에 붙인다. 힐러리 클린턴과 관련된 기사들이 한데 묶여 있는  위 그림의 빨간 상자 안에는 가장 많이 인용된(highly cited), 심층뉴스(in depth), 사설(opinion)이라는 표식이 뉴스 제목 앞에 붙어 있다. 이용자가 내용을 읽지 않더라고 특정 기사가 어떤 성격인지를 알 수 있게 한 것이다. 이 또한 사람이 아닌 컴퓨터 알고리즘이 자동으로 수행한다.

 

그림 오른쪽의 화살표 두 개로 만들어진 아이콘을 클릭하면 더 많은 기사들을 볼 수 있다. 컴퓨터 알고리즘이 뉴스의 심층성을 판단하고, 의견 기사인지 여부를 판단하고, 풍자 뉴스인지 여부를 판단하고, 취재 출처가 어디인지 등을 자동으로 판단하고 있다. 그리고 기사 앞에 ‘표식’으로 형식을 규정해 이용자에게 제공한다.

 

그런데, 뉴스 기사의 형식은 언론사별로 다르며 특정하게 고정되어 있지 않다. 예를 들어, 어떤 사람에게는 풍자로 보이는 내용이 어떤 사람에게는 아픈 내용의 기사일 수 있다. 사람이 내용을 읽어도 판단하기 어려운 풍자 뉴스, 심층뉴스, 사설 등과 같은 형식을 어떻게 컴퓨터 알고리즘이 판단하고 있을까? 최근 구글은 이보다 더 어려운 기사 형식을 자동으로 판단하기 시작했다. ‘팩트 체크(fact check)’다. 


#3. 구글 뉴스에 붙은 ‘팩트 체크’ 표식


지난 10월 13일 구글은 공식 블로그를 통해 ‘구글 뉴스 기사에 팩트 체크 표식을 붙인다’고 밝혔다(☞ 관련내용 보기). PC 웹, iOS와 안드로이드 앱 등에서 모두 지원하며 미국과 영국에서만 우선 서비스를 시행한다.

 

구글 뉴스 캡처

위 그림은 2016년 10월 16일 오후 2시 구글 뉴스 사이트의 영문 에디션 화면을 갈무리한 것이다. 주요 뉴스로 걸린 기사 하단에 ‘팩트 체크’라는 표식을 볼 수 있다. 관련 기사를 볼 수 있는 페이지로 들어가면 ‘팩트 체크’ 형식의 기사를 더 자세하게 볼 수 있다.

 

그런데 ‘팩트(fact)’라는 것은 완전히 객관적이기 보다는 상대적인 것이라고 볼 수 있기 때문에 검증하는 것이 사실 굉장히 어렵다. ‘팩트 체킹(fact checking)’ 형식의 기사가 정치인 등 유력 인사의 공식적 발언, 기자회견, 보도자료, 강연 등 내용, 신문과 방송의 보도 내용, 페이스북, 트위터, 블로그 등 SNS 발언 내용 등을 대상으로 사실을 검증하는 방식으로 주로 이루어져 온 이유다(☞ 관련내용 보기). 구글은 어떻게 ‘팩트 체크’ 형식의 기사를 자동으로 구분해내고 있을까?


#4. 구글이 ‘팩트 체크’ 기사를 찾아내는 방법


구글은 자신들의 기사에 ‘팩트 체크’ 표식이 붙기를 바란다면, 다음과 같은 기준을 충족하라고 제시한다(☞ 관련내용 보기). 우선 그 내용을 보자.


-첫째, 팩트 체크 기사 본문에서 기사의 주장과 팩트를 검증한 내용이 쉽게 구분될 수 있어야 한다. 독자들이 기사 안에서 어떤 팩트가 검증되었고 그 결과가 무엇이었는지를 쉽게 이해할 수 있어야 한다.

-둘째, 팩트 분석에 있어서 반드시 그 출처와 방법이 투명해야 하며, 인용과 참조한 출처는 반드시 신빙성이 있어야 한다.

-셋째, 팩트를 검증하는 곳은 비정파적이어야 하며, 후원 단체와 자금 출처가 투명해야 한다. 특정 개인 혹은 개체만을 타깃으로 검증하기보다는 관련된 주제 영역 내에서 다양한 주장들을 검증해야 한다.

-넷째, 기사 제목은 반드시 검증한 내용을 담고 있어야 하며, 그 결과를 보여줘야 한다. 혹은, 기사 내용이 팩트 체킹임을 알 수 있게 해야 한다.


이 내용만 보면, 구글이 기사 내용을 보고 해당 기사가 ‘팩트 체크’ 기사인지를 판단하는 것처럼 보인다. 하지만, 구글이 제시하는 마지막 조건을 보면 그렇지 않음을 알 수 있다. “만약 우리가 해당 사이트가 이러한 기준들을 위한 ‘클레임 리뷰 마크업(ClaimReview markup)’을 준수하지 않고 있다는 점을 찾는다면, 우리는 우리 재량으로 그 사이트를 구글 뉴스에서 제거할 수도 있다.” 즉, 구글은 기사 내용을 판단해 ‘팩트 체크’ 형식임을 찾아내는 것이 아니라, 자신들이 제시한 형식을 충실하게 따른 기사를 ‘팩트 체크’ 형식이라고 판단하는 것이다.

 

구글 제공

위 그림은 클레임 리뷰 마크업 내용을 설명하는 페이지를 갈무리한 것이다(☞ 관련내용 보기). 마크업은 신문사나 잡지사의 교정 기자들이 쓰는 특수 목적의 표기법으로 문서의 논리적 구조와 배치 양식에 대한 정보를 표현하는 언어를 의미한다.

 

문서에 포함된 문장이나 그림, 표, 소리 등과 같은 문서 내용에 대한 정보가 아니라 그 문장과 그림, 표는 어떻게 배치되고 글자는 어떤 크기와 모양을 가지며, 들여쓰기와 줄 간격, 여백 등에 대한 정보다. 문서 내용 외에 문서의 논리 구조나 체제 같은 형식을 지정하고 색인, 연결 방법 등을 지정하여 컴퓨터 시스템에 지시하기 위한 방식이다.

 

즉, ‘클레임 리뷰 마크업’은 주장을 검증하기 위해 지정된 일종의 컴퓨터 언어 형식이라고 말할 수 있다. 구글은 내용이 아니라 형식을 검증해 자동으로 ‘팩트 체크’ 표식을 기사에 붙이는 것이다. 한편, 이 ‘클레임 리뷰 마크업’은 스키마닷오알지(Schema.org)에 등록돼 있다. 스키마닷오알지는 지난 2011년 구글, MS, 야후가 정형 데이터 검색 기능을 높이기 위해 협력해 만들었다(☞ 관련내용 보기).


구글은 ‘팩트 체크’라는 표식을 기사에 달지만, 기사의 내용을 분석하는 것이 아니라 그 기사의 기술적 형식이 자사가 제시한 기준을 충족하는지를 분석한다. 언론사는 아무리 좋은 내용의 ‘팩트 체크’를 하더라도 그 형식을 충족시키지 못하면 ‘팩트 체크’라는 표식을 부여받지 못하고 심지어는 구글이라는 플랫폼에서 쫓겨날 수도 있다.

 

‘팩트 체크’뿐만 아니라, 심층 뉴스, 풍자 뉴스, 출처 등 모두가 형식에 의해서 자동으로 구분되고 있다. 전달할 팩트를 찾기에도 바쁜 언론사들은 그 팩트를 지정된 형식에 맞게 가공해야 하는 것에도 바빠지고 있다.

 

그런데, 저널리즘의 역할에서 내용이 우선일까, 형식이 우선일까? 사실 답은 명확하다. 플랫폼의 영향력이 콘텐츠 생명을 좌지우지하는 현 상황에서 내용을 우선하라는 요구가 힘을 얻기 힘들 뿐이다.

  

※ 필자소개
오세욱. 학부에서 동양사를 전공하고 언론정보학으로 박사학위를 받았다. 미디어와 관련한 여러 곳의 회사를 다닌 후에 현재는 한국언론진흥재단 미디어연구센터 연구위원으로 재직 중이다. 미디어로서 소프트웨어에 대해 관심을 갖고 연구를 진행 중이다.

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

3 + 9 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스