메뉴바로가기본문바로가기

동아사이언스

[주말N수학] 미스터 트롯 대역전극 수학은 알고 있었다

통합검색

[주말N수학] 미스터 트롯 대역전극 수학은 알고 있었다

2020.05.02 06:00
TV조선 '미스터트롯'의 참가자들. 수학동아DB

전국민을 트로트 신드롬에 빠지게 만든 오디션 프로그램 ‘내일은 미스터트롯’이  3월 14일 막을 내렸습니다. 최고 시청률 35.7%를 기록하며 남녀노소 모두를 TV 앞에 모이게 한 마성의 방송이었죠. 물론 수학자도 예외가 아니었습니다.  미리 점수를 예측한 수학자가 있는가 하면, 직접 개발한 알고리듬으로 투표 조작은 없었는지 따져본 수학자도 있었습니다. 수학자는 미스터트롯 오디션을 어떻게 봤는지 살펴봤습니다. 

 

“방송 사상 초유의 일입니다. 문자 투표수가 예상을 뛰어넘는 전례 없는 일입니다!”


3월 13일 새벽 1시가 넘은 시간, 트로트 가수 오디션 방송 프로그램인 ‘내일은 미스터트롯’의 최종 생방송 진행을 맡은 사회자 김성주 씨는 당황하며 이렇게 말했습니다. 최종 순위를 결정하는 전국민 문자 투표 결과를 발표해야 하는데, 773만 1781건의 문자가 일시에 쏟아지면서 집계 불능 상태에 빠진 겁니다. 시즌1인 ‘내일은 미스트롯’의 온라인 대국민 투표의 총 득표수가 42만 6268표였기 때문에 제작진은 이렇게 많은 문자가 오리라고는 예상하지 못했습니다. 결국 사회자는 시청자들에게 사과하면서 최종 순위 발표를 약 1주일 연기하겠다고 말했습니다. 그리고 하루 뒤인 3월 14일 예정에 없던 방송을 편성해서 최종 결과를 발표했습니다.


오디션 프로그램 사상 초유의 상황이 발생한 미스터트롯은 수학자의 이목도 집중시켰습니다. 최수영 아주대 수학과 교수는 순위 발표가 연기된 상황을 설명하며 “통계에서 데이터 전 처리의 중요성을 보여준 사례”라고 말했습니다. 이틀 뒤 최종 순위를 공개하는 방송에서 총 득표수인 773만 1781표가 아닌 유효 득표수 542만 8900표를 기준으로 순위가 정해졌기 때문입니다. 데이터 전 처리 과정에서 무려 230만 2881표가 무효 처리된 겁니다. 데이터 전 처리란 본격적인 분석을 하기 전에 데이터에서 불규칙한 부분이나 명료하지 않은 부분을 수정하는 작업을 말합니다.


제작진은 투표의 정확성을 위해 수많은 표를 무효 처리할 수밖에 없었다고 밝혔습니다. 예를 들어 이름을 잘못 표기하거나 여러 이름을 하나의 문자메시지에 쓴 경우를 무효 처리한 것이죠. 그런데 정확성을 중시하다 보니 문자메시지에 이름과 함께 이모티콘을 넣거나, 문장부호를 넣은 경우까지 모두 제외했습니다. 예를 들어 ‘임영웅!’이라고 쓴 메시지도 무효 처리한 것입니다. 이런 부분은 추가 데이터 처리를 통해 충분히 인정할 수 있습니다. 

 

결과 발표 전 미리 예측한 2위와 3위의 점수

 

최수영 아주대 수학과 교수

미스터트롯을 통해 생각해볼 수 있는 수학은 통계 분야의 데이터 전 처리뿐만이 아닙니다. 최 교수는 “순위 발표를 보는 동안 2위와 3위의 점수를 수학적으로 예측할 수 있어서 더욱 흥미로웠다”고 말했습니다.

 

미스터트롯에서 총점은 4000점 만점인데, 음악 전문가가 주는 마스터 총점이 최고 2000점, 홈페이지에서 이뤄지는 대국민 응원투표가 최고 800점, 마지막 생방송에서 문자메시지로 이뤄지는 실시간 국민투표가 최고 1200점입니다. 이 중에서 마스터 총점과 대국민 응원투표 점수는 이미 결정돼 있었습니다. 결국 실시간 국민투표 결과만 확인하면 최종 순위를 알 수 있는 겁니다. 


그런데 최종 결과의 핵심인 실시간 국민투표 점수는 흥미롭게도 ‘비례식’을 이용해 산출했습니다. 1위의 득표율을 기준으로 점수를 배분하는 방식입니다. 가장 많은 표를 얻은 사람이 1200점을 받고, 2등부터는 1위의 득표율에 비례해 점수를 매기는 겁니다. 이때 소수점 아래 셋째 자리에서 반올림했습니다.

 

 

예컨대 1위의 득표율이 30%, 2위의 득표율이 25%라고 하면 왼쪽과 같은 식을 통해 2위의 점수(A)가 1000점임을 알 수 있습니다.

 

 

최종 결승에 오른 후보는 총 7명이었는데, 순위 공개 방송에서 제작진은 1위의 득표율이 25.32%라는 것을 먼저 공개하고 7위부터 순위와 점수를 발표했습니다. 방송을 시청하던 최 교수는 순위가 4위까지 공개되자 회심의 미소를 지었습니다. 간단한 계산을 통해 2위와 3위가 얻을 점수를 대략적으로 예측했기 때문입니다.

 

 

최 교수는 이런 방식으로 방송을 보면서 2위와 3위의 점수를 예측했고 실제 결과인 3위(y) 745.08점, 2위(x) 863.30점은 정확히 계산한 범위의 값을 얻었습니다. 다만 2위와 3위 점수의 합이 예측했던 값인 1608.89보다는 0.51점 작게 나왔는데, 이는 계산 과정에서 점수를 소수점 아래 셋째 자리에서 반올림하면서 나타난 차이입니다. 


최 교수는 “점수를 보면 알 수 있지만 순위 결정에 가장 큰 영향을 미친 것은 전문가 평가나 응원투표가 아닌 실시간 국민투표였다”고 말했습니다. 전문가 평가와 응원투표 점수를 합산한 결과 1위와 7위 사이의 점수 차이는 85점이었는데, 실시간 국민투표에서는 1위와 2위 사이의 점수 차이만 무려 336.7점이었기 때문입니다.

 

미스터트롯의 최종 결과는 직전까지 2위였던 임영웅 씨가 1위에 올라서는 역전극이었습니다. 3위였던 영탁 씨가 2위를 차지했고, 1위였던 이찬원 씨는 3위로 내려왔습니다. 그런데 수학적으로 생각해보면 방송에서 유효 득표수가 542만 8900표라는 것을 공개한 시점부터 이미 역전극의 가능성이 높다는 것을 알 수 있습니다. 최종 국민투표 전까지 1위와 7위의 점수 차이인 85점은 방송 초반에 공개한 1위의 득표율 25.32%를 기준으로 계산했을 때 약 1.79%이며, 이는 약 9만 7378표 차이여서 전체 득표수를 고려하면 충분히 역전 가능성이 있는 것입니다. 특히 1위와 2위의 점수 차이는 17점에 불과했기 때문에 약 1만 9476표만 더 얻으면 충분히 역전이 가능하다고 예측할 수 있습니다.

 

득표수가 조작되지는 않았을까

 

이상준 경희대 수학과 교수

미스터트롯은 오디션 프로그램 역사상 처음으로 최종 투표 결과를 연기하는 사례를 남겼습니다. 자연스럽게 ‘투표 결과를 조작한 것은 아닐까’라는 의문이 뒤따를 수 있습니다. 2019년 전국을 떠들썩하게 만든 ‘프로듀스 X 101’의 득표수 조작 사건이 있었기 때문입니다. 이상준 경희대 수학과 교수는 박태정 덕성여대 교수, 송현주 숭실대 교수와 함께 프로듀스 X 101 사건을 계기로 득표수가 곱셈으로 조작됐는지를 판별하는 알고리즘을 개발했는데 마침 방송되던 미스터트롯에 연구 결과를 적용했습니다. 


알고리즘이 작동하는 원리는 투표 결과를 입력했을 때 각 후보의 득표수가 ‘특정 실수(α)와 정수의 곱의 반올림’으로 표현되는지 확인하는 것입니다. 여기서 주의할 점은 각 후보의 득표수를 이렇게 나타낼 수 있다는 것을 확인했을 때, 이 결과가 득표수 조작에 의한 것일 수도 있고 우연에 의한 것일 수도 있다는 점입니다. 이 교수팀이 얻어낸 알고리즘은 무작위로 만들어낸 많은 투표 결과를 적용해서 득표수를 조작했을 통계적 확률도 얻을 수 있습니다. 계산 결과 최종 후보 7명의 득표수는 7.227566이라는 실수에 어떤 정수를 곱한 뒤 반올림해서 얻을 수 있는 정수였습니다. 예를 들어 1위인 임영웅 씨의 득표수인 1374748은 7.227566에 190209를 곱한 뒤 반올림하면 나옵니다. 또 2위인 영탁 씨의 득표수인 989020은 7.227566에 136840을 곱해 반올림한 결과입니다.


하지만 이 교수는 “미스터트롯 투표 결과는 α(=7.227566)를 얻었다고 해서 조작됐다고 보기 어렵다”고 말했습니다. 최종 후보가 7명이고, α가 7 정도에 불과했기 때문입니다. 표를 받는 후보 수가 적은 경우, 사실은 무작위로 투표한 결과라도 우연히 특정 실수에 정수를 곱해서 반올림한 값과 일치할 확률이 높습니다. 예를 들어 후보가 2명이고 득표수가 102표와 606표라면 조작한 것이 아니더라도 두 수가 6에 17과 101을 곱해서 만든 것으로 의심할 수 있습니다. 반면 프로듀스 X 101처럼 후보 20명의 득표수가 모두 7494.442(α)라는 실수에 다양한 정수를 곱해 얻어지는 결과와 일치하는 경우라면 후보자 수도 많고 α도 크기 때문에 투표 결과를 조작했을 가능성이 높습니다.

 

이 교수 연구팀이 개발한 알고리즘은 어떤 투표 결과를 알 때 그 결과가 조작됐을 확률이 얼마인지까지 확인할 수 있어 신뢰도가 높습니다. 실제로 프로듀스 X 101의 경우 득표수가 조작됐을 확률이 거의 100%인 것으로 나타났습니다. 이 교수는 “프로듀스 X 101처럼 후보의 수가 20명이 넘고 공통적으로 곱하는 α가 커지면 신뢰도 높은 결과가 나온다”며 “하지만 미스터트롯은 두 수가 작기 때문에 단순히 α를 얻었다고 해서 조작했다고 보기 어렵다”고 말했습니다.


연구팀이 개발한 알고리즘은 앞으로 다양한 투표에서 조작 여부를 검증하는 데 활용할 수 있을 것으로 기대됩니다. 이 교수의 연구처럼 방송 프로그램에서 수학 연구가 시작되고, 그 결과를 다시 실생활에 활용할 수 있다는 점은 흥미롭습니다. 최 교수 연구처럼 학교에서 배우는 간단한 비례식 계산을 활용해 오디션 순위를 예측하고 그 결과를 확인하는 것도 수학을 좋아하는 사람만 누릴 수 있는 기쁨입니다. 

 

● 득표수 조작 검증 알고리즘, 이렇게 작동한다

 

 

득표수가 곱셈에 의해 조작됐는지 확인하는 방법은 i번째 후보자의 득표수를 yi 라고 했을 때, yi=[α × xi]  를 만족하는 실수 α와 정수 xi를 찾아내는 것입니다. 여기서 [ ]는 소수점 첫째 자리에서 반올림한 값입니다. 하지만 문제는 무한히 많은 실수를 모두 대입해볼 수 없다는 점입니다.


연구팀은 수학적 증명을 통해 α가 하나의 값이 아닌 특정 구간에 포함된 값들이라는 사실을 알아냈습니다. 대략적인 이유를 말하면 α 곱하기 xi에 의해 계산한 득표수 자체는 반올림한 정수기 때문입니다. 예를 들어 프로듀스 X 101에서 α는 7494.442라는 사실을 한 네티즌이 발견했습니다. 하지만 실제로는 7494.441489362766부터 7494.442708332292 사이에 있는 모든 실수가 가능합니다. 이 범위의 모든 수로 계산하면 반올림해서 같은 결과를 내놓는 것을 알 수 있습니다. 7494.442는 이 구간의 수 중에서 소수 부분의 자릿수가 가장 작은 수일 뿐입니다.

 

 

하지만 좁힌 구간 역시 실수기 때문에 무한히 많이 계산해야 한다. 연구팀은 우선 α가 대략적으로 득표수 차이의 최솟값보다는 같거나 작아야 한다는 조건을 이용해 범위를 좁혔습니다. 득표수가 조작됐다면 각 득표수는 α에 정수를 곱한 값을 반올림한 것이기 때문에 득표수 사이에 존재할 수 있는 가장 작은 격차는 α에 정수를 곱한 값과 유사하다는 점을 활용한 것입니다. 이렇게 범위를 좁힌 뒤 ‘무한히 많은’ 실수인 α가 아니라 ‘유한한’ 정수 xi를 기준으로 계산하는 아이디어를 이용해서 유한 번의 계산으로 득표수 조작 여부를 확인할 수 있었습니다.


마지막으로 가상으로 생성한 수만 개의 득표수를 알고리즘에 넣고 컴퓨터로 계산해 검증 결과를 얼마나 신뢰할 수 있는지 확률적으로 확인했습니다. 그 결과 표를 받는 후보의 수가 40명 이상이거나 α가 16 이상이면 완벽히 득표수 조작 여부를 확인할 수 있었습니다. 또 후보자 수가 20명 이상이면서 동시에 α가 2.42 이상이면 검증 결과를 거의 100% 신뢰할 수 있었습니다.

 

※도움말  이상준(경희대학교 수학과 교수), 최수영(아주대학교 수학과 교수) 

 

※관련기사 수학동아 5월호, 대역전극, 조작 여부, 수학은 알고 있었다?! 내일은 미스터트롯 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

6 + 4 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스