메뉴바로가기본문바로가기

동아사이언스

[주말N수학] 히든싱어6, 인간과 AI 대결의 승자는

통합검색

[주말N수학] 히든싱어6, 인간과 AI 대결의 승자는

2020.10.03 08:00
JTBC  제공
JTBC 제공

대한민국을 대표하는 가수의 목소리부터 창법까지 그대로 따라하는 모창 도전자들 사이에서 원조가수를 찾는 유명 TV프로그램인 '히든싱어' 시즌6는 백지영, 화사, 장범준 등 화려한 라인업으로 시작 전부터 화제였지만, 2회부터 5회까지 4연속으로 원조가수가 떨어지며 충격을 안겼다.

 

히든싱어 프로그램은 5명의 모창 도전자와 1명의 원조가수가 실루엣만 보이는 통 속에 들어가 한두 소절씩 부르면 100명의 판정단이 원조가수를 찾는 투표를 하는 방식으로 진행된다. 1라운드부터 3라운드까지는 ‘가장 원조가수 같지 않은 사람’을 뽑아 가장 많은 표를 받은 사람이 탈락한다. 마지막 4라운드에는 3라운드를 통해 진출한 3인이 대결을 벌이며 ‘가장 원조가수일 것 같은 사람’을 뽑는다. 


경합에 참여한 대부분의 원조가수는 자신감을 내보이고 원조가수와 인연이 깊은 패널들은 ‘정말 잘 맞힐 자신이 있다’고 확신한다. 하지만 경합이 시작되면 패널과 판정단 모두 혼란에 빠진다. 가수들은 창법을 바꾸기도 하고 나이를 먹으며 목소리가 변해서 그때 그 시절 목소리를 흉내내는 모창 도전자들이 더 원조가수 같을 때가 있기 때문이다.


최근 활용도가 높아지고 있는 인공지능(AI)은 과연 원조 가수를 찾아낼 수 있을까. 패널들의 투표 방식은 공정한 것일까. 시즌6를 통해 다시 화제가 된 히든싱어 프로그램에서 확인할 수 있는 수학적 원리를 찾아봤다. 

 

히든매스 ① 인간과 AI, 대결의 승자는?

 

JTBC 히든싱어6 화면캡쳐
JTBC '히든싱어6' 화면캡쳐

여러 명의 지원자 중 원조가수와 가장 비슷하게 노래를 부르는 5인을 모창 도전자로 뽑고 이후 뽑힌 모창 도전자들은 보컬 트레이너로부터 훈련받기 때문에 원조가수와 모창 도전자를 구별하기란 쉽지 않다. 이를 증명하듯 시즌5까지 총 58명의 원조가수 중 8명이 모창 도전자에게 밀리고 말았다.

 

특히 가수 조성모는 가장 조성모 같지 않은 사람을 지목하는 2라운드에서 무려 100표 중 81표를 받으면서 탈락했다. 현장에 있는 판정단들과 패널들은 스튜디오라는 공간적 특성상 음악이 울리고, 한두 소절만으로 알아맞히는 것이 정말 어렵다고 말한다. 원조가수와 모창 도전자의 노래를 AI로 분석하면 AI는 원조가수를 찾을 수 있을까. 


2016년 최대선 공주대학교 의료정보학과 교수 연구팀은 딥러닝 기반 AI가 원조가수와 모창 도전자를 얼마나 잘 구별하는지 인간과의 대결을 통해 알아보는 연구를 발표했다. 


연구팀은 히든싱어에 나온 원조가수 30명의 발매용 음원을 한 곡씩 AI에 입력했다. 그런 뒤 노래를 낮은 음의 주파수, 중간 음의 주파수, 높은 음의 주파수로 나눠 해당 주파수의 에너지 값을 구해 행렬 데이터로 나타내고 AI가 이 값을 학습하도록 했다. 원조가수와 모창 도전자가 히든싱어에 출연할 당시 부른 노래를 AI에 들려주고 학습한 것과 비교해 오차가 더 작은 음원을 원조가수가 부른 노래로 판단하게 했다. 


이때 오차는 두 값의 차를 제곱한 뒤 그 값들의 평균을 구하는 ‘평균제곱오차’로 구했다. 예를 들어 AI가 학습한 원조가수의 발매 음원의 에너지 값이 (3, 5, -4)이고, 히든싱어에서 부른 원조가수의 노래는 (1. 7, -6), 모창 도전자가 부른 노래는 (-2, 8, -8)이라 해보자. 그럼 AI가 학습한 음원과 히든싱어에서 원조가수가 부른 노래 사이의 오차는 (3-1)²+(5-7)²+(-4-(-6))²/3  으로  3분의 12가 된다. 반면 AI가 학습한 것과 히든싱어에서 모창 도전자가 부른 노래의 오차는 (3-(-2))²+(5-8)²+(-4-(-8))²/3 으로  3분의 50이 된다. 두 오차 중 원조가수가 히든싱어에서 부른 노래와 음원의 오차가 더 작으므로 AI는 원조가수의 노래를 선택하는 것이다. 


연구팀은 학습한 AI의 능력 수준을 알아보기 위해 인간 24명이 AI를 상대로 30명의 원조가수를 찾는 대결을 펼쳤다. 그 결과 컴퓨터는 30명 중 18명을 맞혀 60%의 정답률을 보였고, 인간 참가자의 평균은 10.5명으로 35%가 나와 인간보다 AI가 높은 정답률을 보였다. 생각보다 AI의 정확도가 낮은 것은 AI 역시 원조가수의 원곡을 토대로 학습하기 때문에 나이가 들어 원조가수의 목소리가 변하거나 창법이 바뀐 가수의 목소리는 평균제곱오차가 커 판단하기 어려웠기 때문이다.  

 

24명의 참가자 중 가장 답을 많이 맞힌 인간 우승자와 AI의 원조가수 찾기 대결 결과로, 인간 우승자와 AI 모두 18명을 맞혔다. 수학동아DB
24명의 참가자 중 가장 답을 많이 맞힌 인간 우승자와 AI의 원조가수 찾기 대결 결과로, 인간 우승자와 AI 모두 18명을 맞혔다. 수학동아DB

히든매스 ② 히든싱어 투표 방식은 공정할까?

 

히든싱어의 원조가수 찾기 투표 방식은 1~3라운드와 4라운드가 다르다. 1~3라운드에서는 ‘가장 원조가수 같지 않은 사람’에게 투표해 가장 많은 표를 받은 사람을 떨어뜨리고, 4라운드에서는 ‘가장 원조가수 같은 사람’에게 투표해 가장 많은 표를 받은 사람이 우승자가 된다. 히든싱어 애청자들 사이에선 1~4라운드 모두 원조가수를 찾는 방식으로 투표하고 가장 적은 표를 받은 사람을 떨어뜨리는 방식으로 하는 것이 좋을 것 같다는 의견도 많다. 수학으로 두 방식을 비교하면 어떤 결과가 나올까.

 

 

위 그림에서 왼쪽의 계산 결과는 인간이 내릴 수 있는 판단의 영역을 고려하지 않고 계산한 것이다. 모창 도전자와 원조가수가 너무 비슷해서 정말 모르겠을 때 무작정 찍는 상황에서 위와 같은 결과가 나오는 것이다. 


히든싱어 투표방식을 수학적으로 확인한 이광연 한서대학교 교육대학원 수학교육전공 교수는 “인간은 원조가수와 모창 도전자의 목소리를 듣고 자신만의 기준으로 최선의 판단을 한다”며, “인간 개개인의 판단은 수학적으로 정량화하기 힘들기 때문에 완벽한 확률을 계산하기는 어렵다”고 말했다. 


화려한 무대, 웅장한 퍼포먼스 등 보이는 것이 더 중요해진 가요계에서 히든싱어는 온전히 귀로 듣는 음악의 매력을 알게 해준다. 눈을 감고 원조가수를 찾기 위해 노래에 집중하다 보면 모창 도전자의 실력에 깜짝 놀라는 한편 ‘이 노래가 이렇게 좋았구나’ 깨닫게 된다. 히든싱어 애청자라면 다시 한번 귀를 쫑긋 세우고 원조가수를 찾아보자. 귀로 즐기는 음악의 매력을 알게 될 것이다.

 

※도움

이광연(한서대학교 교육대학원 수학교육전공 교수), 최대선(숭실대학교 소프트웨어학부 교수)

 

※참고자료 

 최대선 외 3인 ‘딥러닝 기반 모창가수 구분에서 특징 추출 방법-히든싱어 컨테스트’

 

※관련기사

수학동아 10월호, 히든싱어6

 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

8 + 8 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기