메뉴바로가기본문바로가기

동아사이언스

알파고가 인간을 이긴 원동력 바로 이것!

통합검색

알파고가 인간을 이긴 원동력 바로 이것!

2016.08.03 14:00
지난 봄, 알파고가 이세돌9단을 이기면서 바둑과 인공지능이 주목받기 시작했다. - 최호섭 제공
지난 봄, 알파고가 이세돌9단을 이기면서 바둑과 인공지능이 주목받기 시작했다. - 최호섭 제공

●바둑, 마지막 남았던 보드게임

  

적어도 2500년 전에 중국에서 기원한 바둑은 두 대국자가 흑돌과 백돌을 번갈아가며 바둑판에 한 개씩 놓아 더 많은 영역을 만드는 ‘보드게임’이다세계의 과학자들은 1997년 컴퓨터체스 딥블루(Deep Blue)를 제작하여 세계 체스챔피언을 물리친 후, 마지막 남은 동양의 신비로운 보드게임인 바둑에 도전장을 내밀게 된다. 그동안 최신의 인공지능 기법을 활용한 컴퓨터바둑을 제작했으나 여전히 프로기사 수준에 못 미쳐 새로운 방법을 고대해 왔었다.

 

 

프로기사를 제압한 컴퓨터바둑 - 이병두 제공
프로기사를 제압한 컴퓨터바둑 - 이병두 제공

마침내 2007년 모고(MoGo)라는 컴퓨터바둑이 9줄바둑에서 프로기사를 이긴 뒤, 왼쪽 표에서 보듯이 올해 알파고가 최정상 프로기사 이세돌 9단을 제압하는 역사적인 대 사건이 벌어진다

 

이렇게 컴퓨터바둑이 단기간에 비약적인 발전을 할 수 있었던 원동력은 몬테카를로(Monte-Carlo) 방법 활용에 있었다. 현재 거의 모든 컴퓨터바둑은 몬테카를로 방법을 적용하고 있으며, 세계 최강의 알파고 역시 몬테카를로 방법과 인공신경망(ANN: Artificial Neural Network)을 같이 쓰고 있다.

     

 

●몬테카를로 방법

 

몬테카를로 방법은 미국의 수학자 존 폰 노이만과 폴란드계 미국 수학자 스타니스와프 마르친 울람이 제2차 세계대전 중에 핵폭탄 개발을 위해 최초로 사용한 프로젝트의 이름이다. 이 방법은 난수를 이용하여 함수의 값을 확률적으로 계산하는 방법으로, 계산하려는 값이 수학적 형식으로 표현되지 않거나 아주 복잡한 경우에 근사적인 값을 계산하기 위하여 사용된다 

 

바둑은 게임 당 150수 정도가 진행되며, 게임의 복잡도는 우주의 원자 수보다 더 많은 ~10^170 정도가 되어 전형적인 게임트리를 이용하여 컴퓨터바둑을 제작할 수 없다. 그러나 몬테카를로 방법을 이용하게 되면 엄청난 규모의 게임트리를 축소화할 수 있으며, 알파고 역시 몬테카를로 방법을 활용하여 게임트리의 규모를 10만 개 노드 수준으로 줄이는데 성공했다.

분기해 나가는 바둑 게임트리 - 구글 제공
분기해 나가는 바둑 게임트리 - 구글 제공

●몬테카를로 삼목게임

 

삼목(틱택토)게임 - 이병두 제공
삼목(틱택토)게임 - 이병두 제공

몬테카를로 방법, 즉 몬테카를로 시뮬레이션이 어떻게 작동되는지를 소규모 게임의 하나인 삼목게임을 통해 살펴보자. 삼목게임(틱택토, Tic-Tac-Toe)은 전 세계적으로 잘 알려진 게임의 하나로 왼쪽 그림에서 보듯이 두 대국자가 번갈아가며 3×3칸에 X와 O를 연필로 써서 가로, 세로 또는 대각선상에 동일한 모양이 연속으로 3개가 형성되면 이기는 게임이다.

 

삼목게임은 삼목판 내의 9곳을 첫 수로 착수를 할 수 있다. 중앙, , 변 중 어느 곳에 첫 수를 두는 것이 유리한지를 알아보자. 상당한 정도의 몬테카를로 시뮬레이션을 수행하게 되면 아래 표에서 보듯이 중앙, 4, 4변의 평균승률은 각각 51.0%, 33.5%, 19.5%로 밝혀져, 첫 대국자인 X는 첫 수로 중앙에 두는 것이 유리하다는 사실을 알 수 있다

 

착수가 가능한 곳의 평균 승률 값 - 이병두 제공
착수가 가능한 곳의 평균 승률 값 - 이병두 제공

 

 

 

이어서 두 번째 대국자인 O에 대한 4귀의 평균승률은 -42.3%, 4변의 평균승률은 -58.8%가 되며, 최대의 평균승률을 보장하는 귀의 한 곳(-.39)을 두게 된다. 이러한 방법으로 시뮬레이션을 계속 진행하게 되면 최선의 게임결과는 무승부가 되며, 무승부가 되는 일련의 수순의 한 예는 아래 그림과 같다. 아울러 몬테카를로 시뮬레이션을 통해 다음과 같은 삼목게임에 대한 전략도 추론해 낼 수 있다.

 

일련의 순서 - 이병두 제공
일련의 순서 - 이병두 제공
(1)
첫 수는 중앙, 두 번째 수는 귀를 두어라.

(2) 한 수로 승리를 할 수 있는 곳에 두어라.

(3) 상대방의 삼연형(三連形)을 봉쇄하라.

(4) 효율적인 우군의 삼연형을 유도하라.

 

이러한 몬테카를로 시뮬레이션은 현재 컴퓨터게임을 비롯하여, 물리학, 공학, 수문학, 기후변화, 컴퓨터 생명공학, 컴퓨터 그래픽스, 응용통계 등과 같이 전 분야에 걸쳐 적극 활용되고 있다.

 

  

※ 필자소개
이병두. 한양대에서 원자력공학 공학사, 서강대에서 정보처리학 이학석사 수료. 20년간 직장생활을 하다 뉴질랜드 오클랜드대에서 바둑 관련 박사논문으로 컴퓨터공학(인공지능 전공) 박사를 취득했다. 2009년부터 세한대 생활체육학과 바둑학전공 교수로 컴퓨터바둑 연구에 매진하고 있다.

 

배너를 클릭하면, "나는야 바둑왕" 페이지로 연결됩니다! - (주)동아사이언스, AI바둑 제공
배너를 클릭하면, "나는야 바둑왕" 페이지로 연결됩니다! - (주)동아사이언스, AI바둑 제공

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

14 + 7 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스