메뉴바로가기본문바로가기

동아사이언스

[알파고 vs 이세돌]이세돌, 제3국은 초중반에 승부 걸어라

통합검색

[알파고 vs 이세돌]이세돌, 제3국은 초중반에 승부 걸어라

2016.03.12 08:22

2국의 바둑 기술적인 측면은 이미 방송 등에서 프로 사범님들께서 자세히 해설하셨으니, 알파고의 특징이 잘 드러난 장면을 몇 군데만 짚고 넘어가자.


1. 알파고의 목표는 바둑을 최대한 이른 시점에 solved game으로 만드는 데 있어


Solved game이라는 표현이 있다. 13줄 바둑판에서 두는 오목은 이미 1993년에 백이 어떻게 응수하더라도 흑이 무조건 이길 수 있는 수순을 모든 경우의 수를 따져서 찾아냈다.

 

즉, 신을 상대하더라도 흑이 무조건 이긴다. 체스에서도 기물이 6~7개 남는 순간부터는 완벽한 플레이가 가능하다. 바둑도 종반으로 갈수록 solved game에 가까워진다. 둘 수는 있지만 둬봤자 의미가 없는 수(예를 들면, 상대가 두어 번 손 빼도 도저히 살 수 없는 곳에 들어가는 수)를 제외하면 더욱 급격히 solved game에 가까워진다.

 

그러므로 알파고의 목표는 단 반 집만이라도 앞선 채 최대한 빨리 바둑을 solved game으로 만드는 데 있다.

 

그림1 - 감동근 제공
그림1 - 감동근 제공

 

<그림1> 흑15는 우리가 생각할 때 분명 악수다. 이 대신에 흑A로 뛰고 백이 받지 않으면 B에 붙인다던 지, 화점에 찝는다던지 다양한 활용 수단이 있던 자리다.

 

그런데 백C와 흑D가 교환된 다음이라면, 흑이 15로 둘 때 백은 16으로 받지 않고 E로 넘을 수도 있다. 즉, 흑15와 백16을 교환하지 않으면 고려해야 될 경우의 수가 급격히 늘어나게 되고, 따라서 solved game으로 들어가는 시점이 상당히 늦춰진다.

 

이는 알파고가 원하는 바가 아니므로, 집으로만 따지면 별 손해가 없는 흑15는 변화의 여지를 없애는 당연한 선택이다.

 

1국에서 이세돌 9단이 돌을 거둔 시점보다 30분 앞서 알파고가 승리를 선언했다는 뉴스가 있다. 이것은 그 시점에 바둑이 solved game 상태로 들어갔다는 것을 의미한다.

 

알파고가 패를 꺼린다면 그것은 패와 팻감의 가치를 계산하기가 어려워서가 아니라, 수순이 길어지는 것을 원치 않기 때문일 것이다.

 

2. 4선에 놓인 돌을 어깨 짚어?

 

<그림2> 백36까지 진행되자 서로 벌릴 데 다 벌린, 프로들이 흔히 얘기하는 ‘재미없는 바둑’이 됐다. 아마추어들은 다음 한 수를 맞추기가 상당히 어려운 장면이다.

 

프로들의 선택은 대개 두 가지라고 한다. 급전을 즐기는 기풍이라면 A에 이어서 싸우고, 안정적인 기풍이라면 B나 D로 우변을 견제하면서 중앙을 키우고 나서 A를 노리는. 흑C는 백E로 왔을 때 차단하는 방법이 없는 데다가 우상 백 돌을 압박하지도 못해서 논외다. 이왕 백E를 차단하지 못할 바에는 차라리 흑D로 한 발 더 가서 백F면 흑G를 두고, 백이 손 빼면 흑H로 달릴 수 있다.

 

알파고의 흑37은 4선에 있는 백36에 어깨 짚는 셈이라 일견 이상해 보이지만 실은 흑D와 맥락이 별로 다르지 않다.

 

그림2 - 감동근 제공
그림2 - 감동근 제공

3. 두터움의 가치를 정확히 집으로 환산할 수 있는 것으로 보여

 

<그림3> 흑41과 백42를 교환한 다음에 43으로 이은 것은 분명 이상하다. 알파고의 감각 즉, 정책망에는 확실히 약점이 있다. 이세돌 9단이 좋은 수를 발견해 백60까지 상당한 이득을 봤다. 그런데 흑73이 오고 나니까 무거워 보이던 흑 돌이 돌연 두터운 세력이 됐다. 이정우 9단에 따르면 흑73을 당한 이후로는 백이 유리했던 적이 한 번도 없었다고 한다. 결과론적으로 백70으로는 73자리를 가르고 나왔어야 한다. 그랬다면 나중에 백A로 침투했을 때의 결과도 전혀 달라졌을 것이다.

 

이후 알파고는 완벽한 반면 운영을 보여준다. 이세돌 9단으로서도 그 만이 둘 수 있는 바둑은 아니었지만 그렇다고 눈에 띄는 실수도 없었다. 백70도 아주 큰 자리라 한 눈에 패착으로 지목하기도 어렵다. 그런데도 어느새 반면 10집 이상 차이가 났다. 그 과정에서 알파고가 보여준 중앙 처리나 끝내기 수순들……. 알파고는 두터움의 가치를 정확히 집으로 환산할 수 있는 것으로 밖에 볼 수 없다.

 

그림3 - 감동근 제공
그림3 - 감동근 제공

 이창호 9단의 등장 이래로 현대 바둑 이론은 중반에서 종반으로 넘어가는 무렵부터는 한 수의 가치를 정확히 집으로 환산할 수 있다. 다만 아직도 두터움을 몇 집으로 계산할 지는 잘 모르는 상태다. 중앙 방면에 놓인 일련의 돌들의 영향력을 어디까지 인정할 것인가? 알파고는 무수한 반복 실험을 통해 이에 대한 답을 완벽에 가깝게 찾아낸 것으로 보인다.

 

가치망도 복잡한 신경망이지만 간단한 비유로 개념적으로 설명해보겠다. 알파고를 두 대 준비한다. 둘의 하드웨어나 정책망은 동일하다. 딱 한 가지 다른 점은, 알파고A의 형세판단함수는 중앙의 영향력을 한 줄 떨어진 곳까지만 인정하도록 하고, 알파고B의 형세판단함수는 두 줄 떨어진 곳까지 인정하도록 정한다.

 

즉, 다른 조건은 모두 동일하고 형세판단함수만 다르다. 그런데 알파고A와 알파고B를 여러 번 대국시켰더니 알파고B의 승률이 유의미한 차이로 높게 나오더라. 그렇다면 내릴 수 있는 유일한 결론은, 알파고B의 형세 판단이 더 정확하다는 것이다.

 

다음으로는 세 줄 떨어진 곳까지 인정하도록 정한 알파고C를 준비시킨다. 알파고B와 알파고C를 여러 번 대국시켰더니 역시 알파고B의 승률이 높게 나오더라. 그러면 두 줄 떨어진 곳까지 세는 게 바로 답이 된다.

 

4. 알파고는 이창호 9단의 업그레이드 버전

 

2국이 끝난 뒤 1국보다 훨씬 큰 충격을 받았다. 1국에서 알파고는 작년 10월보다 엄청나게 발전된 모습을 보여줬지만 적지 않은 실수들을 저질렀다. 그런데 이세돌 9단이 더 큰 실수들을 하는 바람에 진 것이다. 그래서 2국에서 이세돌 9단이 실수만 줄이면 알파고를 능히 이길 수 있으리라 생각했다.

 

2국에서 이세돌 9단은 과연 세계 초일류 기사답게 전날의 패배로 입었을 심리적인 타격을 잘 극복하고, 이세돌 9단 특유의 바둑은 아니더라도 실수가 거의 없는 바둑을 보여줬다. 그럼에도 불구하고 바둑은 73수 이후에는 이세돌 9단이 유리했던 적이 한 번도 없이 쭉 밀리다가 진 것이다.

 

방송 해설을 하던 프로 기사들은 끝내기가 상당히 진행될 때까지도 형세를 나쁘지 않게 봤다. 알파고는 우리가 보기에 나쁘거나 최소한 낯선 수들을 몇 차례 둔 반면에, 이세돌 9단에게서는 눈에 띄는 실수가 없었으니 흐름상 이세돌 9단의 형세가 당연히 좋겠거니 생각했다. 그런데 종국에 가까워져 집을 세보니 어느 순간 차이가 확 벌어져있었다.

 

30년 전 이창호 9단이 등장했을 때 그의 수법들 중 상당수는 당시 프로 기사들의 지지를 받지 못했다. 기존의 바둑 이론에 부합하지 않는 수법들이었기 때문이다. 그런데 그런 수법들을 구사해서 역전을 허용하지 않고 딱 반 집, 한 집 반씩만 이겨가는 횟수가 많아지자 바둑 이론에 새 지평이 열렸다.

 

상대가 인공지능이라서 좀 더 충격적이긴 하지만, 2국이 끝난 뒤 프로 기사들과 바둑 팬들이 느낀 당혹감과 좌절감은 이창호 9단이 등장했을 때 당시 기사들이 느꼈던 감정과 본질적으로 다르지 않다. 계산하기 어려우니까 기풍에 따른 선택의 문제, 기세의 문제 등으로 치부했던 영역이 사실은 정밀한 계산이 가능함을 당시의 이창호 9단이나 지금의 알파고가 보여주고 있는 것이다.

그럼 방법이 없다는 것인가? 다시 1국을 살펴보자.

 

5. 알파고의 정책망에는 허점이 있다

 

<그림4> 흑93까지 좌하귀가 이렇게 처리돼서는 일순간에 이세돌 9단이 엄청나게 유리해졌다. 반면 20집 이상 차이가 난다는 해설도 있었다. 백86과 흑87의 교환은 엄청난 손해다. 정확한 형세 판단에 따른 완벽한 반면 운영 외에도 2국에서 알파고는 좌상귀 처리에서 기가 막힌 수순(흑81~99)을 보여줬다.

 

그런 수준에서 어찌 본보의 백86과 같은 떡수를 둔단 말인가? 이것은 경우의 수를 줄이는데도 도움이 안 된다. Solved game으로 조금 더 빨리 끌고 가기는커녕, 이후 이세돌 9단이 실수만 조금 덜 했어도 알파고 할아버지가 와도 뒤집을 수 없는 바둑이 될 뻔 했다. 그 원인은 정책망의 오류로밖에 볼 수 없다.

 

흑81이 놓인 시점의 좌하의 형태는 고수들의 바둑에서 좀처럼 나오기 힘든 모양이다. 흑 세력이 저렇게까지 철벽인 상황에서 양걸침까지 당했다! 흑79로 걸쳐온 장면에서 인간 고수라면 거의 노타임으로 좌하귀를 받을 것이기 때문이다.

 

그림4 - 감동근 제공
그림4 - 감동근 제공

6. 학습되지 않은 상황

 

인공 신경망의 한 가지 맹점은 학습되지 않은 상황이 벌어질 때 전혀 의외의 반응을 보일 수 있다는 점이다.

 

한 연구진이 사진 속에서 탱크의 존재 여부를 알아내는 인공 신경망을 만드는 중이었다. 학습을 위해서 탱크가 포함된 사진들과 탱크가 포함되지 않은 사진들이 많이 필요했다. 그래서 오전에 사격 연습장으로 이동하는 탱크들의 사진을 잔뜩 찍고, 점심 먹고 같은 자리로 돌아와서 탱크가 없는 배경 사진을 또 잔뜩 찍었다.

 

그 사진들로 지도 학습을 시킨 결과, 신경망이 사진 속에 탱크가 있는지 없는지 여부를 잘 가려내게 됐다. 탱크가 언덕 뒤에 거의 가려지고 포신이 아주 조금만 나와 있어도 잘 찾아냈다. 그래서 이번에는 탱크가 완전히 가려진 사진을 제시했다. 포신도 전혀 보이지 않아 사진상으로는 탱크를 도저히 찾아낼 수 없는. 그랬는데도 이 신경망은 탱크가 있다고 답한 것이다! 노벨상을 수상할 업적인가?

 

아니다. 알고 보니 신경망은 전혀 엉뚱한 원리로 탱크의 존재 여부를 구분하고 있었던 것이다. 바로 빛의 각도로. 탱크가 있는 사진들은 전부 오전에 촬영된 것이고, 탱크가 없는 사진들은 전부 오후에 촬영된 것이므로 빛의 각도가 유력한 판별 기준이 된 것이다. 학습되지 않은 상황, 즉 오전에 촬영됐는데 탱크는 완전히 가려져서 안 보이는 사진을 입력시키니 엉뚱한 대답이 튀어나온다. 그리고 당연히 이 신경망은 실전에 무용지물이다.

 

7. 알파고는 왜 86자리에 뒀을까?

 

위의 장면도로 돌아가서, 알파고가 학습했던 고수들의 바둑에는 거의 나올 것 같지 않은 상황이 벌어졌다. 알파고는 이제 기출 문제 중에서 똑같은 것이 없으면 비슷한 뭐라도 끄집어내야 한다. 백86이 전혀 족보에 없는 수는 아니다. 다만 우하귀가 전혀 다른 배석일 때 많이 뒀던 수다.

 

<그림5> 아래 참고도를 보자. 우하귀 정석 진행 과정에서 흑이 좌하귀를 하나 교환해두고자 손을 뺐더니 백이 반발한 장면이다. 여기서는 백34로 끊기 전에 백30과 흑31을 교환이 필요하다. 백A가 바로 축머리가 되기 때문이다. 결국 흑B로 느는 정도인데, 백C와 흑D 교환 후 백E로 씌우면 흑이 백 석 점을 잡아야 할 때 중앙이 깔끔하게 봉쇄된다.

 

그런데 실전의 백86은 집으로도 엄청나게 손해고, 주위의 흑이 너무 철벽이라 이후 활용 수단도 없다. 그렇다고 경우의 수를 줄이는 것도 아니고. 알파고가 학습되지 않은 상황에 닥치자 번지수가 틀린 족보를 베낀 셈이다. 알파고의 정책망은 가치망에 비해 확실히 허술한 구석이 있다.

 

그림5 - 감동근 제공
그림5 - 감동근 제공

8. 3국을 앞두고

 

정상급 기사들은 초, 중반에 일찍 승부를 거는 것을 피한다. 수읽기에서 한 번 실수하면 하위 랭커한테도 쉽게 질 수 있는 바둑보다는, 길게 끌고 가면서 차이를 조금씩 벌려 집으로 이기는 안정적인 바둑을 구사해야 높은 승률을 유지할 수 있기 때문이다.

 

그러나 알파고는 이창호 9단의 업그레이드 버전이다. 확정가뿐만 아니라 두터움까지 정밀하게 계산할 수 있는. 알파고의 형세 판단 능력은 현대 바둑 이론보다 한 차원 높다. 알파고의 계산 능력으로도 아직 초, 중반에 바둑을 완전히 풀어낼 수(solved game)는 없다. 초, 중반에 승부를 걸어야 한다. 특히, 알파고의 계산 능력이 별 도움이 안 되는 상황을 만들어야 된다.

 

실리를 잔뜩 확보한 뒤 타개에 승부를 거는 강동윤 9단 스타일이라든지, 또는 대마가 얽힌, 타협이 불가능한 싸움으로 몰고 간 다음 독수 한 방으로 끝내는 최철한 9단 스타일이라든지. 이세돌 9단은 원래 이쪽 방면으로도 둘째가라면 서러워할 초절정 고수가 아니었는가.


3국에서 알파고 공략의 실마리를 찾기를 간절히 고대한다!

 

※필진소개.

감동근. KAIST 전자공학과에서 학사와 석,박사학위를 받았다. 현재는 아주대 전자공학과에서 반도체 패키징과 전자파 장해를 연구하고 있다. 알파고를 이기겠다는 목표로 바둑 공부도 열심히 하고 있다.

 

※편집자주

이글은 감동근 아주대 교수의 페이스북에도 게재됩니다. 직접 가 보시려면 ‘여기를 클릭’

 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

1 + 9 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스