메뉴바로가기본문바로가기

동아사이언스

세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억원 털렸다!

통합검색

세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억원 털렸다!

2017.02.01 19:00

알파고 때보다도 한 단계 성장한 AI

 

GIB 제공
GIB 제공

#int=천하의 {인간이} 쎗바닥이 [길어]
#printf=“쫄리면 {뒈지시던가}

(영화 ‘타짜’의 대사를 코딩 형식으로 패러디)

 

세계 최고의 포커 선수들이 제대로 ‘타짜’를 만났다. 20일 동안 자그마치 176만 달러(20억3240만 원)를 ‘탈탈’ 털렸다. 상대는 피도 눈물도 심장도, 심지어 뇌도 없는 ‘인공지능(AI)’이다.


체스, 퀴즈, 바둑에서 세계 최강자들을 꺾은 AI가 이번엔 포커마저 접수했다. 미국 카네기멜론대 컴퓨터과학과의 튜오마스 샌드홈 교수와 놈 브라운 박사과정 연구원은 작년 포커용 AI ‘리브라투스’를 개발했다. 리브라투스는 올해 1월 11일부터 30일까지 미국 피츠버그 리버스카지노에서 세계 정상급 포커 선수 4명과 12만 번의 게임을 치른 결과 총 20억 원(온라인 가상화폐) 넘게 따며 압승했다.

인공지능 AI ‘리브라투스’를 개발한 미국 카네기멜론대 컴퓨터과학과의 튜오마스 샌드홈 교수(왼쪽 세번째)와 놈 브라운 박사과정 연구원(왼쪽 네번째). 좌우는 세계 정상급 포커 선수들. - 리버스 카지노 제공
포커용 AI ‘리브라투스’를 개발한 미국 카네기멜론대 컴퓨터과학과의 튜오마스 샌드홈 교수(왼쪽 세번째)와 놈 브라운 박사과정 연구원(왼쪽 네번째). 좌우는 세계 정상급 포커 선수들. - 리버스 카지노 제공

●체스, 퀴즈쇼, 채팅, 바둑…인공지능의 ‘도장 깨기’ 


이제껏 성장 드라마의 주인공은 늘 사람이었다. 사력을 다해 적을 이기고 나면 다시 더 강한 적이 나타나는 이야기는 뻔하지만 감동적이다. 이제 과학기술을 무기로 삼은 AI가 그 성장 이야기의 주인공이다.


1997년 IBM의 AI ‘딥블루’는 체스 세계 챔피언 자리를 20년간 지키던 가리 카스파로프를 꺾었다. 경우의 수가 10의 123승이나 되는 복잡한 게임에서 AI가 승리했다는 사실에 세계가 주목했다. 초당 최대 2억 개의 수를 분석하는 대규모 병렬처리가 가능한 성능이 승리의 요인이었다. 사람의 사고 능력보다 7000만 배 빠른 속도다.   


AI가 한번 승기를 잡은 종목에선 더 이상 사람이 따라잡기 힘들다. 계속 발달하는 AI은 다음에 깰 ‘도장’을 찾아 나설 뿐이다. 2011년 IBM의 AI ‘왓슨’은 TV 퀴즈쇼를 휩쓴 인간 퀴즈왕들을 꺾는다. 자연어 처리능력과 빅데이터 처리 능력의 발달 덕분이었다.  

2015년 3월 서울 코엑스에서 열린 구글 딥마인드의 바둑 AI ‘알파고’와 이세돌 9단의 대국 현장. - 구글 제공
2015년 3월 서울 코엑스에서 열린 구글 딥마인드의 바둑 AI ‘알파고’와 이세돌 9단의 대국 현장. - 구글 제공

2016년 구글 딥마인드의 ‘알파고’는 바둑 최고수 이세돌 9단을 이겼다. 경우의 수가 10의 170승으로 우주의 모든 원자 수보다 많아 ‘인간 최후의 보루’라고 여겨졌던 바둑이었다. 감동근 아주대 전자공학과 교수는 “하드웨어의 발달로 승기를 잡은 딥블루와 달리 알파고는 몬테카를로 탐색 기법이나 딥러닝 기술 같은 소프트웨어의 발달로 승리했다”고 설명했다.


●불확실한 정보에도 최선의 선택할 수 있는 AI


포커에서 인간을 꺾었다는 건 알파고 이후 AI가 또 한 차례 성장했다는 사실을 보여준다. 포커는 상대의 패를 볼 수 없고 속임수(블러핑)가 가능하다는 점에서 체스나 바둑과는 근본적으로 다르다. 불완전한 정보를 바탕으로 제한된 시간 안에 복잡한 결정을 해야 한다.


이전에 개발됐던 포커 AI는 계산의 복잡성을 줄이기 위해 정보를 ‘추상화’시켰다. 예를 들어 카드 J(숫자 11)와 카드 Q(숫자 12)를 같은 카드로 간주하거나, 상대가 100만 원을 배팅하든 300만 원을 배팅하든 똑같이 취급하는 식이다. 경우의 수를 줄여 계산은 빨리 할 수 있지만 묶음의 범위를 사람에게 들키면 악용당할 여지가 있다는 치명적 단점이 있었다.

포커용 AI ‘리브라투스’가 인간 포커선수를 상대로 게임하고 있는 장면.  - 리버스 카지노 제공
포커용 AI ‘리브라투스’가 인간 포커선수를 상대로 온라인에서 게임하고 있는 장면.  - 리버스 카지노 제공

리브라투스는 추상화 기술을 버렸다. 대신 단계별로 계산하는 새로운 기술을 도입했다. 넓은 범위에서 1차로 계산해 가능성이 높은 좁은 범위를 찾은 뒤 2차로 자세히 계산하는 식이다. 장병탁 서울대 컴퓨터공학부 교수는 “동물 그룹에 대한 계산을 한 뒤 포유류 그룹에 대한 계산을 하는 식”이라고 비유를 들어 설명했다.


리브라투스에는 게임이론의 하나인 ‘내쉬 균형’도 적용됐다. 미국의 수학자 존 내쉬가 창안한 내쉬 균형은 두 명 이상이 경쟁할 때, 각자 최선의 선택을 하고 전략을 바꿀 의사가 없는 상태를 말한다. 리브라투스를 개발한 샌드홈 교수는 “리브라투스에 적용된 ‘세이프 앤 네스티드 엔드게임 솔빙’ 기술은 불확실한 정보를 바탕으로 한 상업거래, 협상, 의학치료, 사이버 보안 등에도 적용할 수 있다”고 말했다. 


●포커 다음은?


포커 정복 후 인공지능의 다음 목표는 뭘까. 김경중 세종대 컴퓨터공학과 교수는 ‘비디오 게임’을 지목했다. 김 교수는 “바둑은 가로 세로 19점 사이에서 이뤄지는 행위인데 게임은 최소 가로 세로 680 픽셀의 공간에서 전개돼 정보량이 훨씬 많다”고 말했다.


스타크래프트처럼 정찰을 해야 상대 전략을 알 수 있는 게임은 불확실한 정보로 최선의 의사결정을 해야 한다. 프로게이머들은 종종 상대에게 잘못된 정보를 일부러 흘려 혼란을 주는 심리전을 펼친다. 아직 인공지능이 프로게이머를 이기지 못하는 이유다. 실제로 딥마인드는 ‘스타크래프트 2’ 개발사 블리자드엔터테인먼트와 협력, 인공지능이 스타크래프트 게임을 하며 복잡한 현실 세계를 이해할 수 있을지 시험하고 있다.

세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억 털렸다!
세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억 털렸다!

인공지능이 게임에선 이겨도 실제 문제 해결에서 인간을 앞서려면 아직 갈 길이 멀다는 시각도 있다. 감 교수는 “왓슨이 퀴즈쇼에서 인간을 이긴 뒤 콜센터를 인공지능으로 대체하려는 연구가 활발하다”며 “현실에서 사람들의 질문은 퀴즈쇼에서처럼 정형화돼 있지 않기 때문에 아직 인간을 대체하기는 무리”라고 말했다.

 

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

2 + 1 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

    관련 태그 뉴스