주메뉴바로가기.. 본문바로가기

‘게임의 법칙’ 스스로 터득하는 AI ‘알파제로’ 나왔다

카카오스토리 네이버밴드 구글플러스

2018년 12월 07일 14:18 프린트하기

-사진 제공 사이언스
사이언스 제공

가르쳐 주지 않아도 여러 종류의 ‘게임의 법칙’을 스스로 터득하는 인공지능(AI)가 등장했다. 바둑, 장기, 체스 등 종목을 가리지 않고 짧게는 몇 시간, 길게는 며칠 만에 규칙을 터득하고 최강의 실력까지 갖췄다.

 

데이비드 실버 구글 딥마인드 연구원팀은 6일 국제학술지 ‘사이언스’에 범용 강화학습 알고리즘을 채택한 게임 AI ‘알파제로’를 공개했다. 알파제로는 2016년 등장해 이세돌 9단을 이기며 최강의 바둑 AI로 등극한 ‘알파고(알파고리)’와, 알파고의 후속으로 2017년 기존 알파고를 100대 0으로 제압해 화제가 됐던 ‘알파고제로’의 뒤를 잇는 AI다. ‘범용’이라는 말에서 알 수 있듯, 바둑이라는 특정 게임에 머물지 않고 다른 종류의 게임도 스스로 통달할 수 있다.

 

알파제로가 여러 게임의 규칙을 스스로 파악할 수 있는 것은 기존의 AI와 달리 특정 게임에 대한 지침이나 사전 정보 없이 학습을 하기 때문이다. 게임의 규칙은 물론, ‘무엇이 목표’라는 지침도 없이 알파제로는 자기 자신을 가상의 상대로 두고 체스나 장기, 바둑을 두며 규칙을 찾고 실력을 키웠다. 데미스 허사비스 딥마인드 CEO는 “알파제로는 게임에 대해 무(無)의 상태에서 시작해 무작위로 게임하다가, 점점 ‘괜찮아 보이는’ 게임을 학습했다”며 “덕분에 인간의 속박이 없어 독특하고 역동적인 스타일을 선보인다”고 말했다.

 

실버 연구원은 논문에서 “같은 알고리즘과 네트워크 구조(아키텍처)를 사용해 바둑과 장기, 체스 세 게임에 적용했다”며 “인간이 주입한 관련 지식이나 데이터가 없는 백지 상태(tabula rasa)에서 알파제로가 인간을 능가하는 성과를 학습할 수 있다는 사실을 밝혔다”고 말했다. 

 

체스와 장기(일본장기 쇼기), 바둑에 대해 알파제로가 기존 AI와 대결한 결과. 단 몇 시간 학습으로 규칙을 파악한 것은 물론, 기존 AI 챔피언까지 압도해 버렸다. -사진 제공 사이언스
체스와 장기(일본장기 쇼기), 바둑에 대해 알파제로가 기존 AI와 대결한 결과. 단 몇 시간 학습으로 규칙을 파악한 것은 물론, 기존 AI 챔피언까지 압도해 버렸다. 사이언스 제공

하지만 알파제로는 빠른 시간에 정확히 각 게임의 규칙을 습득했다. 각 종목에서 기존 최강의 AI를 이기는 데 겨우 몇 시간밖에 걸리지 않았다. 장기의 기종 최강자 ‘엘모(Elmo)’의 승률을 넘어서는 데엔 두 시간, 체스의 기존 최강 프로그램인 ‘스톡피리(Stockfish)’의 승률을 넘는 데 데에는 네 시간이 걸렸다. 좀더 복잡한 알파고의 승률은 30시간 만에 돌파했다.

 

실버 연구원팀은 이렇게 실력을 키운 알파제로를 이번에는 직접 다른 AI들과 3시간씩 대결시켰다. 그 결과 알파제로는 바둑의 경우 3일 훈련한 알파고제로를 상대로 평균 61%(흰 돌을 쥐었을 때는 69%, 검은 돌을 쥐었을 때는 54%)의 높은 승률을 보인다는 사실을 확인했다. 체스는 1000게임 중 155게임을 이기고(15.5%) 6게임을 졌다(0.6%. 나머지 83.9%는 비김). 장기가 가장 압도적이어서, 엘모를 상대로 흰 돌을 쥐었을 때는 84%, 검은 돌을 쥐었을 때에는 무려 98.2%를 이겼다.

 

알파제로는 자기 자신과 끊임없이 게임을 하며 규칙을 파악하고 실력을 쌓았다. 여기에서 알파고제로 등 모태가 된 기존의 게임 AI와 차이가 난다. 알파고제로는 항상 지금까지 해왔던 게임에서 가장 승률이 높았던 가상의 선수를 상대로 두고 게임을 하며 훈련을 쌓았다. 승률이 더 높은 가상의 하지만 알파제로는 단 하나의 신경망을 상대로 두고 끊임없이 업데이트하며 자신을 상대로 게임을 한다. 

 

딥마인드의 다음 목표는 알파제로의 범용 학습능력을 현실의 다양한 문제에 적용하는 것이다. 실버 연구원은 “같은 시스템을 보드게임 외에 신약 개발이나 재료 설계, 바이오 등에 적용할 수 있는지 알아볼 계획”이라고 밝혔다. 허사비스 CEO도 “현실 세계의 문제를 푸는 AI를 만들고자 하는 딥마인드의 최종 목표에 다가서는 중요한 여정”이라고 말했다.
 

카카오스토리 네이버밴드 구글플러스

2018년 12월 07일 14:18 프린트하기

 

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

4 + 10 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스