포커친구 - 택사스홀덤 오마하 홀덤 포커 이야기 외 잡담 수다 자유게시판
2017.03.06 22:51
인간과 기계가 겨루는 무제한 베팅 포커 게임에서 인공지능(AI) 프로그램이 프로 도박사들을 모조리 눌렀습니다.
캐나다 앨버타대와 체코 프라하 카렐대, 체코 공과대 연구진은 무제한 베팅 포커 게임을 하는 AI 프로그램 '딥스택'(DeepStack)을 개발하고 무작위로 카드와 베팅금액을 설정해 1천만여 건의 게임 상황을 만들어 입력하는 방식으로 딥스택을 훈련 시켰습니다.
연구진은 이어 국제포커연맹(IFP)과 각국 포커연맹의 도움을 받아 딥스택과 겨룰 프로 도박사들을 모집했습니다.
참여하는 도박사들에게는 딥스택과 4주간 온라인으로 각자 3천 판씩 게임을 하도록 했습니다.
처음에는 17개국 33명이 참가 신청을 했으나 이 중 상당수가 3천 게임을 채우지 못했고 11명만 조건을 충족시켰습니다.
반복되는 포커 게임에서 거둔 성적은 이 분야 연구자들의 관행에 따라 'mbb/g'(milli-big-blind per game)로 따졌습니다.
이는 플레이어가 평균적으로 게임당 따는 돈이 빅 블라인드의 몇 배인지 천분율로 계산한 것입니다.
처음에 포기하는 플레이어는 750 mbb/g 차로 지게 되어 있으며, 프로 도박사들은 대개 고객을 상대로 50 mbb/g 차이로 돈을 따는 것을 최소 목표로 삼습니다.
딥스택은 작년 11월 초부터 12월 초까지 33명의 도박사들과 4만 4천 852게임을 했으며, 여기서 평균 492mbb/g의 성적을 거뒀습니다.
이는 표준편차의 4배가 넘는 격차입니다.
대개 통계학적으로 표준편차의 2배·3배 격차가 있으면 신뢰도가 각각 95%·99% 이상인 것으로 평가됩니다.
중도에 포기하지 않고 개인당 3천 게임 조건을 채운 11명의 도박사들과 한 게임들만 따져도 딥스택은 이들 모두를 꽤 큰 격차로 눌렀습니다.
이들을 상대로 한 딥스택의 평균 성적은 394 mbb/g였으며, 인간 11명 중 가장 성적이 좋은 도박사를 70 mbb/g의 격차로 꺾었습니다.
또 신뢰 수준 95%로 따졌을 때 인간 1위를 제외한 도박사 10명은 딥스택과의 실력 격차가 '통계학적으로 유의한' 수준으로 평가됐습니다.
딥스택이 이들보다 훨씬 고수이며 돈을 딴 것이 우연이 아니라는 것입니다.
연구진은 포커 게임에서는 경우의 수가 10의 160 거듭제곱으로 바둑과 비견할만한 수준이라며, 딥스택이 상황에 관한 '직관'을 갖도록 훈련을 시키는 방식으로 선택의 수를 10의 17 거듭제곱인 10경(京)) 수준으로 줄였다고 설명했습니다.
연구진은 이런 내용이 담긴 논문을 과학 학술지 '사이언스' 3일 자에 게재했습니다.
안영인 기자(youngin@sbs.co.kr)
☞ [취재파일 스페셜] 대선주자들에게 '세월호'를 묻다
※ ⓒ SBS & SBS콘텐츠허브 : 무단복제 및 재배포 금지
ㅠㅠ