비전공자도 이해할 수 있는 AI지식10 -바둑의 신이 된 알파고-

1. 알파고 제로, 더욱 바둑 실력을 갈고 닦다

 

알파고와의 대국은 2016년 당시 TV에서 생중계할 정도로 유명한 이벤트였고 알파고는 우리에게 깊은 인상을 남겼다

 

알파고는 이세돌을 꺾고 최고의 자리를 차지하였지만, 구글 딥마인드는 계속해서 알파고를 개선해나갔고 알파고 제로(AlphaGo Zero)가 등장하였다

 

기존 알파고는 학습을 수행할 인간 바둑기사의 기보가 필요하며 이를 습득해 실력을 키웠다

 

그러나 알파고 제로는 처음부터 자신과의 대국을 통해 실력을 쌓아나갔다.

 

인간의 지식은 필요없다고 대놓고 제목에도 쓰인 알파고 제로 논문

 

완전히 무에서 시작한다고 하여 알파고 제로라는 이름을 부여했다. 알파고 제로는 매일 100만 대국을 휴식 없이 치를 수 있었다.

 

인간이라면 8살부터 80살까지 72년간 매일 다섯 차례씩 평생 대국을 해야 비로소 13만 대국을 둘 수 있는데, 

 

휴식이 필요 없는 알파고는 사람이 평생 두는 대국보다 8배나 더 많은 100만 대국을 단 하루에 둘 수 있었다

 

그렇게 스스로 대국을 둔 지 단 3일만에 알파고 제로는 이세돌을 꺾은 기존의 알파고를 100대 0으로 꺾는 실력을 갖추었다

 

40일 후에는 이전의 알파고 버전을 모두 격파하는 압도적인 실력을 갖추었다

 

알파고 제로가 공개되기 전에는 기존 알파고보다 좀 더 성능이 좋은 알파고 마스터가 당시 세계 최강인 중국의 커제와 대국을 두었다.

 

당연히 이세돌을 꺾은 알파고보다 훨씬 더 강력한 상대를 커제가 이길 수 있을리 없었다. 커제는 5판 내내 1판도 이기지 못한 채 패배하고 눈물을 쏟았다.

 

오늘날 알파고 제로는 커제와 대국했던 알파고 마스터보다도 훨씬 강력하다.

 

이제 인간은 더 이상 바둑에서 컴퓨터를 이길 수 없게 되었다.

 

이세돌이 알파고를 꺾은 4번째 대국은 아마 인간이 컴퓨터를 꺾은 마지막 대국으로 영원히 남을 것이다.

 

딥 블루가 세계 챔피언 카스파로프를 꺾은 이후 더 이상 인간이 컴퓨터보다 체스를 잘 둘수 없게 되었듯, 바둑도 이제는 컴퓨터를 이길 수 없는 운명이 되었다.

 

이세돌과 알파고의 실력을 Elo rating으로 나타내보면 다음과 같다.

 

엘로 평점은 과거 체스에 적용한 점수 체계로 바둑에서도 동일하게 사용한다. 엘로 평점은 이기면 증가하고 지면 감소하는 방식이다.

 

점수가 균일한 폭으로 증가하는게 아니라 나보다 점수가 높은 상대를 이기면 점수가 큰 폭으로 증가하고, 나보다 점수가 낮은 상대를 이기면 점수가 작은 폭으로 증가한다.

 

이세돌 > 3586점, 알파고(이세돌에 4승1패) > 3739점, <2016년 3월>알파고 마스터(프로기사에게 60전 전승, 커제에 5승 무패) > 4858점, <2017년 5월>알파고 제로(알파고에 100전 전승, 알파고 마스터에 89승 11패) > 5185점 <2017년 10월>

 

알파고 제로는 최강의 바둑 인공지능이다. 무엇보다 알파고 제로는 더 이상 인간 바둑기사에게 배우지 않고, 스스로 학습해 실력을 키웠다.

 

알파고 제로 이후에 딥마인드는 2018년 알파제로(AlphaZero)를 공개했다.

 

알파제로의 원리도 비슷한데 바둑의 영문 명칭인 Go가 빠져있는 것에서 알 수 있듯이, 바둑 뿐만 아니라, 체스, 일본 장기까지 게임 영역을 넓혔다.

 

체스에서는 기존의 챔피언인 스톡피쉬 인공지능을 능가하는 수준에 이르렀다.

 

스톡피쉬는 강력한 가지치기 알고리즘으로 트리를 확장하는 경우를 최소화해 효율성을 높였다고 한다.

 

집에서 사용하는 가정용 pc에서 구동해도 20수 앞을 내다볼 정도로 강력한 현존하는 최고의 체스 인공지능이었다.

 

알파제로와 겨룬 스톡피쉬는 초당 7000만번의 수를 계산했다. 하지만 알파제로는 더 이상 이렇게 많은 수를 계산하지 않는다.

 

약 8만번 정도만 계산했는데 스톡피쉬와 비교해보면 1/875에 불과하다.

 

각종 체스 규칙과 다양한 체스 전술을 미리 입력해두고 활용하는 스톡피쉬와 달리 알파제로는 어떠한 체스 전략도 사용하지 않았다.

 

대신 강화학습으로 스스로 학습한 다음, 인간과 마찬가지로 유효한 수만 찾아 마치 직관에 따른 것처럼 다음 수를 두었다.

 

이렇게 해서 알파제로는 스톡피쉬와 100판을 겨뤄 28승 72무로 단 1판도 패배하지 않고 압승했다.

 

알파제로는 바둑뿐만 아니라 체스, 장기까지 거의 모든 종류의 보드게임에서 인간의 도움 없이도 스스로 학습하여, 모든 수를 탐색하지 않고도 최고의 실력을 갖출 수 있음을 증명했다.

 

알파제로 논문

 

 

2. 컴퓨터는 인간을 능가했는가?

 

불과 250년 전 메케니컬 터크 시절에는 인간을 이기기 위해 인간이 기계인 척하며 체스를 두어야 했다.

 

하지만 지금은 입장이 완전히 뒤집어졌다. 인간 기사가 시합 도중 화장실에 다녀온다며 스마트폰으로 몰래 인공지능의 기보를 훔쳐보다가 실격패로 처리되는 일도 있었다.

 

그렇다면 이제 컴퓨터는 인간을 능가하는 지능을 갖게 된 것일까?

 

알파고가 인간을 능가했다고 해서 이제 인공지능이 모든 면에서 인간을 능가한다고 할 수는 없다.

 

스티븐 호킹은 살아생전에 "인간은 경쟁하기도 전에 인공지능에 추월당하고 만다"며 인류의 존재 자체를 위협할 수 있다고 경고했지만

 

세계 최고의 머신러닝 연구자인 스탠퍼드 대학교의 앤두르 응 교수는 "인공지능이 세상을 접수할 걱정을 하는 것은 화성에 인구가 너무 많아질까 걱정하는 것과 비슷하다"고 말했다.

 

이미 컴퓨터는 인간을 능가하고 있다. 원래부터 컴퓨터는 인간보다 훨씬 더 빠르고 정확하게 계산했다.

 

체스나 바둑은 수학 계산 문제와 크게 다르지 않다. 계산기가 인간보다 곱셈을 더 잘한다고 인간을 능가하는 지능의 출현이라고 호들갑을 떨지 않듯, 알파고도 마찬가지이다.

 

알파고는 단지 인간보다 정해진 규칙이 있는 바둑 게임에서 좀 더 계산을 잘 했을 뿐이다.

 

스탠퍼드 인공지능연구소 소장인 페이페이 리도 알파고가 이세돌에게 승리한 직후 <뉴욕 타임스>와 가진 인터뷰에서 

 

인공지능이 이제 인간을 능가할 것이라며 걱정하는 사람들을 향해 "제가 보기에는 전혀 놀랍지 않습니다. 생각해보세요. 자동차가 인간보다 더 빨리 달리는 걸 놀랍게 여기는 사람이 어디 있나요?"라고 했다.

 

미 대선 결과를 정확하게 예측하여 일약 스타로 떠오른 통계학자 네이트 실버는 <신호와 소음>에서 인간을 능가하는 기계를 두고

 

"기술을 있는 그대로 바라보라"고 했다.  "지나치게 기술에 의존해서도 안되며 그렇다고 기술에 공퐆를 느껴서도 안된다"고 말했다.

 

인간을 능가하는 인공지능의 등장은 여전히 먼 이야기이다. 무엇보다 컴퓨터에는 인간의 지혜와 능력이 담겨있다. 새로운 기술이 등장하더라도 여전히 인간의 그림자가 함께할 것이다.

 

 

 

agz_unformatted_nature.pdf (ucl.ac.uk)

1712.01815.pdf (arxiv.org)

 

 

 

TAGS.

Comments