Loading...

알파고 3종 논문 서문 읽어보기

1. Mastering the game of Go with deep neural networks and tree search "트리 탐색과 딥러닝으로 바둑을 마스터하다" 바둑은 거대한 탐색 공간과 바둑판의 이동이나, 국면을 판단하기 어렵기 때문에 인공지능에게는 가장 어려운 과제로 여겨져왔다. 여기서 우리는 value network를 사용하여 바둑의 국면을 판단하고, policy network를 이용해 다음 수를 선택하는 새로운 접근법을 소개한다. 이러한 deep neural network는 인간 전문가 게임에 의한 지도학습의 새로운 조합에 의해 학습되고 스스로 대국한 게임으로 배우는 강화학습에 의해 학습된다. 어떠한 역추적 없이(lookahead search) 신경망은 자기 스스로의 수천번의 random..

2022. 10. 6. 01:10

비전공자도 이해할 수 있는 AI지식10 -바둑의 신이 된 알파고-

1. 알파고 제로, 더욱 바둑 실력을 갈고 닦다 알파고와의 대국은 2016년 당시 TV에서 생중계할 정도로 유명한 이벤트였고 알파고는 우리에게 깊은 인상을 남겼다 알파고는 이세돌을 꺾고 최고의 자리를 차지하였지만, 구글 딥마인드는 계속해서 알파고를 개선해나갔고 알파고 제로(AlphaGo Zero)가 등장하였다 기존 알파고는 학습을 수행할 인간 바둑기사의 기보가 필요하며 이를 습득해 실력을 키웠다 그러나 알파고 제로는 처음부터 자신과의 대국을 통해 실력을 쌓아나갔다. 완전히 무에서 시작한다고 하여 알파고 제로라는 이름을 부여했다. 알파고 제로는 매일 100만 대국을 휴식 없이 치를 수 있었다. 인간이라면 8살부터 80살까지 72년간 매일 다섯 차례씩 평생 대국을 해야 비로소 13만 대국을 둘 수 있는데, ..