Loading...
2022. 10. 4. 23:44

비전공자도 이해할 수 있는 AI지식9 -알파고는 왜 인간의 신의 한수를 허용했는가?-

1. 몬테카를로 트리 탐색, 알파고가 생각하는 방법 이제 알파고가 학습한 것을 바탕으로 어떤 과정을 거쳐 착수를 하는지 알아보자. 이때는 앞서 설명했던 몬테카를로 트리 탐색을 활용한다. 몬테카를로 방법은 무작위로 샘플링하여 정답을 찾는 방식이다. 5000만 국민의 선거 결과를 알기 위해 전수조사하는 대신 무작위로 5만 명 정도만 조사해도 비슷한 결과를 낼 수 있는 것과 마찬가지다. 바둑의 경우로 다시 한번 생각해보자. 1) 바둑은 탐색해야하는 게임 트리가 엄청나게 크다. 2) 게임 트리를 전부 탐색하는 것은 불가능하다. 3) 일부만 무작위로 샘플링하여 탐색해도 비슷한 결과를 낼 수 있다. 이런 방식으로 몬테카를로 방법을 바둑 인공지능에 도입하자 실력이 급상승하기 시작했다. 그러나 몬테카를로 방법에도 엄연..

2022. 10. 1. 02:26

비전공자도 이해할 수 있는 AI지식8 -알파고는 어떻게 학습했을까?-

1. 정책망(policy network), 어디에 돌을 놓아야하는가? 정책망은 사람이 만든 기보를 이용하여 학습한다. 학습에 사용한 데이터는 KGS라는 바둑 사이트에서 가져왔으며 6단 이상의 고수의 기보만 사용했다고 한다. 얼핏 생각하면 9단 기사의 데이터를 사용하면 가장 바람직하겠지만, 그러기에는 데이터의 수가 부족했다. 알파고 개발자는 데이터의 수가 충분하면서도 좋은 기보 수준을 6단으로 정했던 것이다. 각 데이터는 바둑판의 상태와 해당 상태에서 실제로 다음번 바둑알을 둔 곳의 위치를 함께 쌍으로 구성되었고 (그러니까 (바둑판의 상태,다음번에 바둑알을 둔 위치)로 데이터가 주어진다는 말인듯) 정책망은 약 16만회의 게임에서 총 3000만 수를 가져와 학습했다. 학습을 마친 정책망은 바둑판의 현재 상태..

2022. 9. 30. 01:17

비전공자도 이해할 수 있는 AI지식7 -바둑에 도전한 인공지능-

1. 인공지능, 바둑을 넘보다 바둑도 체스처럼 정석이 어느정도 있을테니, 적절히 활용하여 계산해야하는 경우의 수를 줄여나가면 어떨까? 바둑은 그렇게 한다해도 체스처럼 계산을 해낼 수 없습니다. 계산해야하는 게임 트리가 지나치게 크기 때문이다. 체스의 게임 트리 크기만해도 우주의 원자 수보다 많은데, 바둑은 이보다도 훨씬 크다. 딥 블루가 승리한 직후 1997년 천체물리학자이자 바둑 애호가인 피에트 헛은 "바둑에서 컴퓨터가 사람을 이기려면 100년은 걸릴 것이다. 어쩌면 더 걸릴 수도 있다"라고 언급했다. 가로세로 19줄, 총 361개의 점으로 이루어진 바둑판에서 가능한 수를 계산해보는 건 얼핏 상상만 해도 불가능해 보인다. 고등학생 때 배운 순열을 이용해 단순하게 계산해볼까? 361개의 점에 순서대로 무..

2022. 9. 27. 02:59

비전공자도 이해할 수 있는 AI 지식6 -인간을 능가하는 기계의 등장-

1. 딥블루는 어떻게 세계 체스 챔피언이 되었는가 1997년 인간과 컴퓨터의 자존심을 건 체스 대결이 펼쳐졌다. 가리 카스파로프는 1984년 만 20세 최연소 세계 체스 챔피언으로 등극한 이해 줄곧 세계 1위를 유지하였고 적어도 체스로 그를 이길 수 있었던 인간은 존재하지 않았다 카스파로프를 상대할 컴퓨터 대표 딥 블루(Deep blue)는 IBM의 슈퍼컴퓨터인데 이전에도 몇 차례 체스 시합에 도전했지만 번번이 무릎을 꿇었다. 바로 직전 1996년에도 안타깝게 4:2로 패했다. 이후 딥블루는 보다 정교한 체스머신이 되어, 내부에서도 디퍼 블루라는 애칭으로 부를 정도로 더욱 강력해져서 돌아왔다. 그리고 이날 대회에서 딥블루가 마침내 카스파로프를 꺾고 체스 세계 챔피언에 등극하였다. 컴퓨터가 정규 시합에서 ..

2022. 9. 23. 03:39

비전공자도 이해할 수 있는 AI지식5 -AI를 발전시키는 오픈소스-

1. 딥러닝의 숨은 공신, 오픈소스(open source) 오픈소스(open source)는 프로그램의 소스코드를 공개하는 것이다. 소스코드는 상당히 중요한데 마음대로 공유한다니 말이 되는걸까? 특히 상업용 프로그램의 소스코드를 공개하는 것은 마치 유명 맛집이 자신만의 음식 레시피를 공개하는 것과 다르지 않다. 맛집이 레시피를 공개한다면 매출에도 영향이 있을텐데 왜 그런 선택을 하는 것일까? 공개를 통해 영향력을 더욱 확고히 하기 위함이다. 무엇보다 공개를 한다는 것은 실력에 자신이 있는 사람이라는 뜻이다. 어설픈 실력으로는 공개를 하고 싶어도 할 수가 없다 요리연구가 백종원이 레시피를 공개하는 것은 본인의 레시피에 자신이 있다는 것이고 실제로 사람들은 백종원의 레시피를 보면서 그에게 신뢰를 갖게 된다...

2022. 9. 21. 03:20

비전공자도 이해할 수 있는 AI 지식4 -GPU가 인공지능을 완성하다-

1. 무어의 법칙 -시간이 지나면서 반도체의 성능은 계속 증가- 1989년 얀 르쿤이 신경망으로 우편번호를 인식하려고 했을 때 고작 10개의 숫자를 인식하기 위해 모델을 학습하는데만 거의 3일이 걸렸다. 당시 신경망 구조는 지금과 크게 다르지 않았고 성능 또한 뛰어났지만 시스템만큼은 지금과는 큰 차이가 있었다. 인텔의 공동 창업자 고든 무어는 1965년 무어의 법칙을 내놓았다. 반도체 집적회로의 성능은 2년마다 2배씩 증가한다는 것으로 이 법칙은 오랫동안 컴퓨터 발전사에 통용되어온다. 얀 르쿤의 1989년 신경망 첫 실험과 2021년의 시스템 사이에 약 32년간의 시간차이가 있었는데, 단순 무어의 법칙에 의해 65536배의 성능 증가가 있었다. 3일이 걸렸던 학습 과정을 2021년에는 4초만에 끝낼 수 ..