비전공자도 이해할 수 있는 AI지식 -기계와 대화할 수 있을까-

1. "기계는 인간이 시키는 일만 한다"

 

지금까지는 챗봇이 문제해결용 대화 시스템으로 활약하는 방식을 살펴봤습니다.

 

챗봇이 고객센터의 역할을 하는 것이죠.

 

하지만 앞서 소개한 이루다처럼 자유 주제 대화 시스템의 챗봇이라면 인간과 자유롭게 대화하기 위해 어떤 과정을 거쳐야 할까요?

 

자유로운 대화를 할 때도 마찬가지로 if-then 규칙을 만들어 그 규칙에 맞춰 대화할 수는 있습니다.

 

일라이자와 심심이가 택한 방식이죠.

 

그리고 수십년 동안 전통적인 컴퓨터 프로그래밍 또한 이러한 규칙 기반 방식을 벗어나지 않았습니다.

 

1장에서 소개한 세계 최초의 컴퓨터 프로그래머 에이다 러브레이스는 인공지능의 출현 가능성을 최초로 추론하기도 했지만,

 

 

 

"기계는 인간이 시키는 일만 한다. 어떤 해석 관계나 진실을 예측할 능력은 없다"라며 이내 그 가능성을 일축합니다.

 

러브레이스는 컴퓨터는 스스로 무언가를 만들 수 없으며, 인간이 지시한 일만 할 수 있다는 점을 강조했습니다.

 

실제로 일라이자와 심심이 같은 규칙 기반의 챗봇은 러브레이스의 주장을 충실히 따랐죠.

 

인간이 규칙으로 정한 대화만 충실하게 했습니다.

 

하지만 러브레이스가 인공지능의 가능성을 예측한 시기는 컴퓨터가 실제로 등장하기도 전인 19세기에 상상만으로 한 것입니다.

 

과연 그 생각은 지금도 유효할까요?

 

 

2. 이미테이션 게임, "기계가 생각할 수 있는가?"

 

 

거의 한 세기가 지난 후 앨런 튜링은 인공지능에 관한 최초의 논문이라고 할 수 있는 <계산 기계와 지능>을 발표하면서, 

 

러브레이스의 이름을 언급합니다. 

 

"기계는 인간이 시키는 일만 한다"라는 그녀의 견해를 조목조목 반박하죠.

 

 

 

무엇보다 러브레이스가 태어난 지 약 200년 후, 과거 런던에 있던 러브레이스의 집에서 불과 2km 남짓 떨어진 자리에서 개발한 컴퓨터 프로그램이 바둑 세계 챔피언을 꺾습니다.

 

앞서 살폈던 알파고로, 알파고를 만든 딥마인드의 본사는 영국 런던에 있죠.

 

튜링이 러브레이스의 주장을 논리적으로 반박했다면, 알파고는 러브레이스의 주장이 틀렸음을 결과로 입증합니다.

 

알파고 개발팀 중 누구도 이세돌을 이길 수 있는 바둑 실력을 갖추지 못했고, 심지어 이들은 알파고의 전략을 제대로 이해하지 못했습니다.

 

그 누구도 알파고에게 세계 챔피언을 이길 수 있는 전략을 가르쳐주지 못했죠.

 

하지만 알파고는 자신을 만든 개발자들이 할 수도 없고, 이해할 수도 없는 일을 해냈습니다.

 

러브레이스의 주장이 틀렸음을 인공지능 스스로 입증한 셈이죠.

 

물론 데이터를 학습하는 일 자체를 인간이 시킨 일로 볼 수 있지 않느냐고 반문할 수 있습니다.

 

그러나 그렇다고 보기엔 데이터의 양이 너무나 방대하고, 인간이 파악할 수 없는 데이터까지 모두 학습한 결과를 내놓기 때문에 이를 두고 모두 인간이 시킨 일이라고 보기는 어렵죠.

 

러브레이스는 인간이 수백 년 후 기계가 스스로 데이터를 학습해 직접 규칙을 만들어낼 줄은 결코 예상하지 못했을 겁니다.

 

 

3. 미리 만들어둔 대사를 바꿔가며 말하게 하다

 

인공지능이 대답하도록 하는 가장 간단한 방법은 미리 작성해둔 대사를 기계가 그대로 읊도록 하는 겁니다.

 

바이첸바움 시대 이후 많은 사람이 이런 작업을 해왔죠.

 

좀 더 확장한 방식으로는 템플릿을 이용하는 방법이 있습니다. 

 

템플릿에서 몇 가지 단어나 숫자를 교체하면서 대화가 풍부해 보이도록 할 수 있죠.

 

일라이자와 심심이 같은 챗봇이 사용하는 방식이죠.

 

 

5장에서 살펴봤던 NUGU, 카카오미니같은 스마트 스피커도 템플릿 기반으로 문장을 생성해 몇 가지 단어나 숫자를 교체하며 대답합니다.

 

이런 방식은 의도에 딱 맞는 대답을 할 수 있지만, 대신 규칙을 정하는 데 적잖은 시간과 노력이 들고, 자연스럽고 풍부한 대화가 어렵다는 단점이 있죠.

 

 

4. 딥러닝, 기계가 스스로 말하게 하다

 

다시 딥러닝을 이용한 학습 기반이 등장할 차례입니다.

 

딥러닝이 직접 대화와 응답 데이터를 학습하여 스스로 대화의 규칙을 찾아내는 거죠.

 

진정한 자유 주제 대화 시스템을 향하는 길이라 할 수 있습니다.

 

연구자들은 가장 먼저 기계번역에서 사용했던 기술을 챗봇에도 적용했습니다.

 

먼저 6장에서 살펴본 신경망 기반 기계번역의 초기 모델을 활용했습니다.

 

한국어-영어 번역을 하는 모델이라면 입력은 '한국어', 출력은 '영어'로 설정되어 있습니다.

 

여기에 입력을 '대화', 출력을 '응답'으로 바꿔서 동일한 인공 신경망으로 대화를 응답으로 바꿔주는 실험을 했습니다.

 

방식은 매우 단순합니다.

 

신경망이 사람의 대화를 인코딩하고, 그걸 풀어내 응답을 만드는 거죠.

 

나머지는 모두 기계가 스스로 학습하도록 했습니다.

 

언어에 대한 이해도, 도메인 지식도, 복잡한 규칙도 필요없고 단지 풍부하게 학습할 수 있는 대화 데이터만 제공하면 됐죠.

 

어떤 응답을 생성할지는 기계가 학습 데이터를 통해 스스로 깨달아 나가도록 했습니다.

 

이것이 2015년에 구글에서 진행한 실험입니다.

 

2014년 즈음에 기계번역에 처음 시도했던 방식과 동일합니다.

 

유일한 차이라면 데이터의 입출력이 한국어-영어 세트가 아니라 대화-응답 세트라는 것뿐이죠.

 

이 실험에서 학습에 사용한 데이터는 영화 자막이었습니다.

 

자막으로 6200만개의 문장을 학습했죠. 문장을 입력하면 바로 출력 문장을 생성하도록 했습니다.

 

이처럼 문장에서 문장을 바로 만들어내는 방식을 엔드 투 엔드 방식(end to end)이라고 합니다.

 

모든 중간 과정을 기계가 자동으로 처리하기 때문에 더 이상 사람이 개입할 필요가 없죠.

 

물론 기억력이 없고 일관된 대답을 하지 못하는 등 한계는 분명히 존재했지만

 

아무런 규칙을 부여하지 않아도 다양한 유형의 질문에 적절한 답변을 생성할 수 있다는 점은 매우 놀라운 일이었습니다.

 

 

TAGS.

Comments