비전공자도 이해할 수 있는 AI지식 2 -딥러닝의 등장-

1. 딥러닝은 왜 갑자기 잘 동작하는가?

 

딥러닝이 갑자기 잘 동작하게 된 이유중 하나로 알고리즘의 발전을 들 수 있다. 

 

과거 인공 신경망 시절 해결할 수 없는 문제도 많았고 제대로 학습할 수 있는 방법도 알지 못했다.

 

그러나 끝까지 연구를 이어온 일부 연구자 덕분에 제대로 학습할 수 있는 방법을 찾아냈다.

 

딥러닝은 머신러닝의 일종으로 머신러닝과 비슷한 방식으로 작동한다.

 

"데이터와 정답을 입력하면 스스로 규칙을 찾아낸다"

 

그러나 딥러닝은 기존의 머신러닝에 비해 훨씬 더 크고 풍부한 역량을 지닌 모델이다.

 

훨씬 더 많은 데이터를 학습할 수 있고, 훨씬 더 풍부한 규칙을 찾아낼 수 있다.

 

 

이러한 딥러닝의 특징이 돋보이는 분야가 바로 기계번역이다.

 

요즘 기계번역은 전문 번역가가 직접 작업한 듯 자연스러운 번역문을 생성한다. 딥러닝 모델이 기존에 비해 훨씬 더 풍부한 번역 규칙을 찾아낸 덕분이다.

 

 

2. 딥러닝의 원리는 무엇인가?

 

딥러닝은 인간의 두뇌가 작동하는 구조를 본떠 만든 인공 신경망의 새로운 이름

 

인간의 두뇌는 무수히 많은 뉴런으로 구성되어 있다

 

마치 엄청나게 많은 다이얼이 달린 거대한 수학 구조물과 같다.

 

각각의 다이얼은 원하는 출력값이 되도록 가중치를 조절하는 역할을 한다. 첫번째 다이얼은 가장 작은 값을 조금 높이고 두번째 다이얼은 가장 큰 값을 살짝 낮추고...

 

그러면 이 많은 다이얼을 어떻게 조절할까?

 

입력 데이터를 넣고 다이얼을 조절하면서 결과물을 확인하고 다시 조금씩 다이얼을 돌려 원하는 결과와 최대한 비슷하게 나오도록 조절하면 된다

 

당연히 이것을 사람이 직접 하는 것은 아니다. 데이터를 잔뜩 넣어 학습을 통해 자동으로 조절한다.

 

처음에는 다이얼 값을 무작위로 설정하지만, 학습을 진행하면서 점점 모든 다이얼이 정답에 가까워지도록 바뀌어간다

 

모든 데이터가 정답에 가장 가까운 상태를 찾아 더 이상 다이얼을 조절할 필요가 없다면 비로소 학습이 끝난다

 

이런 과정을 거쳐 모든 데이터가 정답에 가장 가까워지는 최적의 다이얼 위치가 결정된다

 

당연히 데이터가 많을수록 훨씬 더 정교하게 조절할 수 있음은 물론이고 다이얼이 많을수록 훨씬 더 풍부하게 표현할 수 있는 모델이 될것이다.

 

딥러닝이 많은 데이터로 풍부한 규칙을 찾아낸다는 이야기는 바로 이런 뜻이다.

 

하지만 이러한 점이 장점이자, 단점이기도 하다

 

조절할 수 있는 다이얼이 너무 많다면, 도대체 무슨 일이 일어나고 있는지, 몇번째 다이얼로 인해 이런 결과가 나오는지 제대로 파악하기가 어렵다.

 

마치 인간의 생각을 이해하고 싶다며 두뇌를 분해해 무수히 많은 뉴런을 하나하나 조사해봐야 아무것도 이해할 수 없는 것과 마찬가지다.

 

딥러닝의 언어 모델인 GPT-3는 이러한 다이얼 역할을 하는 매개변수가 1750억개나 있다.

 

인간의 뇌는 약 1000억개의 뉴런을 가지고 있다고 하니 단순히 개수로만 따지면 이미 인공지능이 인간의 두뇌보다 복잡하다고 볼 수 있겠다.

 

물론 인공지능의 매개변수가 인간 두뇌의 뉴런과 같은 역할을 한다고 보기는 어렵다.

 

게다가 뉴런을 연결하는 접합부 시냅스는 100조개나 있다보니 매개변수가 100조개는 되어야 인간과 비슷한 성능을 낼 것이라고 보는 시각도 많다

 

이런 인공지능이 물론 등장하겠지만, 이런 수많은 매개변수중에서 한두개 정도는 작동 원리를 알아낼 수는 있어도 모든 매개변수의 작동원리를 알아내는 것은 불가능에 가깝다

 

 

3. 인공지능의 해석가능성이 중요할까

 

인공지능 연구 초기에는 시스템이 왜 그런 결정을 내리게 됐는지 이유를 설명할 수 있어야 한다는 해석 가능성을 중요하게 생각했다.

 

그래서 논리적인 절차를 분석해 결정한 이유를 알아낼 수 있는 if-then 규칙 기반 시스템이 대세를 이뤘다.

 

그러나 마이크로소프트의 연구소장 크리스 비숍은 능숙한 엔지니어가 인공지능의 추론 과정을 분석하더라도 이제는 의미없는 일일 가능성이 높다고 이야기한다.

 

왜냐하면 지금의 인공지능은 더 이상 인간이 해석할 수 있는 규칙을 거쳐 결론에 도달하는 것이 아니기 때문이다.

 

과거 규칙 기반은 이해하기 쉬웠지만, 성능은 실망스러웠고 지금처럼 뛰어난 성능을 내기 위해 해석이 어렵다는 약점은 받아들일 수 있다는 이야기이다.

 

인공지능은 알고리즘의 발전으로 온전하게 작동하는 것은 아니다. 알고리즘, 데이터, 시스템의 삼박자가 조화를 이루어 온전하게 동작하게 되었다.

 

출처

 

 

 

 

 

TAGS.

Comments