Loading...
2022. 12. 17. 20:52

비전공자도 이해할 수 있는 AI지식 -외국어를 공부안해도 되는 시대는 올 수 있을까-

1. 언어의 규칙을 파악하고자 하다 지금까지 살펴본 내용을 정리해보겠습니다. 기계번역은 오래전 등장해 큰 관심을 받았지만, 뚜렷한 성과로 이어지지 못하면서, 오랜 침체기에 빠져있었습니다. 구글이 통계에 기반한 기계번역 서비스를 출시한 것은 2006년이었지만, 당시만 해도 그리 좋은 결과를 보여주진 못했습니다. 시스트란이 1968년부터 시도했던 규칙 기반과 큰 차이가 없었죠. 특히 영어-한국어 번역처럼 언어 구조가 많이 다른 경우에는 형편없는 결과를 보여주었습니다. 그나마 어순이 서로 비슷한 일본어-한국어 번역에서 규칙 기반으로 어느 정도 품질을 보장할 수 있었습니다만 이런 경우는 일부에 불과했죠. 우리가 학창 시절에 언어를 배울 때의 기억을 떠올려봅니다. 먼저 명사, 동사, 형용사 등을 구분하는 법을 배..

2022. 12. 17. 03:07

비전공자도 이해할 수 있는 AI지식 - 딥러닝은 기계번역을 어떻게 바꾸었는가-

1. 신경망 기반, 자연스러운 번역의 시작 2010년대 들어 드디어 딥러닝이 주목받기 시작합니다. 먼저 구문 기반으로 분석하는 방식에 딥러닝을 적용해봅니다. 그리고 우리나라의 조경현 교수가 몬트리올대학교에서 박사 후 과정 중에 성공적인 결과를 넀습니다. 이때부터 바야흐로 딥러닝을 본격적으로 기계번역에 도입합니다. 이후에는 구문 단위를 넘어 아예 문장 전체에 딥러닝을 적용하죠. 이를 신경망 기반 기계번역(Neural Machine Translation)이라고 합니다. 그렇다면, 신경망 기반 기계번역은 어떻게 작동할까요? 앞서 단어 기반에서 구문 기반으로 확장하면 보다 자연스러운 문장이 나온다고 얘기한 바 있습니다. 신경망 기반은 한발 더 나아가 문장 전체를 마치 하나의 단어처럼 통째로 번역해서 훨씬 더 자..

2022. 12. 13. 02:03

비전공자도 이해할 수 있는 AI지식 -언어의 모든 규칙을 알 수 있을까-

1. 언어의 모든 규칙을 찾아 번역하다 기계번역을 대표하는 회사로 1968년 설립한 시스트란이 있습니다. 이제는 50년이 훌쩍 넘는 역사를 자랑하는 이 회사는 헝가리 출신의 컴퓨터 과학자 피터 토마 박사가 설립했습니다. 초창기 기계번역을 연구해 2000년대 초반까지는 야후!와 구글에 제품을 납품할 정도로 세계 최고의 번역 품질을 자랑했습니다. 시스트란은 규칙 기반의 기계번역(rule-based machine translation)을 이용했습니다. 언어학자들이 일일이 정의한 규칙을 수십 년간 쌓아올렸고, 이를 이용해 당시 기준으로는 가장 높은 품질의 번역 서비스를 제공했습니다. 하지만 쉽게 예상할 수 있듯 규칙 기반에는 한계가 있습니다. 규칙을 아무리 세워도 언어의 무궁무진한 변화를 결코 따라갈 수 없기 ..

2022. 12. 10. 01:31

비전공자도 이해할 수 있는 AI지식 -딥러닝은 음성인식을 어떻게 바꿨는가-

1. 음성 합성, 딥러닝이 주도할까 음성 합성 분야는 딥러닝이 가장 빠르게 발전하는 분야이기도 합니다. 그동안 규칙 기반이 매번 통계기반, 특히 딥러닝에 주도권을 모두 내준 것처럼 음성 합성도 언젠가 딥러닝으로 교체되는 것은 시간문제라고 많은 이가 예상하죠. 최근에는 문장 전체를 딥러닝으로 합성하려는 시도도 많이 하고 있습니다. 이때도 성우의 목소리를 녹음한 데이터가 필요한 것은 동일합니다. 하지만 기존에는 정해진 문장을 녹음하고, 단순히 필요한 단어들을 조합하여 문장을 만들었다면 딥러닝을 이용한 음성 합성은 성우가 몇 시간 동안 자유롭게 녹음한 데이터를 학습해 어떤 문장이든 성우 목소리를 기반으로 합성해낸다는 차이가 있죠 물론 음성을 합성하는 일이 쉽지는 않습니다. 자연어는 억양이 오르내리고, 속도가 ..

2022. 12. 9. 01:57

비전공자도 이해할 수 있는 AI지식 -컴퓨터는 사람의 명령을 어떻게 실행하는가-

1. 명령을 수행해주는 다이얼로그 매니저 다이얼로그 매니저의 역할은 하나에 국한되지 않습니다. 앞서 음성인식이나 자연어 이해가 자신의 역할에 맞는 특정 기능만 수행했다면 다이얼로그 매니저는 사실상 그 이외의 모든 작업을 수행합니다. 앞에서 슬롯 필링을 위해서는 멀티 턴(여러번의 대화)이 필요했습니다. 이 경우 대화 내용을 기억해두어야 하고, 궁금한 내용은 외부 지식 기반 서비스에 연결하여 찾아보기도 해야 하는데, 이런 기능을 모두 다이얼로그 매니저가 수행합니다. 무엇보다 여러 도메인에 맞춰 적절한 행동을 수행하도록 명령을 내리는 역할을 합니다. 대표적으로 음악을 틀거나 날씨를 조회하라는 명령을 내리는거죠. 물론 다이얼로그 매니저가 직접 음악을 틀거나 할 수 있는 건 아닙니다. 말 그대로 매니저이기에 음악..

2022. 12. 8. 02:59

비전공자도 이해할 수 있는 AI지식 -컴퓨터가 글을 읽는 방법-

1. 규칙으로 컴퓨터가 글을 이해하게 할 수 있을까 인간의 입에서 나온 음성 파형을 텍스트 문장으로 바꿨다면, 이때부터 컴퓨터는 또 다른 어려운 문제에 직면합니다. 문장의 의미를 알아내는 일입니다 과거 애플 컴퓨터용으로 출시됐던 세계 최초 어드벤처 게임인 콜로설 케이브 어드벤처(colossal cave adventure)는 이 문제를 아주 쉽게 처리했습니다 게이머가 단 두 단어만 사용할 수 있도록 정했습니다. 모든 명령어는 "Go West(서쪽으로 가)", "Grab Ax(도끼를 잡아)" 이런 식이었죠 얼핏 봐도 규칙은 매우 간단합니다. 동사 + 명사 형태였습니다. 출시된 연도가 1976년도였으니 당시 기술로는 어쩔 수 없는 일이기도 했습니다. 이런 경우 언어를 이해하는 방식은 매우 간단합니다. 띄어쓰기..