Loading...
2022. 12. 10. 01:31

비전공자도 이해할 수 있는 AI지식 -딥러닝은 음성인식을 어떻게 바꿨는가-

1. 음성 합성, 딥러닝이 주도할까 음성 합성 분야는 딥러닝이 가장 빠르게 발전하는 분야이기도 합니다. 그동안 규칙 기반이 매번 통계기반, 특히 딥러닝에 주도권을 모두 내준 것처럼 음성 합성도 언젠가 딥러닝으로 교체되는 것은 시간문제라고 많은 이가 예상하죠. 최근에는 문장 전체를 딥러닝으로 합성하려는 시도도 많이 하고 있습니다. 이때도 성우의 목소리를 녹음한 데이터가 필요한 것은 동일합니다. 하지만 기존에는 정해진 문장을 녹음하고, 단순히 필요한 단어들을 조합하여 문장을 만들었다면 딥러닝을 이용한 음성 합성은 성우가 몇 시간 동안 자유롭게 녹음한 데이터를 학습해 어떤 문장이든 성우 목소리를 기반으로 합성해낸다는 차이가 있죠 물론 음성을 합성하는 일이 쉽지는 않습니다. 자연어는 억양이 오르내리고, 속도가 ..

2022. 12. 9. 01:57

비전공자도 이해할 수 있는 AI지식 -컴퓨터는 사람의 명령을 어떻게 실행하는가-

1. 명령을 수행해주는 다이얼로그 매니저 다이얼로그 매니저의 역할은 하나에 국한되지 않습니다. 앞서 음성인식이나 자연어 이해가 자신의 역할에 맞는 특정 기능만 수행했다면 다이얼로그 매니저는 사실상 그 이외의 모든 작업을 수행합니다. 앞에서 슬롯 필링을 위해서는 멀티 턴(여러번의 대화)이 필요했습니다. 이 경우 대화 내용을 기억해두어야 하고, 궁금한 내용은 외부 지식 기반 서비스에 연결하여 찾아보기도 해야 하는데, 이런 기능을 모두 다이얼로그 매니저가 수행합니다. 무엇보다 여러 도메인에 맞춰 적절한 행동을 수행하도록 명령을 내리는 역할을 합니다. 대표적으로 음악을 틀거나 날씨를 조회하라는 명령을 내리는거죠. 물론 다이얼로그 매니저가 직접 음악을 틀거나 할 수 있는 건 아닙니다. 말 그대로 매니저이기에 음악..

2022. 12. 8. 02:59

비전공자도 이해할 수 있는 AI지식 -컴퓨터가 글을 읽는 방법-

1. 규칙으로 컴퓨터가 글을 이해하게 할 수 있을까 인간의 입에서 나온 음성 파형을 텍스트 문장으로 바꿨다면, 이때부터 컴퓨터는 또 다른 어려운 문제에 직면합니다. 문장의 의미를 알아내는 일입니다 과거 애플 컴퓨터용으로 출시됐던 세계 최초 어드벤처 게임인 콜로설 케이브 어드벤처(colossal cave adventure)는 이 문제를 아주 쉽게 처리했습니다 게이머가 단 두 단어만 사용할 수 있도록 정했습니다. 모든 명령어는 "Go West(서쪽으로 가)", "Grab Ax(도끼를 잡아)" 이런 식이었죠 얼핏 봐도 규칙은 매우 간단합니다. 동사 + 명사 형태였습니다. 출시된 연도가 1976년도였으니 당시 기술로는 어쩔 수 없는 일이기도 했습니다. 이런 경우 언어를 이해하는 방식은 매우 간단합니다. 띄어쓰기..

2022. 12. 7. 03:44

비전공자도 이해할 수 있는 AI지식 -컴퓨터는 어떻게 사람의 목소리를 이해하는가-

1. 음성인식은 생각보다 어려운 일이다 '음성인식'부터 살펴보겠습니다. 스피커는 어떻게 인간의 말을 알아듣는걸까요? 대번에 잘 알아듣는 것처럼 보이지만 사실 인간의 말을 알아듣는 과정은 생각보다 훨씬 복잡하고 정교합니다. 사람은 보통 문자보다 말을 먼저 익히기 때문에 음성인식이 문자인식보다 쉽지 않을까 생각할 수도 있지만 오히려 반대입니다. 우리가 모국어가 아닌 언어를 성인이 되어서 배울 때는 말보다는 글이 더 쉽게 느껴집니다. 컴퓨터도 마찬가지입니다. '모라벡의 역설'을 떠올리면 이해가 쉽습니다. 말을 배우는 것은 다섯 살배기 아이도 쉽게 하지만 컴퓨터는 그렇게 하지 못합니다. 더구나 컴퓨터 입장에서는 음성 언어의 가변성과 음성 자체에 내재하는 소음 등 여러 이유로 음성 인식이 문자인식보다 훨씬 더 까..

2022. 12. 3. 03:09

비전공자도 이해할 수 있는 AI지식 -딥러닝은 추천시스템을 어떻게 바꿨는가-

1. 유튜브 추천 시스템, 딥러닝을 도입하다 행렬 인수분해 기법은 딥러닝의 구조와 많이 닮아있습니다. 결과를 도출하기 위해 내재된 특성을 찾아 여러 차례 게산하는 구조가 마치 인공 신경망을 이용해 여러 차례 계산해나가는 과정과 비슷하죠 행렬 인수분해는 중간 구조가 없는 간결한 형태의 신경망 구조를 띠는 반면 딥러닝은 중간 구조가 깊은 신경망 구조를 보여줍니다. 이처럼 유사한 구조로 인해 최근에는 행렬 인수분해 대신 딥러닝으로 접근하려는 시도가 많이 있습니다. 2016년 공개된 유튜브의 추천 시스템도 행렬 인수분해를 딥러닝으로 바꿔서 더 좋은 성능을 낸 구조였죠. 깊은 신경망일수록 더 좋은 성능을 냈습니다. 물론 딥러닝이 제대로 성능을 내기 위해서는 엄청난 데이터가 필요하지만, 이미 유튜브에는 2019년에..

2022. 12. 1. 01:37

비전공자도 이해할 수 있는 AI지식 -잠재요인을 찾아내는 추천시스템-

1. 은둔의 고수가 찾아낸 획기적인 추천 알고리즘 이번에는 협업 필터링 기법 중에 하나인 행렬 인수분해(matrix factorization)를 살펴보겠습니다. 고객/영화 살인의 추억 겨울왕국 부산행 건축학개론 추격자 태연 4 1 - - - 아이유 2 2 1 ? - 수지 2 3 1 5 - 민경 - 5 3 - 1 아이유와 수지는 마침 비슷한 평점을 주었고 어렵지 않게 유사한 고객임을 확인할 수 있었지만, 만약 평점이 한두개 영화가 아니라 수천개쯤 되고 점수 또한 제각각이라면 취향이 비슷한 고객을 찾는 일이 쉽지 않을 거에요. 행렬 인수분해는 제각각인 평점 정보를 이용해 고객의 특징을 자동으로 추출하고 뿐만 아니라 영화의 특징도 자동으로 추출해내서 이 정보를 바탕으로 고객의 평점을 예측합니다 이렇게 하면 좋..