encoder의 기본 진행은 다음과 같다. 위에서 나온 4개의 encoder의 hidden vector h(e)1, h(e)2, h(e)3, h(e)4와 첫번째 step의 decoder output hidden vector h(d)1가 있는데 원래라면 첫번째 단어 생성을 위해서 h(d)1가 output layer로 들어가서 예측을 수행했을 것 그러나 attention은 첫번째 단어 생성을 위해 어떤 단어에 더욱 집중해야하는지 알기 위해 h(d)1와 h(e)1 ,h(e)2 ,h(e)3 ,h(e)4과의 내적 연산을 수행하여 각 vector에 대하여 sc..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.