'output layer' 태그의 글 목록

Vanilla RNN에서 hidden vector로 예측값을 만드는 과정

hidden vector의 차원은 hyperparameter이다. 여기서는 2차원이라고 가정해보자. 3차원의 입력벡터

$X_{t}$ 가 들어가고 2차원의 hidden state vector인

$h_{t-1}$ 이 RNN의 입력으로 들어간다고 해보자. 처음에는

$X_{t}$ 와

$h_{t-1}$ 이 concatenation되어 hidden layer에 fully connected 된다. 당연하지만

$h_{t-1}$ 이 2차원이기때문에

$h_{t}$ 를 뽑아내는 layer의 차원도 2차원이다. hidden layer의 선형변환 W와 입력벡터의 곱 WX에 nonlinear activation인 tanh(WX)로

$h_{t}$ 가 뽑힌다. Vanilla RNN이 실제로 tanh()를 activate function으로 썼다..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.

Vanilla RNN에서 hidden vector로 예측값을 만드는 과정