pytorch에서 model에 input을 넣어 forward 과정을 거쳐 output을 낼려고 할 때 종종 에러가 나는데 input으로 3d, 4d, 5d를 받아야하는데 2d가 들어왔다고 말하는거 딥러닝은 모델이 너무 복잡하기 때문에 머릿속에서 생각만으로 어디가 문제인지 알아내기 어렵다 모델 내부에서나, input, output등에 대해 중간중간에 shape를 찍어봐야함 중간에 grad_CAM의 shape를 찍어보면 실제로 2d라는 걸 확인할 수 있음 2d를 2번 unsqueeze(0)해서 4d로 만들고 넣었더니 더 이상 에러가 없었다 왜 2번했냐고? 1번만 하면 또 에러나서 그래 ------------------------------------------------------------..
1. non-linear activation z1 = W1x + b1 a1 = g1(z1) z2 = W2a1 + b2 a2 = g2(z2) 만약, g1 = px+q, g2 = rx+s의 선형함수라고 한다면, z2 = W2W1(px+q) + W2b1+b2이고, W2W1 = W3, W2b1+b2 = b3라고 한다면, z2 = W3(px+q)+b3이다. 따라서 몇개의 layer를 연결하더라도, activation이 linear라면, 하나의 layer로 만들어진다. 그래서 함수의 표현력이 떨어져서 hidden layer에서 linear activation은 사용하지 않는다. output layer에서 linear activation을 사용할 수 있으며, 그렇다면 hidden layer은 non-linear ac..
1. model이란 무엇인가 data preprocessing에서 Vanilla data가 모델을 거칠 수 있도록 데이터를 변환했음 어떤 데이터를 사용하여 어떤 결과를 만들지 문제 해결 과정을 잘 정의했다면? modeling에서 preprocessing한 image를 넣어 원하는 형태의 output이 나오는 model을 만들어야 ------------------------------------------------------------------------------ 여기서 말하는 model이란? “일반적으로 model은 object, person, system의 정보적인 표현” object는 노트북이나 핸드폰 모델, person은 패션모델, system이 바로 딥러닝 여기서는 딥러닝을 말하고 싶으니까...
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.