딥러닝의 핵심요소
1. deep learning의 기본
인공지능을 단순하게 정의하면 ‘사람의 지능을 모방하는 것’
딥러닝이 인공지능의 모든 것은 아니다.
2. 딥러닝의 핵심요소
모델이 배워야할 data,
데이터를 어떻게 변형시킬지 model,
모델의 나쁜 정도를 측정하는 loss function,
loss를 최소화하는 parameter를 추정하는 알고리즘(optimizer)
4가지만 논문에서 정확히 보더라도 해당 논문의 거의 대부분을 이해할 수 있는 수준
2-1) data
데이터(data)는 풀고자하는 문제에 따라 다르다
semantic segmentation > 이미지의 픽셀이 어느 class에 속할지
pose estimation > 이미지의 스켈레톤(동작)을 추정함
visual QnA > 시각이미지를 보고 질문에 대한 대답을 해줌?
Detection > 이미지 안 물체의 bounding box를 찾아줌
2-2) model
model은 AlexNet, LSTM, GoogleNet 등 다양한데 같은 데이터라도 모델의 성질에 따라 결과가 다를 수 밖에 없다
2-3) loss function
loss function도 성질과 문제 종류에 따라 MSE, Cross entropy 등이 있다.
어떻게 선택해야하는지에 따른 기계적인 정답은 없다
데이터에 noise가 많은 경우 회귀문제에 MSE를 loss로 사용하는데 outlier가 매우 커서 MSE가 매우 커지면 학습이 잘 안될 것이다
2-4) optimization
loss를 줄이는 알고리즘인 Optimization 기법도 여러 특성에 대해 이해하고 적절하게 선택하는 것이 중요하다
단순하게 loss를 줄이는 것이 딥러닝의 목적은 아니다.
loss만 줄여서는 train에는 성능이 좋더라도 test에는 성능이 안좋을 수 있다
모델이 학습하지 않은 데이터에도 동작하게 하는 것이 진정한 목적 중의 하나
3. 기계학습의 기본 원리
예측이 틀릴 위험을 최소화하도록 데이터를 학습하는 것이 중요하다.
회귀분석은 L2norm으로 구한 예측 오차의 분산을 최소화
분류 문제에서는 교차 엔트로피를 이용하여 예측의 불확실성을 최소화
그러면 분산과 불확실성은 어떻게 측정하는가? 통계학을 이용한다.
'딥러닝 > 딥러닝 기초' 카테고리의 다른 글
머신러닝 모델링 기본방법 - bootstrapping, bagging, boosting (0) | 2022.12.31 |
---|---|
확률분포&연속형분포의 이산화&조건부분포&기댓값으로 구하는 통계량 (0) | 2022.06.02 |
bias and variance trade off (0) | 2022.04.07 |
RNN의 기울기 소실(gradient vanishing) 문제 (0) | 2022.02.16 |
RNN(Recurrent Neural Network)이란 무엇인가? (0) | 2022.02.15 |