간단하게 살펴보는 여러가지 GAN
GAN은 그 아이디어가 나온 뒤로 1~2년만에 급격하게 후속논문이 등장했다
그런데 DALL-E가 transformer로 엄청난 generation을 했는데 generation 문제에서 GAN이 정답이 아닐 수 있다는 것이다
1. DCGAN
이미지를 discriminator할 때는 Convolution해가면서 마지막에 generating할 때는 deconvolution으로 생성했다는 것 같다
2. Info-GAN
Generation에 class 정보도 집어넣으면서 특정 class에 집중할 수 있게 해준다는거??
3. Text2Image
문장이 주어지면 그것에 맞는 이미지를 생성한다
4. Puzzle-GAN
이미지의 subpatch를 넣으면 원래 이미지를 복원한다
5. CycleGAN
두 이미지간 domain을 뒤 바꾼다
원래 이미지간 도메인을 뒤바꾼다고하면
예를 들어 얼룩말을 말로 바꾸려고 한다면 두개의 동일한 이미지에서 얼룩말과 말만 있는 사진이 필요한데
cycle-consistency loss에 의해 야생에 떠도는 무수한 얼룩말 사진과 무수한 말 사진을 학습시킨 GAN 2개가
임의의 말 사진이 있으면 얼룩말로 바꾸게 만들어 준다는 것이 핵심 원리이다
6. Star-GAN
사람 얼굴을 원하는 특성에 맞게 바꿔서 생성하나보다
7. Progressive-GAN
조잡한 이미지를 계속해서 쌓아나가 고차원의 이미지를 생성하는 GAN?
'딥러닝 > Computer Vision' 카테고리의 다른 글
object detection task, SPP Net, R-CNN, YOLO 간단하게 알아보기 (0) | 2024.04.17 |
---|---|
딥러닝의 시대를 열었던 AlexNet (0) | 2024.04.17 |
image data 특징 간단하게 (0) | 2024.04.06 |
test time augmentation (0) | 2024.04.02 |
multimodal learning2 - show, attend and tell, visual question answering - (0) | 2023.07.05 |