간단하게 살펴보는 여러가지 GAN

딥러닝/Computer Vision

간단하게 살펴보는 여러가지 GAN

GAN은 그 아이디어가 나온 뒤로 1~2년만에 급격하게 후속논문이 등장했다

그런데 DALL-E가 transformer로 엄청난 generation을 했는데 generation 문제에서 GAN이 정답이 아닐 수 있다는 것이다

1. DCGAN

이미지를 discriminator할 때는 Convolution해가면서 마지막에 generating할 때는 deconvolution으로 생성했다는 것 같다

2. Info-GAN

Generation에 class 정보도 집어넣으면서 특정 class에 집중할 수 있게 해준다는거??

3. Text2Image

문장이 주어지면 그것에 맞는 이미지를 생성한다

4. Puzzle-GAN

이미지의 subpatch를 넣으면 원래 이미지를 복원한다

5. CycleGAN

두 이미지간 domain을 뒤 바꾼다

원래 이미지간 도메인을 뒤바꾼다고하면

예를 들어 얼룩말을 말로 바꾸려고 한다면 두개의 동일한 이미지에서 얼룩말과 말만 있는 사진이 필요한데

cycle-consistency loss에 의해 야생에 떠도는 무수한 얼룩말 사진과 무수한 말 사진을 학습시킨 GAN 2개가

임의의 말 사진이 있으면 얼룩말로 바꾸게 만들어 준다는 것이 핵심 원리이다

6. Star-GAN

사람 얼굴을 원하는 특성에 맞게 바꿔서 생성하나보다

7. Progressive-GAN

조잡한 이미지를 계속해서 쌓아나가 고차원의 이미지를 생성하는 GAN?

'딥러닝 > Computer Vision' 카테고리의 다른 글

object detection task, SPP Net, R-CNN, YOLO 간단하게 알아보기 (0)	2024.04.17
딥러닝의 시대를 열었던 AlexNet (0)	2024.04.17
image data 특징 간단하게 (0)	2024.04.06
test time augmentation (0)	2024.04.02
multimodal learning2 - show, attend and tell, visual question answering - (0)	2023.07.05

TAGS.

통계학 세상

통계학 세상

통계학 세상