image data 특징 간단하게
1. image
시각적인 인식을 표현한, 혹은 묘사한 인공물(artifact)
시각적인 인식이라는 것은 컴퓨터는 어떻게 표현하는가?
컴퓨터가 이미지를 이해하는 방식을 알고 있어야 이미지를 넣어 모델링하고 분류하는 class를 만들 수 있을 것
2. pixel
이미지를 표현하는 최소단위
Red, Green, Blue의 값이 어느정도 있느냐에 따라 pixel이 가지는 정보, 색깔이 표현
pixel이 많이 모여 하나의 이미지를 이룬다
3. image 저장 방식
width, height, channel 차원의 각 pixel의 R,G,B 값의 array 형태로 저장
channel은 R,G,B 3개 뿐만 아니라 그 이상 4개인 경우도 있다
R,G,B는 0~255까지
dtype = uint8은 unsigned int8로 표현했다는 뜻, 0이상의 정수의 8bit 표현
8bit는 2^8=256이므로 0~255의 256가지를 표현할 수 있음
4. gray scale
수학적으로 이미지를 불러오면 그것이 흑백사진인 경우(gray scale)
[(batchsize),1,(가로크기),(세로크기)]같은 채널이 1인 텐서로 얻어옴
5. color scale
컬러사진이면 R,G,B 각각 채널이 있는 [(batchsize),3,(가로크기),(세로크기)] 같은 채널 3인 텐서로 얻어옴
위와 같은 컬러 이미지 channel 수가 3이다.
흑백이미지로 만들면 channel 수가 1이다. 0이다?
'딥러닝 > Computer Vision' 카테고리의 다른 글
딥러닝의 시대를 열었던 AlexNet (0) | 2024.04.17 |
---|---|
간단하게 살펴보는 여러가지 GAN (0) | 2024.04.15 |
test time augmentation (0) | 2024.04.02 |
multimodal learning2 - show, attend and tell, visual question answering - (0) | 2023.07.05 |
multimodal learning1 - image and text joint embedding (0) | 2023.07.03 |