코드

pytorch datasets

gmlee729 2024. 12. 10. 20:32
  설명 데이터 수(train, test) 클래스
갯수
이미지
크기
비고
CIFAR-10 다양 60,000(50k, 10k) 10 32x32  
CIFAR-100 다양 60,000(50k, 10k) 100 32x32  
ImageNet   1,350,000(1.2M, 100k) 1000   val데이터 5만개
MNIST 손글씨, 0~9 70,000(60k, 10k) 10 28x28 흑백
Fashion-MNIST 손글씨, 의류 70,000(60k, 10k) 10 28x28 흑백
Caltech101 다양 8,677 101   이미지 인식용
Omniglot 20명 손글씨,
1,623글자, 50종 알파벳
      One(few)-shot learning
celeb 얼굴속성 200,000 ? ?  
Flowers102 영국 꽃 8,189 102  다양함 비슷한 클래스

 

Cifar10.data   ## train 데이터
print(Cifar10.data.shape)   ## 개 행 렬 채의 형태
print(Cifar10.targets)  ## training의 class
print(len(Cifar10.targets))  ## class 갯수
print(Cifar10.targets[:10]) ## 10번째 class 까지만
print(Cifar10.data[0].shape)  ## train data의 첫번째 데이터
print(Cifar10.classes)  ## class의 이름. 0~9까지 순서임

 

print(len(mnist))   ## 60000개
print(len(mnist_test))   ## 10000개