Hello! 欢迎来到小浪资源网！

计算机视觉数据集 (2)

小浪博主 2024-11-22 54

请我喝杯咖啡☕

*我的帖子解释了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。

(1) 时尚-MNIST(2017):

有 70,000 张时尚图像，每个图像都连接到 10 个类别的标签： *备注：
- 火车 60,000，测试 10,000。
- 每个图像都是 28×28 像素。
是 pytorch 中的 FashionMNIST()。

计算机视觉数据集 (2)

(2) 加州理工学院 101(2003):

有 8,677 个对象图像，每个图像都连接到来自 101 个类别（类）的标签。 *每张图像大约为 300×200 像素。
是 PyTorch 中的 Caltech101()。

计算机视觉数据集 (2)

(3) 加州理工学院 256(2007):

有 30,607 个对象图像连接到来自 257 个类别（类）的标签。 *实际上，它有 257 个类别（类别），名称为 Caltech 256。
是 PyTorch 中的 Caltech256()。

计算机视觉数据集 (2)

计算机视觉数据集 (2)

(4) CelebA(大规模 CelebFaces 属性)(2015):

有 202,599 张名人脸部图像，每个图像都与 40 个属性相关： *备注：
- 162,770 用于训练，19,867 用于验证，19,962 用于测试。
- 建议直接从Google Drive下载，因为从Google Drive使用Google Drive API下载太拥挤。
是 PyTorch 中的 CelebA()。

计算机视觉数据集 (2)

(5) CIFAR-10(加拿大高级研究所-10)(2009):

有 60,000 张车辆和动物图像，每个图像都连接到 10 个类别的标签： *备注：
- 火车 50,000，测试 10,000。
- 每张图像为 32×32 像素。
是 PyTorch 中的 CIFAR10()。

计算机视觉数据集 (2)

(6) CIFAR-100(加拿大高级研究所-100)(2009):

有 60,000 个对象图像，每个图像都连接到来自 100 个类的标签： *备注：
- 火车 50,000，测试 10,000。
- 每张图像为 32×32 像素。
是 PyTorch 中的 CIFAR100()。

计算机视觉数据集 (2)

X