继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

python计算机视觉深度学习工具4图像分类数据集(机器学习常用数据集)

慕姐8265434
关注TA
已关注
手记 1275
粉丝 222
获赞 1065

MNIST

webp

图片.png

此数据集是正确分类手写数字,0-9。

MNIST(NIST:National Institute of Standards and Technology,M为modified), 数据经过预处理,以减轻计算机视觉的处理负担,该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.

此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集描述为"the drosophila of machine learning"。

MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim,对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数,落在[0,255]范围内。

下载
wiki参考

Animals:狗,猫和熊猫

webp

image.png

每种动物1000张,共有3000张图片。可以在我们的CPU或GPU上快速训练深度学习模型并获得合理的准确性。

CIFAR-10

webp

image.png

CIFAR-10由60,000 32323 (RGB)图像组成。
CIFAR-10由10类组成,包括:飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船和卡车。

虽然很容易训练在MNIST上获得> 97%分类精度的模型,但在CIFAR-10(以及更大集CIFAR-100)很难获得这样的模型。

挑战来自于物体出现方式的巨大差异。

参考: https://www.cs.toronto.edu/~kriz/cifar.html

SMILES

webp

image.png

SMILES数据集由面部图像组成,这些图像要么是微笑的,要么是不笑的,数据集中有13,165个灰度图像,每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部周围,允许我们设计机器学习算法专注于微笑识别。

Kaggle:Dogs vs. Cats参考资料:


Dogs vs. Cats挑战是Kaggle比赛的一部分,旨在设计学习算法正确地将图像分类为包含狗或猫。共提供了25,000张图片
使用不同的图像分辨率。

webp

image.png

参考:https://www.kaggle.com/c/dogs-vs-cats/data

Flowers-17

webp

image.png

Flowers-17数据集是17类别的数据集,每个类别有80个图像,由Nilsback等人策划。

Flowers-17为具有挑战性的数据集,因为规模大,视角,背景负责,变化的光照条件和类内变化。



作者:python作业AI毕业设计
链接:https://www.jianshu.com/p/d519a0787af3


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP