python计算机视觉深度学习工具4图像分类数据集(机器学习常用数据集)-原创手记-慕课网

首页课程实战体系课手记专栏慕课教程

python计算机视觉深度学习工具4图像分类数据集(机器学习常用数据集)

慕姐8265434 2019-01-01 15:08:04 浏览 4921

慕姐8265434

关注TA

手记 1318

粉丝 224

获赞 1070

MNIST

webp

图片.png

此数据集是正确分类手写数字，0-9。

MNIST（NIST：National Institute of Standards and Technology，M为modified), 数据经过预处理，以减轻计算机视觉的处理负担，该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.

此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集描述为"the drosophila of machine learning"。

MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim，对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数，落在[0,255]范围内。

下载
 wiki参考

Animals：狗，猫和熊猫

webp

image.png

每种动物1000张，共有3000张图片。可以在我们的CPU或GPU上快速训练深度学习模型并获得合理的准确性。

CIFAR-10

webp

image.png

CIFAR-10由60,000 32323 (RGB)图像组成。
CIFAR-10由10类组成，包括：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船和卡车。

虽然很容易训练在MNIST上获得> 97％分类精度的模型，但在CIFAR-10(以及更大集CIFAR-100)很难获得这样的模型。

挑战来自于物体出现方式的巨大差异。

参考： https://www.cs.toronto.edu/~kriz/cifar.html

SMILES

webp

image.png

SMILES数据集由面部图像组成，这些图像要么是微笑的，要么是不笑的，数据集中有13,165个灰度图像，每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部周围，允许我们设计机器学习算法专注于微笑识别。

Kaggle：Dogs vs. Cats参考资料：

Dogs vs. Cats挑战是Kaggle比赛的一部分，旨在设计学习算法正确地将图像分类为包含狗或猫。共提供了25,000张图片
使用不同的图像分辨率。

webp

image.png

参考：https://www.kaggle.com/c/dogs-vs-cats/data

Flowers-17

webp

image.png

Flowers-17数据集是17类别的数据集，每个类别有80个图像，由Nilsback等人策划。

Flowers-17为具有挑战性的数据集，因为规模大，视角，背景负责，变化的光照条件和类内变化。

作者：python作业AI毕业设计
链接：https://www.jianshu.com/p/d519a0787af3

相关标签: Python

0人推荐

随时随地看视频慕课网APP

相关课程

Python3.8系统入门+进阶 (程序员必备第二语言)

¥366 初级 14885

Python3入门机器学习经典算法与应用

¥499 初级 5984

专为程序员设计的线性代数

¥348 初级 3488

Python3 入门教程

免费入门 167897

初识机器学习-理论篇

免费入门 137560

Python多领域工程师

¥4699 102

相关阅读

100天搞定机器学习|day45-53 推荐一本豆瓣评分9.3的书：《Python数据科学手册》

100天搞定机器学习|day45-53 推荐一本豆瓣评分9.3的书：《Python数据科学手册》

猫也能明白系列

爬取抖音明星榜看看哪个明星在抖音最火

学了这么久，你知道Python机器学习全流程是怎样的么？