发新帖

关于Mnist数据集时候的问题

[复制链接]
924 24

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
请问,我使用老师给的手写数字0-9图片时可以识别出来,但是为什么我使用自己写的手写数字就不行了呢?图片我是用手机相机拍摄的,图片中只有数字和白底,无杂质。这是什么问题?谢谢
我知道答案 回答被采纳将会获得10 金币 + 5 金币 已有24人回答
本楼点评(1) 收起

精彩评论24

atomwh  TF荚荚  发表于 2018-4-19 11:00:49 | 显示全部楼层
说明网络的泛化能力不够,在又有MNIST数据集上已经过拟合了,遇到新的数据集导致识别准确率较低。你的网络应该在MNIST数据集上的准确率很高。可以采用一些防止过拟合的方法试试
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-19 11:07:38 来自手机  | 显示全部楼层
atomwh 发表于 2018-4-19 11:00
说明网络的泛化能力不够,在又有MNIST数据集上已经过拟合了,遇到新的数据集导致识别准确率较低。你的网络 ...

谢谢
本楼点评(0) 收起
yunhai_luo  TF豆豆  发表于 2018-4-19 12:07:06 | 显示全部楼层
本帖最后由 yunhai_luo 于 2018-4-19 12:47 编辑

假设你的模型没有问题,你可以考虑把模型输入数据转换为图片,确认你前面的图形数据处理没有问题。
具体说来,因为你说你使用手机拍照的,所以格式肯定跟mnist的图片不一样。我猜想你可能需要处理才能得到模型的输入数据,这样有可能导致处理过的图片效果不好。因此我建议你把输入模型的数据拿来转回成图片,然后跟mnist图片比较一下,看看能不能发现什么问题。
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-19 12:38:35 来自手机  | 显示全部楼层
yunhai_luo 发表于 2018-4-19 12:07
假设你的模型没有问题,你可以考虑把模型输入数据转换为图片,确认你前面的图形数据处理没有问题。 ...

没明白,能详细讲解一下吗
本楼点评(4) 收起
  • yunhai_luo在我的楼里更新了一下,请查收!
    2018-4-19 12:48 回复
  • 筱墨回复 yunhai_luo :你好,我还是没能解决这个问题。当我把用手机拍摄的图片,像素设置成28*28后,需要自己再建一个数据集吗?
    2018-4-25 15:38 回复
  • 筱墨回复 yunhai_luo :我看了一下mnist的数据集是不能识别RGB的图片吧。是不是跟这个也有关系呢?
    2018-4-25 15:40 回复
  • yunhai_luo回复 筱墨 : mnist数据集是黑白的,所以训练出来的模型也只能处理黑白图片(单通道)。另外重定位像素只是一步,这样处理后需要检查图片效果,如果不好还需要进一步处理。
    2018-4-25 16:45 回复
M丶Sulayman  TF豆豆  发表于 2018-4-19 12:58:49 | 显示全部楼层
我也做过,原因在这里,你将图片要么没转换成28*28的,要么就是你图片转换的时候采样不够,导致失真。你可以关注一下这里。
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-19 16:51:56 来自手机  | 显示全部楼层
yunhai_luo 发表于 2018-4-19 12:07
假设你的模型没有问题,你可以考虑把模型输入数据转换为图片,确认你前面的图形数据处理没有问题。
具体说 ...

哦哦!谢谢
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-19 16:54:56 来自手机  | 显示全部楼层
M丶Sulayman 发表于 2018-4-19 12:58
我也做过,原因在这里,你将图片要么没转换成28*28的,要么就是你图片转换的时候采样不够,导致失真。你可 ...

那你最后是如何实现的呢?
本楼点评(0) 收起
Tsingliu  TF荚荚  发表于 2018-4-19 17:30:00 | 显示全部楼层
mnist提供的图片是

$$28 \times28=784$$

像素的图片,所以你的输入图片也要满足该格式

如果你知道多因子分析,那么你可以把784个像素点理解成784个因子,训练的实质就是找出各因子最优权重的过程
这样可以解释你的问题了
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-19 18:29:23 来自手机  | 显示全部楼层
Tsingliu 发表于 2018-4-19 17:30
mnist提供的图片是

$$28 \times28=784$$

像素的图片,所以你的输入图片也要满足该格式

如果你知道 ...

哦哦哦!谢谢
本楼点评(0) 收起
舟3332  TF芽芽  发表于 2018-4-19 20:35:26 | 显示全部楼层
可以发一下你处理后 28*28 的数据集样本吗?大家可以一起看看问题在哪里~
本楼点评(5) 收起
  • 筱墨你好,这两天看了一下资料。有几个问题没搞懂。MNIST是一个数据集,这个数据集是叫训练集吗?测试集又是指什么呢?
    2018-4-21 10:28 回复
  • 舟3332回复 筱墨 : 训练集 和 测试集 只是用法不同而已。

    比如说你上一门课,有 10 个例题,老师可以拿其中的任意 5 个讲解,再用另外 5 个作测验。
    2018-4-21 14:05 回复
  • 筱墨回复 舟3332 :那也就是说,我要把自己的10张照片也想成功输出的话,就得要自己做一个数据集,然后把这个数据集导入到MNIST数据集中训练,是这样吗?
    2018-4-21 17:17 回复
  • 舟3332回复 筱墨 : 不一定,要看你原来训练出来的模型,是否能够举一反三(泛化能力够强),可以用来识别你的新的输入。

    我是说可以把你处理好的 28*28 的照片放上来,大家看看你获取的数据格式,尺寸,像素,颜色什么的是否和老师给的数据集一致。
    2018-5-2 17:47 回复
  • tkingmnist的数据集包括训练数据、验证数据、测试数据。训练数据是为了训练模型、验证数据是训练数据的答案,测试数据是实际测试
    2018-5-7 14:32 回复
筱墨  TF荚荚  发表于 2018-4-19 21:08:12 来自手机  | 显示全部楼层
舟3332 发表于 2018-4-19 20:35
可以发一下你处理后 28*28 的数据集样本吗?大家可以一起看看问题在哪里~

还在看资料。不知道怎么处理呢
本楼点评(0) 收起
M丶Sulayman  TF豆豆  发表于 2018-4-22 12:19:31 | 显示全部楼层
筱墨 发表于 2018-4-19 16:54
那你最后是如何实现的呢?

增加了采样算法,然后就成功了,虽然识别要比原始低一些,大概84%
本楼点评(0) 收起
筱墨  TF荚荚  发表于 2018-4-24 11:38:58 来自手机  | 显示全部楼层
Tsingliu 发表于 2018-4-19 17:30
mnist提供的图片是

$$28 \times28=784$$

像素的图片,所以你的输入图片也要满足该格式

如果你知道 ...

再问一下。我可以用新的图片倒入到原来的训练集中训练一遍然后识别吗?这样从理论上来讲好像可以?
本楼点评(1) 收起
M丶Sulayman  TF豆豆  发表于 2018-4-28 12:12:42 | 显示全部楼层
已解决的话麻烦设置成已解决,方便大家,谢谢~
本楼点评(0) 收起
重庆不热  TF荚荚  发表于 2018-7-3 16:55:41 | 显示全部楼层
应该是你自己拍摄的图片和mnist中的图片的shape,数值范围不一致吧
本楼点评(0) 收起
kdongyi  TF荚荚  发表于 2018-7-3 18:14:51 | 显示全部楼层
训练的数据不够?
本楼点评(0) 收起
heliguang  TF荚荚  发表于 2018-7-3 18:40:55

学习一下
本楼点评(0) 收起

zhanys_7  TF荚荚  发表于 2018-7-3 22:44:46 | 显示全部楼层
过拟合?
本楼点评(0) 收起
ves  TF荚荚  发表于 2018-7-4 21:15:32 | 显示全部楼层
识别不好的原因找到了吗
本楼点评(0) 收起
lytensor  TF荚荚  发表于 2018-7-4 23:46:16 | 显示全部楼层
网络拟合能力强,导致学习到训练集中的特征,新增的样本并不一定与mnist数据集特征一致,所以需要增加样本多样性
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

主题

帖子

22

积分
快速回复 返回顶部 返回列表