MNIST:准确性低于我在互联网上看到的结果

MNIST: gets lower accuracy than the results I see on the internet

本文关键字:结果 互联网 准确性 于我 MNIST      更新时间:2023-10-16

我正在尝试训练一个完全连接的神经网络,以使用MNIST数据集对手写数字进行分类。神经网络是我在C++年实现的。这是我课程项目的一部分。但是,我发现培训有点奇怪。我不知道出了什么问题。

我的课程讲师要求我们使用 Sigmoid 作为激活函数,使用 MSE 作为损失函数,即使对于输出层也是如此。我有些怀疑这是否是正确的选择。但我仍然遵循他说的话。

我的网络结构是:

28*28 (input layer) value: 0-1
|
|
500 (hidden layer) activation: sigmoid
|
|
10 (output layer) activation: sigmoid
|
|
loss: MSE

学习率为0.4。批大小为 100。损失迅速下降到0.5,但不会再减少。测试准确率上升到60%,并且不会再增加。

想知道我是否错误地实现了神经网络,或者我不应该使用 Sigmoid 和 MSE。谢谢!

更改激活和损失函数
Sigmoid在输出层用于二元分类,但MNIST是多类分类问题。并使用分类交叉熵。MSE(均方误差(用于回归。