MNIST:准确性低于我在互联网上看到的结果
MNIST: gets lower accuracy than the results I see on the internet
我正在尝试训练一个完全连接的神经网络,以使用MNIST数据集对手写数字进行分类。神经网络是我在C++年实现的。这是我课程项目的一部分。但是,我发现培训有点奇怪。我不知道出了什么问题。
我的课程讲师要求我们使用 Sigmoid 作为激活函数,使用 MSE 作为损失函数,即使对于输出层也是如此。我有些怀疑这是否是正确的选择。但我仍然遵循他说的话。
我的网络结构是:
28*28 (input layer) value: 0-1
|
|
500 (hidden layer) activation: sigmoid
|
|
10 (output layer) activation: sigmoid
|
|
loss: MSE
学习率为0.4。批大小为 100。损失迅速下降到0.5,但不会再减少。测试准确率上升到60%,并且不会再增加。
我想知道我是否错误地实现了神经网络,或者我不应该使用 Sigmoid 和 MSE。谢谢!
更改激活和损失函数。
Sigmoid在输出层用于二元分类,但MNIST是多类分类问题。并使用分类交叉熵。MSE(均方误差(用于回归。
相关文章:
- 为什么"do while"循环不断退出,即使条件计算结果为 false?
- valgrind-hellgrind与泄漏检查的结果不同
- 用C++20 fmt限制结果的总大小
- 如何返回一个类的两个对象相加的结果
- 使用QProcess执行命令,并将结果存储在QStringList中
- 如果我std::dynamic_pointer_cast并且底层dynamic_cast的结果为null,那么返回的sh
- 在没有定义返回类型的函数中返回布尔值,并将结果保存在无错误的char编译中-为什么
- 序列化,没有库的整数,得到奇怪的结果
- 使用取消引用的指针的多态性会产生意外的结果.为什么?
- 在更改for循环的第三部分后,未使用for循环结果
- esp8266互联网交换机问题
- 使用++运算符会导致意外的结果
- 为什么在逗号分隔符上下文中将预增量的结果强制转换为void
- C++Brute Force攻击函数不会返回结果
- 你好。。。id_public变量不应该给出结果为 81 和 86 吗?为什么它为两个派生类占用不同的内存位置?
- 算术运算的结果类似于:C浮点变量中的1/3
- ";结果类型必须是可从输入范围的值类型""构造的;创建std::vector时
- 密码登录程序将永远循环并显示不正确的结果
- 如何让C++'tally up'结果并制定计划?
- 为什么这个程序的结果是3 "born"?和 4 死