判断题
激活函数为有限值时,基于梯度的优化方法更加稳定。
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 在数据很稀疏和神经网络参数量较少的场景下,偏向于使用L-BFGS而不是SGD。
判断题 训练好的模型在测试集准确率100%,则在新的数据集上也会达到100%。
判断题 多层网络全部初始化为0,会使梯度为0或各层相同,相当于浅层网络。