单项选择题
Adagrad优化器缺点是:()
A.学习率自动更新,随着更新次数增加,学习率随之变慢B.需要维护两个超参数C.分母会不断累积,这样学习率就会后所并最终变得非常小,算法会失去效用D.迭代次数越多,学习率越大
单项选择题 动量梯度下降的特点是()
单项选择题 对于正则化函数dropout描述正确的是()
单项选择题 理论上激活效果最好的函数是:()