单项选择题

A.当内存使用最优时这可以方便神经网络并行化
B.当用偶数是梯度下降优化效果最好
C.这些原因都不对
D.当不用偶数时,损失值会很奇怪