Hiroki Naganuma
Optimizer Comparison
Main Papers
On Empirical Comparisons of Optimizers for Deep Learning
: for steps and generalization
Which Algorithmic Choices Matter at Which Batch Sizes? Insights From a Noisy Quadratic Model
: for steps and batchsize
Other Reference
本川くんスライド
深層学習の最適化アルゴリズム
Adam の バイアス補正
RMSProp の二次モーメント
俺はまだ本当のAdamを理解していない
Adam のバイアス補正一番詳しい