原文:从动力学角度看优化算法SGD:一些小启示