相比之下,显得自己本科学的和研究生所需要的basic相差好多啊!不断补充中……不断细节化……
Kaiming init
Motivation
- 好的初始化权重方法可以让网络在前向传播或者反向传播的时候,卷积的输出和前向传播的梯度比较稳定。即数值的分布是稳定的。
- 合理的方差能使得数值不相同,但是数值又是相对稳定的。
算法
- 前向传播中,每一层的卷积计算结果的方差为1
- 后向传播中,每一层的传播梯度方差为1【反向传播中有两个梯度,一个是更新当前层的梯度,另一个是传播用于前面层梯度的计算】
|
|
对于均匀分布,通过方差算出均匀分布的最小值和最大值
|
|