1
5.11
Δwhj=−η∂whj∂E=−η(∂y^j∂E∂βj∂y^j)∂whj∂βj=−η[(−y^j)(1−y^j)(yj−y^j)]bh=ηgjbh
5.12
Δθj=−η∂θj∂E=−η∂y^j∂E∂θj∂y^j=−η(y^j)(1−y^j)(yj−y^j)=−ηgj
5.13
Δvih=−η∂vih∂E=−ηj=1∑l∂y^j∂E∂βj∂y^j∂bh∂βj∂αh∂bh∂vih∂αh=ηj=1∑lgjwhj∂αh∂bh∂vih∂αh=ηj=1∑lgjwhj⋅bh(1−bh)xi=ηehxi
5.14
Δγh=−η∂γh∂E=−ηj=1∑l∂y^j∂E∂βj∂y^j∂bh∂βj∂γh∂bh=ηj=1∑lgjwhj⋅[−bh(1−bh)]=−ηeh
update:
paramater=paramater+Δparamater
卷积层将图像数据根据pixel卷积,将数据混合提取特征。pooling层能降低计算量,使用maxpooling提取数据大的特征。