学习笔记TF033:实现ResNet - Python

TOP

学习笔记TF033:实现ResNet(一)

2017-09-30 17:31:40 【大中小】浏览:3208次

ResNet(Residual Neural Network)，微软研究院 Kaiming He等4名华人提出。通过Residual Unit训练152层深神经网络，ILSVRC 2015比赛冠军，3.57% top-5错误率，参数量比VGGNet低，效果非常突出。ResNet结构，极快加速超深神经网络训练，模型准确率非常大提升。Inception V4，Inception Module、ResNet结合。ResNet推广性好。

瑞十教授Schmidhuber(LSTM网络发明者，1997年)提出Highway Network。解决极深神经网络难训练问题。修改每层激活函数，此前激活函数只是对输入非线性变换y=H(x,WH)，Highway NetWork保留一定比例原始输入x，y=H(x,WH)·T(x,WT)+x·C(x,WC)，T变换系数，C保留系数，令C=1-T。前面一层信息，一定比例不经过矩阵乘法和非线性变换，直接传输下一层。Highway Network，gating units学习控制网络信息流，学习原始信息应保留比例。gating机制，Schmidhuber教授早年LSTM循环神经网络gating。几百上千层深Highway Network，直接梯度下降算法训练，配合多种非线性激活函数，学习极深神经网络。Highway Network允许训练任意深度网络，优化方法与网络深度独立。

ResNet 允许原始输入信息直接传输到后层。Degradation问题，不断加深神经网络深度，准确率先上升达到饱和，再下降。ResNet灵感，用全等映射直接将前层输出传到后层。神经网络输入x，期望输出H(x)，输入x直接传到输出作初始结果，学习目标F(x)=H(x)-x。ResNet残差学习单元(Residual Unit)，不再学习完整输出H(x)，只学习输出输入差别H(x)-x，残差。

ResNet，很多旁路支线，输入直接连到后层，后层直接学习残差，shortcut或connections。直接将输入信息绕道传到输出，保护信息完整性，整个网络只学习输入、输出差别，简化学习目标、难度。

两层残新式学习单元包含两个相同输出通道数3x3卷积。三层残差网络用Network In Network和Inception Net 1x1卷积。在中间3x3卷积前后都用1x1卷积，先降维再升维。如果输入输出维度不同，对输入x线性映射变换维度，再接后层。

layername outputsize 18-layer 34-layer 50-layer 101-layer 152-layer
conv1 112x112 7x7,64,stride 2
conv2_x 56x56 3x3 max pool,stride 2
3x3,64x2 3x3,64x3 1x1,64x3 1x1,64x3 1x1,64x3
3x3,64 3x3,64 3x3,64 3x3,64 3x3,64
1x1,256 1x1,256 1x1,256
conv3_x 28x28 3x3,128x2 3x3,128x4 1x1,128x4 1x1,128x4 1x1,128x8
3x3,128 3x3,128 3x3,128 3x3,128 3x3,128
1x1,512 1x1,512 1x1,512
conv4_x 14x14 3x3,256x2 3x3,256x6 1x1,256x6 1x1,256x23 1x1,256x36
3x3,256 3x3,256 3x3,256 3x3,256 3x3,256
1x1,1024 1x1,1024 1x1,1024
conv5_x 7x7 3x3,512x2 3x3,512x3 1x1,512x3 1x1,512x3 1x1,512x3
3x3,512 3x3,512 3x3,512 3x3,512 3x3,512
1x1,2048 1x1,2048 1x1,2048
1x1 average pool,1000-d fc,softmax
FLOPs 1.8x10^9 3.6x10^9 3.8x10^9 7.6x10^9 11.3x10^9

ResNet结构，消除层数不断加深训练集误差增大现象。ResNet网络训练误差随层数增大逐渐减小，测试集表现变好。Google借鉴ResNet，提出Inception V4和Inception-ResNet-V2，ILSVRC错误率3.08%。《Identyty Mappings in Deep Residual Networks》提出ResNet V2。ResNet残差学习单元传播公式，前馈信息和反馈信号可直接传输。skip connection 非线性激活函数，替换Identity Mappings(y=x)。ResNet每层都用Batch Normalization。

Schmidhuber教授，ResNet，没有gates LSTM网络，输入x传递到后层过程一直发生。ResNet等价RNN，ResNet类似多层网络间集成方法(ensemble)。

《The Power of Depth for Feedforward Neural Networks》，理论证明加深网络比加宽网络更有效。

Tensorflow实现ResNet。contrib.slim库，原生collections。collections.namedtuple设计ResNet基本Block模块组named tuple，创建Block类，只有数据结构，没有具体方法。典型Block，三个参数，scope、unit_fn、args。
Block('block1', bottleneck, [(256, 64, 1)] * 2 + [(256, 64, 2)])，block1是Block名称(或scope)，bottleneck是ResNet V2残差学习单元。最后参数是Block args，args是列表，每个元素对应bottleneck残差学习单元。前面两个元素(256, 64, 1),第三元素(256, 64, 2)，每个元素都是三元tuple(depth,depth_bottleneck,stride)。(256, 64, 3)代表bottleneck残差学习单元(三个卷积层)，第三层输出通道数depth 256，前两层输出通道数depth_bottleneck 64，中间层步长stride 3。残差学习单元结构[(1x1/s1,64),(3x3/s3,64),(1x1/s1,256)]。

降采样subsample方法，参数inputs(输入)、factor(采样因子)、scope。fator1,不做修改直接返回inputsx，不为1,用slim.max_pool2d最大池化实现。1x1池化尺寸，stride步长，实现降采样。

定义conv2d_same函数创建卷积层，如果stride为1，用slim.conv2d，padding模式SAME。stride不为1,显式pad zero。pad zero总数kernel_size-1 pad_beg为pad//2,pad_end为余下部分。tf.pad补零输入变量。已经zero padding，只需padding模式VALID的slim.conv2d创建此卷积层。

定义堆叠Blocks函数，参数net输入，blocks是Block class 列表。outputs_collections收集各end_points

首页上一页 1 2 下一页尾页 1/2/2
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：hashlib 简单加密	下一篇：字典类型功能代码