基本信息
文件名称:《深度学习项目案例开发》课件 2.2使用卷积神经网络完成猫狗识别-池化.pptx
文件大小:1.61 MB
总页数:16 页
更新时间:2025-06-10
总字数:约2.38千字
文档摘要

任务2:使用卷积神经网络完成猫狗识别2.2任务知识-池化

特征图卷积层参数池化卷积神经网络

4.任务知识特征图卷积运算的输出通常称为特征图每个特征图反映了图像中的特定模式或特征,如边缘、纹理或其他复杂结构阶特征图主要提取简单的图像特征,如边缘、角点、颜色梯度和纹理等高阶特征图提取复杂和抽象的特征,如物体的形状、部分结构和语义概念特征图的大小和数量由卷积核的数量、大小、步幅、填充等参数决定

4.任务知识特征图的大小特征图的维度,卷积运算的输出维度取决于输入图像的尺寸、卷积核的尺寸、步长(stride)、以及填充(padding)的选择特征图计算公式中H中是输入图像的高度,W是输入图像的宽度,F_H、F_W分别表示卷积核的高度、宽度,例如,H=5,W=5,pad=1,F_H=3,F_W=3特征图的深度,输出的深度取决于卷积层中的卷积核的数量,上例中有2个卷积核,所示最终的特征图shape为3*3*2

4.任务知识卷积运算参数步长(Stride):卷积核遍历特征图时每步移动的像素,步长越小,提取的特征会更精细。填充(Padding):处理特征图边界的方式,一种是“valid”,对边界外完全不填充,只对输入像素执行卷积操作,这样会使输出特征图像尺寸变得更小,且边缘信息容易丢失;另一种是“same”,对边界外进行填充(一般填充为0),再执行卷积操作,这样可使输出特征图的尺寸与输入特征图的尺寸一致,边缘信息也可以多次计算。

4.任务知识卷积运算参数非线性激活函数:在卷积运算之后会应用一个非线性激活函数,如ReLU函数,以增加网络的非线性和表达能力。通道(Channel):卷积层的通道数(层数),彩色图像一般都是RGB三个通道(channel)。卷积核数目:主要还是根据实际情况调整,一般都是取2的整数次方,数目越多计算量越大,相应模型拟合能力越强

4.任务知识卷积核参数共享卷积参数共享是卷积神经网络(CNN)中一种关键的特性。在卷积操作中,同一卷积核的权重在整个输入图像上是共享的卷积参数共享带来了以下几个好处:减少参数数量,卷积核的权重在整个输入图像上共享,极大地减少了模型的参数数量,减少了过拟合的风险;提高计算效率,这使得训练和推理的速度加快;参数共享带来了对输入数据的平移不变性;局部连接,有助于提取局部特征。

4.任务知识池化层池化层(Poolinglayer)是卷积神经网络(ConvolutionalNeuralNetwork,CNN)中常用的一种层类型,它的主要作用是通过对输入数据进行下采样(subsampling)或汇聚(pooling),减少数据的空间维度,同时保留重要的特征。例如卷积得到224*224*64的特征图,这时可以设定一个池化核,大小2*2同时已设定池化的步长为2*2,经过池化后征图形状变为112*112*64

4.任务知识池化操作池化窗口大小,指定池化操作的区域大小,例如(2,2)表示2x2的区域。步长,指定池化操作的步长(stride),即在每次操作后,窗口移动的距离,例如,步长为(2,2)表示每次移动2个单位

4.任务知识池化操作类型池化操作有两种,最大池化(MaxPooling)在给定的池化窗口内选择最大值。这种操作有助于保留特征图中的最显著特征。平均池化(AveragePooling)在给定的池化窗口内计算平均值,这种操作有助于平滑特征图。在实际使用过程中最大池化(MaxPooling)的效果要好于均池化(AveragePooling)

4.任务知识池化作用池化操作最直观的效果就是特征图的尺寸缩减,池化层会减小输入数据的尺寸,从而减少了后续层需要处理的数据量。这有助于减少模型的计算成本和内存占用;通过池化层的操作,模型对输入数据的平移、缩放和旋转等变化变得更加鲁棒,因为池化操作会将局部区域内的特征进行整合,这减少了对具体位置的依赖;池化层在一定程度上可以帮助减轻过拟合,因为它降低了模型的复杂度,减少了参数的数量。

4.任务知识卷积神经网络CNN的主要层包括,输入层、卷积层、池化层、全连接层输出层等。输入层通常是图像数据,它被表示为多通道特征图卷积层,提取输入特征图中的局部特征,卷积层包括多个滤波器,以生成新的特征图在卷积操作后,通常使用激活函数,例如ReLU来引入非线性。池化层,通常在卷积层之后应用池化层,以降低特征图的空间维度,减少计算量,增加鲁棒性。卷积层和池化层交替使用,以提取和聚合特征,这些层可以堆叠在一起,可以组成深层网络。全连接层通常位于CNN的末尾,用于对高层次特征进行分类,全连接层将特征图展平为一维向量,并与输出层连接。输出层生成最终预测结果,例如在图像分类任务中是类别概率。

4.任务知识卷积神经网络例如猫狗识别中,输出的是