基本信息
文件名称:《深度学习项目案例开发》课件 2.1使用卷积神经网络完成猫狗识别-卷积.pptx
文件大小:2.75 MB
总页数:18 页
更新时间:2025-06-10
总字数:约2.1千字
文档摘要

任务2:使用卷积神经网络完成猫狗识别2.1任务知识-卷积

任务导入任务目标任务导学任务知识点

1.任务导入任务导入猫狗识别是一个经典的图像分类问题,目标是根据输入的图像判断其中是否包含猫或狗。卷积神经网络(CNN)是一种深度学习模型,特别适用于处理图像数据。它们能够从输入图像中提取局部特征,并利用这些特征进行分类。本任务使用卷积神经网络(CNN)训练一个模型完成猫狗识别。

2.任务目标知识目标理解深度学习过拟合及其应对策略了解卷积神经网络的基本结构理解卷积运算的原理及作用了解池化层的原理及作用理解激活函数在CNN中的应用能力目标能识别模型过拟合的现象和原因能进行数据预处理能构建卷积神经网络能完成模型的训练和评估能进行模型的调参和优化拓展能力能优化和调整CNN架构能进行模型调优和超参数搜索拓展能力知识任务目标

3.任务导学通过卷积操作来提取图像等数据的特征,从而实现对数据的分类、识别等任务。卷积层、池化层、激活函数、全连接层以及可选的正则化层通常使用反向传播算法来调整连接权重,以最小化预测输出与实际输出之间的误差卷积神经网络定义结构用途训练特别适用于处理具有网格结构数据的任务,如图像和视频识别

4.任务知识全连神经网络存在的问题参数量大:全连接层中的每个神经元都与前一层的所有神经元相连接,导致参数数量呈二次增长容易过拟合:由于参数数量庞大,容易在训练集上过度拟合,导致在测试集上的性能下降。不考虑空间结构:对输入数据进行扁平化处理,丢失了数据的二维结构信息。计算资源消耗大:训练和推理时需要较大的计算资源。特别是在大规模数据和复杂模型的情况下,需要更多的计算资源和时间。不适用于大规模数据:全连接神经网络在处理大规模数据时可能面临计算资源不足的问题。因为参数量较大,需要大量的内存和计算资源来进行训练和推理。

4.任务知识全连神经网络存在的问题输入层为100*100隐藏层为100*100那么这层就有100×100×100×100个参数以32位的浮点数进行存储,就需要4×108的字节的存储量,约等于400MB的参数量。

4.任务知识卷积操作卷积操作是一种数学运算,是结合两个函数生成第三个函数的数学运算,卷积操作可以理解为是两个变量在某范围内相乘后求和的结果。卷积操作可以应用于图像处理、信号处理等领域,用于特征提取、滤波等任务。

4.任务知识图像卷积图像可以表示为像素矩阵形式,卷积操作可以看作是确定一个卷积核,将这个卷积核在图像像素矩阵中按照指定的步长从左至右、从上到下移动,在移动过程中,将卷积核的权重与其对应的图像矩阵区域的权重做乘积并加和,最终输出一个值,卷积过程如图所示:

4.任务知识图像卷积图像的卷积运算是使用各种卷积核对图像处理中使用的一种运算在深度学习中卷积神经网络(CNN)通过卷积操作来提取输入图像的特征,并在此基础上进行分类、检测等任务。

4.任务知识卷积核图像的卷积运算是提取图像的特征,这时需要使用到卷积核,它是一种可学习的滤波器,作用是提取输入数据的局部特征。在卷积操作中,卷积核可以识别输入图像中的不同特征,例如边缘、纹理、角落等,也可以提取更加高级的特征表示。卷积核的大小是卷积神经网络中的一个超参数,通常与输入数据的尺寸以及需要提取的特征的大小有关。

4.任务知识常见的卷积核Laplacian卷积核,用于检测图像中的边缘和角点,具有旋转不变性和尺度不变性。高斯卷积核:用于图像平滑,减少图像中的噪声和细节信息,通常为奇数大小的卷积核。垂直边缘检测卷积核,用于检测图像中的垂直边缘,通常为3x3大小的卷积核。

4.任务知识卷积层卷积层(ConvolutionalLayer)是卷积神经网络(CNN)中的一种核心层级,用于对输入数据进行特征提取。积层对输入和卷积核权重进行互相关运算,并在添加标量偏置之后产生输出。卷积层中的两个被训练的参数是卷积核权重和标量偏置。在训练基于卷积层的模型时,也随机初始化卷积核权重。

4.任务知识卷积层的卷积运算图像:7*7*3的图像,其中7*7是输入(input)图像的H*W,3表示图像的RGB通道。两个卷积和(filter)W0和W1,形状(shape)为3*3*3,卷积核的第三个维度必须和图像的通道数相同,卷积核还有偏执值(bias),为了方便计算偏置值的形状(shape)为(1*1*1)

4.任务知识卷积层的卷积运算将卷积核按照步长2进行卷积运算,图形有个3个通道,分别与卷积核的w0通道1、通道2、通道2做内积运算,分别得到0,2,0将三个值与偏执值相加得到3,这时值就是一个特征值,计算过程如图所示。

4.任务知识卷积层的卷积运算卷积核横向移动2个像素点,按照上述计算过程就得到第二个特征值-5,继续计算得到卷积核1对图像做卷积运算的结果特征矩阵o1,接着使用卷积核2对图像做卷