计算机视觉第5章区域分割.ppt

基本信息

文件名称：计算机视觉第5章区域分割.ppt

文件大小：8.63 MB

总页数：57 页

更新时间：2025-05-21

总字数：约7.63千字

文档摘要

预训练大模型分割网络-SAM经过在1100万张图像上训练超过10亿的掩码，SAM拥有了强大的零样本学习能力，使其能够有效地应用于下游视觉任务，并展现出显著的模型泛化能力。SAM是图像分割领域的创新基础模型，是一个能够统一整个图像分割任务的基础模型。其出色的性能代表了该领域的重要进步，不仅展示了基础模型在图像分割任务中的潜力，也为未来的视觉理解研究和应用提供了新的方向和可能性。总结分水岭算法思想随着水位逐渐上升，梯度较高的分水岭的轮廓越来越狭窄，最终会形成一条边界清晰的分水线。然而，在水位上升的过程中，两个盆地之间的水会相聚并淹没分水岭，此时需要构建后一座水坝，阻止来自该盆地的水与来自对应背景的区域的水会聚。持续这一过程，直到达到最高水位。最终的水坝对应的分水线就是最终的分割边界。(d)水位阶段3(e)水位阶段4(c)分割结果分水岭算法算法流程优点：能够有效处理具有不同灰度级和颜色的图像。能够识别和分割图像中的多个物体或者区域。在视觉上产生连续的分割边界。缺点：易于产生过分割，产生大量的细小区域计算复杂度高，尤其是在处理大型图像时。需要预处理步骤，如灰度变换或梯度计算，以便选择合适的分水岭标记。分水岭算法总结目录目录全卷积FCN分割网络目录简介全卷积网络（FullyConvolutionalNetworks，FCN）是JonathanLong等人于2015年提出的用于图像语义分割的一种框架。FCN与传统的用于分类的卷积神经网络（CNN）在结构上基本一致，仅在网络尾部设计上有区别。用于分类的CNN结构示意图全卷积FCN分割网络目录FCN的结构FCN的任务是图像语义分割，即对图像进行像素级别的分类。为了完成分割任务，FCN取消了CNN中最后的若干全连接层，取而代之的是全卷积层和上采样层。用于语义分割的FCN结构示意图全卷积FCN分割网络目录全卷积层全卷积层是神经网络中一种特殊的层，不会改变输入特征图的空间维度，其输出特征图的尺寸与输入特征图的尺寸相同。全卷积层通常由卷积操作和非线性激活函数构成，其中卷积层的步长（stride）被设定为1，以保证输出尺寸与输入相同。当FCN网络被用于图像语义分割任务时，全卷积层通常用于将高维的特征图映射到像素级别的预测图。全卷积FCN分割网络目录上采样层上采样层用于将小尺寸的预测图恢复到输入的原图尺寸，以便实现像素级别的预测。上采样有多种方法，例如反池化（depooling）、反卷积（deconvolution）、算法插值上采样等。非线性反池化示意图全卷积FCN分割网络目录反卷积反卷积是卷积的逆向操作，如图（b）所示，小尺寸图像的每个像素与卷积核中的每个元素逐个相乘，最后进行叠加，即可获得一张扩大后的特征图。通过改变反卷积的卷积核的大小和步长，可以控制得到的特征图尺寸。然而值得注意的是，反卷积只能恢复特征图的尺寸，并不能很好地恢复原图的像素值。（a）正向卷积（b）反卷积全卷积FCN分割网络目录FCN的不足之处1.得到的结果不够精细，上采样的结果比较模糊和平滑，缺乏很多细节。2.在编码器进行池化操作时，尺寸减小和信息丢失是不可避免的，这可能导致模型在解码器部分难以准确地恢复细节信息，尤其是对于边界和小目标的分割。尽管FCN作为一种早期的神经网络存在一些缺陷，但随着研究的不断深入和技术的发展，许多改进的方法已经提出来解决这些问题，比如引入注意力机制、结合全局上下文信息等。因此，FCN作为一种基础的图像分割网络结构，仍然具有很大的研究和应用价值。总结：目录目录U-NET分割网络目录U-net简介U-net是一种经典的卷积神经网络架构，首次出现在2015年用于生物医学图像分割的研究中。其结构优化了特征传输和使用效率，使其在小样本数据集上表现卓越，特别适合于医学图像处理。U-net的名字来源于其网络结构的形状类似U字母，这也是它最大的特点。同时U-net引入跳跃连接（skipconnections）和上采样层，使得网络可以同时进行局部特征提取和全局信息融合，从而在图像分割任务中表现出色。U-NET分割网络目录U-net的结构U-net主要有四个模块构成：编码器（Encoder）、解码器（Decoder）、跳跃连接（SkipConnections）、最后一层卷积层。U-net结构示意图U-NET分割网络目录跳跃连接U-net中的跳跃连接是指将编码器中的特征图与解码器中相对应的特征图进行连接。这样可