边缘计算与智能视觉应用
4.3图像分割技术
延时符
定义与概述
图像分割技术是指将图像划分为若干个特定的、具有独特性质的区域,并提出感兴趣目标的技术和过程。根据图像的灰度、颜色、结构、纹理等特征设计合理的准则函数,设计一个或多个阈值,从而将图像中的像素点逐个与设定阈值比较,进而将图像分割成若干个互不交叠的区域。
定义与概述
图形分割方法
基于阈值的方法
全局阈值、局部阈值
基于区域的方法
基于边缘的方法
深度学习的方法
分水岭算法、图切算法
廓线点检测、活动阔线法
图像分割的三个任务等级
1
2
3
语义分割:把图像中的每个像素分为特定的语义类别,属于特定类别的像素仅被分类到该类别。
实例分割:在语义分割的基础上,进一步区分出同一类别的不同个体。
全景分割:同时完成语义分割和实例分割的任务,为图像中的每个像素分配一个唯一的标签,这个标签既表示该像素所属的类别,也表示它属于哪个实例。
主流算法
主流算法
空洞卷积和
多尺度分割
(DeepLab)
全卷积网络
(FCN)
U-Net模型
U-Net模型
U-Net模型是一种在深度学习中广泛应用的卷积神经网络结构,主要用于图像分割任务。U-Net模型的结构对称,分为左半边的压缩通道(ContractingPath,也称为编码器)和右半边扩展通道(ExpansivePath,也称为解码器),整体形状类似英文字母“U”,因此得名。
空洞卷积和多尺度分割(DeepLab)
DeepLab是由谷歌研究人员提出的一系列深度学习模型,主要用于图像语义分割任务。DeepLab系列模型基于卷积神经网络(CNN)构建,并引入了多项创新技术以提高语义分割的准确性和效率。
全卷积网络(FCN)
全卷积网络(FullyConvolutionalNetworks,FCN)是一种深度学习领域中的特殊神经网络结构,特别是在计算机视觉领域表现出色。FCN是对传统卷积神经网络(CNN)的一种改进和扩展。FCN通过将全连接层替换为卷积层(通常是全局平均池化或转置卷积),使得网络能够接受任意尺寸的输入,并输出相应尺寸的特征图。这种替换使得FCN可以应用于图像分割等像素级别的任务。
挑战与发展
挑战与发展
挑战
发展
图形分割技术,特别是图像分割技术,在计算机视觉和图像处理领域中扮演着至关重要的角色,但仍存在着边缘模糊与噪声、颜色一致性问题、复杂形状与遮挡、多尺度与多姿态问题、计算复杂性与实时性要求等挑战。
图像分割技术的发展方向将围绕技术深化与创新、应用场景拓展、算法优化与加速以及标准化与规范化等多个方面展开。随着技术的不断进步和应用的不断拓展,图像分割技术将在更多领域发挥重要作用。
谢谢观看
Thankyouforwatching