基本信息
文件名称:《计算机视觉》 教学案例 4、区域分割.pdf
文件大小:223.17 KB
总页数:2 页
更新时间:2025-05-21
总字数:约2.49千字
文档摘要

教学案例4:区域分割

一、实验目的与任务

通过本实验,要求学生能够了解区域分割的基本思想,通过学习一组训练图像和对应

的标签,来建立区域分割模型,获得分割结果图并展示。

二、实验内容、要求及安排

实验内容:利用神经网络模型等方法,实现图像语义分割算法。实验中应注意不同模

型对实验结果、模型参数、算法实时性、算法空间复杂度的影响。实验报告中要包含问题

的数学原理描述、算法描述、实现,实验结果展示及分析。

实验要求:本课程实验要求学生使用Python语言编程。要求学生依据课堂讲授的相关

知识,以区域分割为任务,经过分析、设计、编码与调试,独立完成题目的算法设计与程

序的实现,并最终提交调试成功的源程序代码和实验报告。

实验安排:本实验属于开放性实验,要求每个学生独立地完成本实验项目。

三、任务实现及相关素材

(一)任务简介:区域分割包含三个子任务:语义分割、实例分割、全景分割。

语义分割:每个像素对应一个类标签,同一类会被定义成一个区域块,不区分其中单

个个体,但受限于定义的类数量,其中不使用的像素点会有指定的分类。

实例分割:每个对象的掩码和类标签。区分单个物体以及单个物体所属的类型,但受

限于能够识别的物体类型数量,无法识别的都作为背景(图上的黑色背景)。

全景分割:每像素类+实例标签。相当于在语义分割的基础上,增加单个实例的区分。

相对于语义分割和实例分割而言,任务更加困难。

(二)数据集简介:

1.CRAG(ColorectalAdenocarcinomaGland)这个数据集包含213幅20倍放大的肠道

结肠癌HE细胞块图像,每幅图像都进行了全实例级别的注释。这些数据在MILD-Net论

文中作为数据集使用,该论文发表在MedicalImageAnalysis期刊上。数据集被分为训练集

和测试集,训练集包含173幅图像,测试集包含40幅图像。

2.HRC_WHU(High-ResolutionCloudDetectionDataset):这个数据集由武汉大学的

SENDIMAGE实验室创建,包含150张高分辨率云层验证数据图像,这些图像具有三个

RGB通道,分辨率从0.5到15米不等,覆盖了全球不同地区。图像主要包括五种主要的

地表类型,即水体、植被、城市、雪/冰和荒地。每张图像都配有由遥感图像解译领域的专

家手动标注的参考云层遮罩。

3.SWINySEG(SingaporeWholeskyNychthemeronImageSEGmentationDatabase):这个

数据集包含6768张白天和夜晚的天空/云片段图像,以及它们对应的二值化地面真实地图。

所有图像都是在新加坡使用WAHRSIS(一种校准的地面全天空成像器)拍摄的,时间跨

度为2016年1月至12月。地面真实标注是在与新加坡气象服务专家协商后完成的。

4.VOC2012(ThePASCALVisualObjectClassesChallenge2012)是一个用于目标检测、

语义分割等任务的经典数据集。该数据集包含了20种类别的物体以及背景类别,其中包括

人、动物、车辆和家用物品等。

上述数据集可以从网上搜索下载。

(三)模型简介:

1.全连接卷积神经网络(Fullyconnectednetwork,FCN)模型是用深度神经网络来做

语义分割的奠基性工作,由Shelhamer,Long和Darrell等人在2015年提出,是第一个将全

卷积层用于区域分割任务的模型,相比当年其他主流网络,在PASCAL测试集上的相对性

能提高了20%,并极大减少了推理时间。FCN用转置卷积层来替换CNN最后的全连接层,

从而允许输入和输出具有不同尺寸的特性图,获得像素级别的语义分割预测。

2.U-Net是一种用于区域分割任务的深度神经网络,由Ronneberger、Fischer和Brox

等人于2015年提出,在语义分割领域具有重要的地位。U-Net采用全卷积网络结构,包括

编码器和解码器两个主要部分,其中编码器用于特征提取,解码器用于还原图像的分辨率。

U-Net在处理医学图像时表现出色。

(四)环境说明:

算法