《计算机视觉》教学案例 4、区域分割.pdf

基本信息

文件名称：《计算机视觉》教学案例 4、区域分割.pdf

文件大小：223.17 KB

总页数：2 页

更新时间：2025-05-21

总字数：约2.49千字

文档摘要

教学案例4：区域分割

一、实验目的与任务

通过本实验，要求学生能够了解区域分割的基本思想，通过学习一组训练图像和对应

的标签，来建立区域分割模型，获得分割结果图并展示。

二、实验内容、要求及安排

实验内容：利用神经网络模型等方法，实现图像语义分割算法。实验中应注意不同模

型对实验结果、模型参数、算法实时性、算法空间复杂度的影响。实验报告中要包含问题

的数学原理描述、算法描述、实现，实验结果展示及分析。

实验要求：本课程实验要求学生使用Python语言编程。要求学生依据课堂讲授的相关

知识，以区域分割为任务，经过分析、设计、编码与调试，独立完成题目的算法设计与程

序的实现，并最终提交调试成功的源程序代码和实验报告。

实验安排：本实验属于开放性实验，要求每个学生独立地完成本实验项目。

三、任务实现及相关素材

（一）任务简介：区域分割包含三个子任务：语义分割、实例分割、全景分割。

语义分割：每个像素对应一个类标签，同一类会被定义成一个区域块，不区分其中单

个个体，但受限于定义的类数量，其中不使用的像素点会有指定的分类。

实例分割：每个对象的掩码和类标签。区分单个物体以及单个物体所属的类型，但受

限于能够识别的物体类型数量，无法识别的都作为背景（图上的黑色背景）。

全景分割：每像素类+实例标签。相当于在语义分割的基础上，增加单个实例的区分。

相对于语义分割和实例分割而言，任务更加困难。

（二）数据集简介：

1.CRAG(ColorectalAdenocarcinomaGland)这个数据集包含213幅20倍放大的肠道

结肠癌HE细胞块图像，每幅图像都进行了全实例级别的注释。这些数据在MILD-Net论

文中作为数据集使用，该论文发表在MedicalImageAnalysis期刊上。数据集被分为训练集

和测试集，训练集包含173幅图像，测试集包含40幅图像。

2.HRC_WHU(High-ResolutionCloudDetectionDataset)：这个数据集由武汉大学的

SENDIMAGE实验室创建，包含150张高分辨率云层验证数据图像，这些图像具有三个

RGB通道，分辨率从0.5到15米不等，覆盖了全球不同地区。图像主要包括五种主要的

地表类型，即水体、植被、城市、雪/冰和荒地。每张图像都配有由遥感图像解译领域的专

家手动标注的参考云层遮罩。

3.SWINySEG(SingaporeWholeskyNychthemeronImageSEGmentationDatabase)：这个

数据集包含6768张白天和夜晚的天空/云片段图像，以及它们对应的二值化地面真实地图。

所有图像都是在新加坡使用WAHRSIS（一种校准的地面全天空成像器）拍摄的，时间跨

度为2016年1月至12月。地面真实标注是在与新加坡气象服务专家协商后完成的。

4.VOC2012(ThePASCALVisualObjectClassesChallenge2012)是一个用于目标检测、

语义分割等任务的经典数据集。该数据集包含了20种类别的物体以及背景类别，其中包括

人、动物、车辆和家用物品等。

上述数据集可以从网上搜索下载。

（三）模型简介：

1.全连接卷积神经网络（Fullyconnectednetwork,FCN）模型是用深度神经网络来做

语义分割的奠基性工作，由Shelhamer,Long和Darrell等人在2015年提出,是第一个将全

卷积层用于区域分割任务的模型，相比当年其他主流网络，在PASCAL测试集上的相对性

能提高了20%，并极大减少了推理时间。FCN用转置卷积层来替换CNN最后的全连接层，

从而允许输入和输出具有不同尺寸的特性图,获得像素级别的语义分割预测。

2.U-Net是一种用于区域分割任务的深度神经网络，由Ronneberger、Fischer和Brox

等人于2015年提出，在语义分割领域具有重要的地位。U-Net采用全卷积网络结构，包括

编码器和解码器两个主要部分，其中编码器用于特征提取，解码器用于还原图像的分辨率。

U-Net在处理医学图像时表现出色。

（四）环境说明：

算法