面向计算机类本科生的计算机视觉”课程教学改革探索
引言
计算机视觉作为人工智能的重要分支,主要研究如何使机器能够感知、理解和处理视觉信息。近年来,随着深度学习的快速发展,计算机视觉技术在图像分类、目标检测、语义分割、三维重建等任务中取得了显著进展,被广泛应用于自动驾驶、医疗诊断、人脸识别、航天和工业制造等领域。[2]
笔者所在学院面向人工智能专业本科生开设了“计算机视觉专业主干课,共安排64学时,其中理论讲授48学时,实践16学时,旨在培养学生掌握基本的图像处理技术、计算机视觉算法,以及将理论应用于实际问题的能力。课程内容涵盖了图像的基本表示、特征提取与匹配、模型拟合、目标识别与检测,以及近年来兴起的深度学习模型在视觉任务中的应用。这些知识体系融合了统计学、信号处理、图像处理以及机器学习等多个学科的知识,构成了学生进人相关领域深造或从事相关工作的基础。
然而,计算机视觉作为前沿科学研究热点,其技术发展日新月异。深度学习,尤其是卷积神经网络、Transformers等架构,已成为计算机视觉领域的核心技术。随着大语言模型的兴起,跨模态融合、大规模预训练模型与微调成为新的研究热点。而目前教学内容缺乏对前沿技术的扩展,也缺少对跨学科教学场景的挖掘与应用。此外,课程内容往往更注重算法和理论,实践部分的比例较低,学生难以通过设计与编程深刻理解和掌握知识,在面对复杂工程问题时难以胜任。
计算机视觉课程教学改革方案
为了提升计算机视觉课程的教学效率,培养学生的创新能力和实践能力,进行课程教育教学改革已成为急需解决的课题。因此,本研究从教学内容、教学模式、实践环节与评价机制等方面探索改革路径,以期为计算机视觉课程的教育教学提供可参考的解决方案。
1.更新前沿技术,构建模块化课程体系
本课程依据计算机类本科生的知识结构和计算机视觉领域的发展,制订了如下教学内容。
(1)基础理论
重点讲授计算机视觉的基本原理,旨在为学生后续学习打下扎实的理论基础。首先是图像基础与图像处理,如图像的数字化表示(像素、分辨率、颜色空间)、灰度图与彩色图的差异、卷积操作与滤波、边缘检测、图像增强与变换(直方图均衡化、傅里叶变换)等。该模块是整个课程的起点,后续的算法设计和模型实现都依赖对图像基础的深刻理解。其次是传统特征与拟合,包括特征点检测(角点检测、斑点检测)、特征描述子、特征匹配方法估计几何关系。特征提取是目标跟踪与识别的基础。
(2)核心技术
介绍现代计算机视觉的主流算法和深度学习的应用方法,帮助学生掌握解决计算机视觉任务的关键技术。图像分类中介绍传统基于特征提取的分类(如词袋模型)和基于深度学习的方法。目标检测与语义分割中介绍Viola-Jones人脸检测、FasterR-CNN、YOLO、基于聚类的无监督分割算法、全卷积网络等。基础理论模块中的图像处理和几何估计为图像分类和目标检测提供了预处理和几何约束的理论支持。核心技术模块中的特定任务,如目标检测和语义分割,常为应用实践模块中的工业场景提供技术支撑。
(3)前沿内容
聚焦最新的研究动态,帮助学生了解计算机视觉的发展趋势和未来方向。例如,深度学习模型的最新进展,包括Transformers在视觉中的应用、迁移学习、自监学习、大规模预训练模型等;跨模态学习,如图像生成、图文匹配和描述生成;模型优化与部署,包括轻量化技术(模型剪枝、量化、知识蒸馏)和嵌入式部署;可解释性技术如可视化热图等。
以上每个模块相对独立,模块之间按照“从基础到核心,再到前沿与应用”的路径循序渐进,可定期调整前沿方向模块内容,引入最新技术和应用案例,保持课程的先进性。通过这种结构化的课程设计,学生可以逐步掌握计算机视觉的理论基础、技术核心和实际应用能力,为深入研究或工业实践做好充分准备。
表1本研究构建的典型分层任务
2.引入“分层任务驱动”,改革教学模式
本课程基于各模块知识点设计分级实践,通过任务驱动,培养学生解决实际问题的能力。
①基础任务旨在帮助学生熟悉计算机视觉基础理论和常用工具,掌握图像处理与基本模型实现。例如,使用OpenCV完成图像平滑、锐化、边缘检测,使用卷积神经网络实现手写数字分类。该类型任务以工具使用为主,强调概念的理解与实现。
②中级任务希望学生通过深度学习算法解决更复杂的计算机视觉问题,学会结合理论优化模型性能。例如,基于U-Net实现道路场景语义分割,优化模型的超参数与结构,提高分割精度。该类型任务注重算法的理解、实现、性能优化与结果分析。
③工程型任务通过模拟实际落地场景,培养学生解决复杂问题的能力,包括数据处理、算法设计、模型优化和部署。需综合运用多种技术和工具,强调全流程实践,贴近工程需求。
表1列举了本研究构建的典型分层任务,可以看到基础任务中对图像处理、特征提取等基本技术的掌握,为中级任务中