计算机视觉配套课件.ppt

基本信息

文件名称：计算机视觉配套课件.ppt

文件大小：71.81 MB

总页数：453 页

更新时间：2025-05-21

总字数：约8.78万字

文档摘要

战略性新兴领域“十四五”高等教育系列教材

计算机视觉

配套课件

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典计算机视觉理论

?计算机视觉的应用和挑战

?课程内容及要求

?人类约有80%的信息是通过视觉系统获取的

?人类视觉的生理基础：周围环境中的物体在可见光的

照射下，在人眼的视网膜上形成图像，由感光细胞转

换成神经脉冲信号，经神经纤维传入大脑皮层进行处

理与理解。

?电信号首先通过视神经传递到大脑的初级视觉皮层（V1区），位于枕叶。

?随后，这些信号被传递到次级视觉皮层（如V2、V3），在这些区域中，信

号被用来解析更复杂的图像属性。

?进一步的视觉信息传递到视觉联合区域，如V4和V5，分别处理更细致的颜

色和运动信息。

?大脑的颞叶和顶叶参与信息整合，颞叶处理面孔和物体识别，而顶叶处理空

间定位和物体运动。

?人类视觉

?计算机视觉

?机器视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?计算机视觉是是一门致力于使计算机能够从图像或视频中“看”

和“理解”现实世界的科学。

?计算机视觉试图实现人类视觉的信息获取和处理的全过程，通

过对图像和视频的分析处理，实现类似人类视觉感知功能。

输入：图像（images）或视频（video）

输出：对象的恢复以及对对象信息的使用

图1-3计算机处理图像的基本过程

通过对图像和视频信号进行描述、存储、识别与理解，

感知三维环境中物体的几何信息，包括形状、位置、

姿态、运动等。

?视觉机理

?视觉信息获取（图像获取）

?采样、量化、表示

?视觉信息处理（图像处理）

?图像预处理、滤波、变换、分割、特征表示和检测

?视觉信息理解（图像理解）

?三维信息恢复和重建、运动信息提取

研究目标：使机器像人那样，通过视觉观察和理解世

界，具有自主适应环境的能力。

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?启蒙阶段（1960s-1980s）：

计算机视觉基础理论探索与建立的阶段

?LarryRoberts的博士论文标志性地提出了从二维图像中提取

三维形状的方法。

?重构主义阶段（1980s-2000s）：

传统计算机视觉算法快速发展的阶段

?建立专家系统来存储先验知识，然后与实际项目中提取的特

征进行规则匹配。开创了以理解三维场景为目的的三维视觉

研究

?DavidG.Lowe提出了基于知识的视觉(Knowledge-based

Vision)的概念

?ChrisHarris和MikeStephens提出Harris角点检测算法

?DavidLowe在1999年提出的SIFT（尺度不变特征变换）算

法

?分类主义阶段（2000s-2010s）：

计算机视觉技术的成熟与应用探索阶段

?一系列关键技术的成熟以及新应用的探索

?PaulViola和MichaelJones提出的Viola-Jones人脸检测算法成为

了第一个能够在实时环境中进行人脸检测的算法

?支持向量机（SVM）和随机森林等机器学习算法

?特征提取技术如HOG（方向梯度直方图）和LBP（局部二值模式）

?大数据、大模型和大算力阶段（2010s-至今）：

大数据和大算力支撑下的深度学习技术迅猛发展并出现大模

型的阶段

?随着计算机运算能力的指数级增长和ImageNet、PASCAL等超大

型图片数据库的出现，深度学习技术带领计算机视觉开启了一个

新阶段

?FasterR-CNN、YOLO、GAN

?BERT、GPT等大型预训练模型的适配和优化，如OpenAI提出的

CLIP模型[17]，展示了跨模态学习的巨大潜力。

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?DavidMarr(1945-1980)是英国心理学家。

他将心理学、人工智能和神经生理学的结

果结合起来，对视觉的研究做出了重要贡

献。他是计算视觉的奠基人。

?1982年马尔(DavidMarr)《视觉》一书

的问世，首次提出了视觉计算理论，是第

一个系统的计算机视觉理论框架。

Marr将计算视觉分为三个层次：计算理论、表达与算