基本信息
文件名称:计算机视觉 配套课件.ppt
文件大小:71.81 MB
总页数:453 页
更新时间:2025-05-21
总字数:约8.78万字
文档摘要

战略性新兴领域“十四五”高等教育系列教材

计算机视觉

配套课件

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典计算机视觉理论

?计算机视觉的应用和挑战

?课程内容及要求

?人类约有80%的信息是通过视觉系统获取的

?人类视觉的生理基础:周围环境中的物体在可见光的

照射下,在人眼的视网膜上形成图像,由感光细胞转

换成神经脉冲信号,经神经纤维传入大脑皮层进行处

理与理解。

?电信号首先通过视神经传递到大脑的初级视觉皮层(V1区),位于枕叶。

?随后,这些信号被传递到次级视觉皮层(如V2、V3),在这些区域中,信

号被用来解析更复杂的图像属性。

?进一步的视觉信息传递到视觉联合区域,如V4和V5,分别处理更细致的颜

色和运动信息。

?大脑的颞叶和顶叶参与信息整合,颞叶处理面孔和物体识别,而顶叶处理空

间定位和物体运动。

?人类视觉

?计算机视觉

?机器视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?计算机视觉是是一门致力于使计算机能够从图像或视频中“看”

和“理解”现实世界的科学。

?计算机视觉试图实现人类视觉的信息获取和处理的全过程,通

过对图像和视频的分析处理,实现类似人类视觉感知功能。

输入:图像(images)或视频(video)

输出:对象的恢复以及对对象信息的使用

图1-3计算机处理图像的基本过程

通过对图像和视频信号进行描述、存储、识别与理解,

感知三维环境中物体的几何信息,包括形状、位置、

姿态、运动等。

?视觉机理

?视觉信息获取(图像获取)

?采样、量化、表示

?视觉信息处理(图像处理)

?图像预处理、滤波、变换、分割、特征表示和检测

?视觉信息理解(图像理解)

?三维信息恢复和重建、运动信息提取

研究目标:使机器像人那样,通过视觉观察和理解世

界,具有自主适应环境的能力。

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?启蒙阶段(1960s-1980s):

计算机视觉基础理论探索与建立的阶段

?LarryRoberts的博士论文标志性地提出了从二维图像中提取

三维形状的方法。

?重构主义阶段(1980s-2000s):

传统计算机视觉算法快速发展的阶段

?建立专家系统来存储先验知识,然后与实际项目中提取的特

征进行规则匹配。开创了以理解三维场景为目的的三维视觉

研究

?DavidG.Lowe提出了基于知识的视觉(Knowledge-based

Vision)的概念

?ChrisHarris和MikeStephens提出Harris角点检测算法

?DavidLowe在1999年提出的SIFT(尺度不变特征变换)算

?分类主义阶段(2000s-2010s):

计算机视觉技术的成熟与应用探索阶段

?一系列关键技术的成熟以及新应用的探索

?PaulViola和MichaelJones提出的Viola-Jones人脸检测算法成为

了第一个能够在实时环境中进行人脸检测的算法

?支持向量机(SVM)和随机森林等机器学习算法

?特征提取技术如HOG(方向梯度直方图)和LBP(局部二值模式)

?大数据、大模型和大算力阶段(2010s-至今):

大数据和大算力支撑下的深度学习技术迅猛发展并出现大模

型的阶段

?随着计算机运算能力的指数级增长和ImageNet、PASCAL等超大

型图片数据库的出现,深度学习技术带领计算机视觉开启了一个

新阶段

?FasterR-CNN、YOLO、GAN

?BERT、GPT等大型预训练模型的适配和优化,如OpenAI提出的

CLIP模型[17],展示了跨模态学习的巨大潜力。

?人类视觉

?计算机视觉

?计算机视觉的发展

?经典机器视觉理论

?机器视觉的应用和挑战

?课程内容及要求

?DavidMarr(1945-1980)是英国心理学家。

他将心理学、人工智能和神经生理学的结

果结合起来,对视觉的研究做出了重要贡

献。他是计算视觉的奠基人。

?1982年马尔(DavidMarr)《视觉》一书

的问世,首次提出了视觉计算理论,是第

一个系统的计算机视觉理论框架。

Marr将计算视觉分为三个层次:计算理论、表达与算