战略性新兴领域“十四五”高等教育系列教材
计算机视觉
配套课件
?人类视觉
?计算机视觉
?计算机视觉的发展
?经典计算机视觉理论
?计算机视觉的应用和挑战
?课程内容及要求
?人类约有80%的信息是通过视觉系统获取的
?人类视觉的生理基础:周围环境中的物体在可见光的
照射下,在人眼的视网膜上形成图像,由感光细胞转
换成神经脉冲信号,经神经纤维传入大脑皮层进行处
理与理解。
?电信号首先通过视神经传递到大脑的初级视觉皮层(V1区),位于枕叶。
?随后,这些信号被传递到次级视觉皮层(如V2、V3),在这些区域中,信
号被用来解析更复杂的图像属性。
?进一步的视觉信息传递到视觉联合区域,如V4和V5,分别处理更细致的颜
色和运动信息。
?大脑的颞叶和顶叶参与信息整合,颞叶处理面孔和物体识别,而顶叶处理空
间定位和物体运动。
?人类视觉
?计算机视觉
?机器视觉的发展
?经典机器视觉理论
?机器视觉的应用和挑战
?课程内容及要求
?计算机视觉是是一门致力于使计算机能够从图像或视频中“看”
和“理解”现实世界的科学。
?计算机视觉试图实现人类视觉的信息获取和处理的全过程,通
过对图像和视频的分析处理,实现类似人类视觉感知功能。
输入:图像(images)或视频(video)
输出:对象的恢复以及对对象信息的使用
图1-3计算机处理图像的基本过程
通过对图像和视频信号进行描述、存储、识别与理解,
感知三维环境中物体的几何信息,包括形状、位置、
姿态、运动等。
?视觉机理
?视觉信息获取(图像获取)
?采样、量化、表示
?视觉信息处理(图像处理)
?图像预处理、滤波、变换、分割、特征表示和检测
?视觉信息理解(图像理解)
?三维信息恢复和重建、运动信息提取
研究目标:使机器像人那样,通过视觉观察和理解世
界,具有自主适应环境的能力。
?人类视觉
?计算机视觉
?计算机视觉的发展
?经典机器视觉理论
?机器视觉的应用和挑战
?课程内容及要求
?启蒙阶段(1960s-1980s):
计算机视觉基础理论探索与建立的阶段
?LarryRoberts的博士论文标志性地提出了从二维图像中提取
三维形状的方法。
?重构主义阶段(1980s-2000s):
传统计算机视觉算法快速发展的阶段
?建立专家系统来存储先验知识,然后与实际项目中提取的特
征进行规则匹配。开创了以理解三维场景为目的的三维视觉
研究
?DavidG.Lowe提出了基于知识的视觉(Knowledge-based
Vision)的概念
?ChrisHarris和MikeStephens提出Harris角点检测算法
?DavidLowe在1999年提出的SIFT(尺度不变特征变换)算
法
?分类主义阶段(2000s-2010s):
计算机视觉技术的成熟与应用探索阶段
?一系列关键技术的成熟以及新应用的探索
?PaulViola和MichaelJones提出的Viola-Jones人脸检测算法成为
了第一个能够在实时环境中进行人脸检测的算法
?支持向量机(SVM)和随机森林等机器学习算法
?特征提取技术如HOG(方向梯度直方图)和LBP(局部二值模式)
?大数据、大模型和大算力阶段(2010s-至今):
大数据和大算力支撑下的深度学习技术迅猛发展并出现大模
型的阶段
?随着计算机运算能力的指数级增长和ImageNet、PASCAL等超大
型图片数据库的出现,深度学习技术带领计算机视觉开启了一个
新阶段
?FasterR-CNN、YOLO、GAN
?BERT、GPT等大型预训练模型的适配和优化,如OpenAI提出的
CLIP模型[17],展示了跨模态学习的巨大潜力。
?人类视觉
?计算机视觉
?计算机视觉的发展
?经典机器视觉理论
?机器视觉的应用和挑战
?课程内容及要求
?DavidMarr(1945-1980)是英国心理学家。
他将心理学、人工智能和神经生理学的结
果结合起来,对视觉的研究做出了重要贡
献。他是计算视觉的奠基人。
?1982年马尔(DavidMarr)《视觉》一书
的问世,首次提出了视觉计算理论,是第
一个系统的计算机视觉理论框架。
Marr将计算视觉分为三个层次:计算理论、表达与算