基本信息
文件名称:计算机视觉 第10章 计算机视觉应用.ppt
文件大小:33.92 MB
总页数:55 页
更新时间:2025-05-21
总字数:约7.37千字
文档摘要

YOLO目标检测YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法,YOLO将目标检测任务视为一个回归问题,直接从整个图像中预测boundingbox及其类别概率。YOLO的主要优势是速度快。YOLO目标检测YOLOv1:YouOnlyLookOnce:Unified,Real-TimeObjectDetection(CVPR2016)YOLO目标检测YOLOv1:YouOnlyLookOnce:Unified,Real-TimeObjectDetection(CVPR2016)原理:将输入图像分成S×S个格子,如果物体的中心落在某个格子中,那么这个格子就负责预测该物体。每个格子会预测B个边界框和它们的置信度,以及C个类别的概率。(1)给个一个输入图像,首先将图像划分成7*7的网格(2)对于每个网格,我们都预测2个边框(包括每个边框是目标的置信度以及每个边框区域在多个类别上的概率)(3)根据上一步可以预测出7*7*2个目标窗口,然后根据阈值去除可能性比较低的目标窗口,最后NMS去除冗余窗口即可YOLO目标检测YOLOv3:YOLOv3:AnIncrementalImprovement(arxiv2018,/pdf/1804.02767)YOLO目标检测YOLOv3:YOLOv3:AnIncrementalImprovement(arxiv2018,/pdf/1804.02767)YOLOv3损失函数如下YOLO目标检测YOLOv3:YOLOv3:AnIncrementalImprovement(arxiv2018,/pdf/1804.02767)对比方法mAP-50推理时间(毫秒)SSD32145.461DSSD32146.185R-FCN51.985SSD51350.4125DSSD51353.3156FPNFRCN59.1172RetinaNet-50-50050.973RetinaNet-101-50053.190RetinaNet-101-80057.5198YOLOv3-32051.522YOLOv3-41655.329YOLOv3-60857.951YOLO目标检测YOLOv3:YOLOv3:AnIncrementalImprovement(arxiv2018,/pdf/1804.02767)10、计算机视觉应用分类检测跟踪目标跟踪简介目标跟踪是利用一个视频或图像序列的上下文信息,对目标的外观运动信息进行建模,从而对目标运动状态进行预测并标定目标位置的一种技术。单目标跟踪:VisualObjectTracking(VOT)又被称为SOT(SingleObjectTracking),其跟踪给定的初始单个目标,然后在新的帧上找到和跟踪目标最匹配的区域,就为目标新的位置;多目标跟踪:MultipleObjectTracking(MOT)则是跟踪多个目标,相比于VOT,除了要找到跟踪的目标外,还要能够区分跟踪目标属于初始目标中的哪一个目标跟踪简介目标跟踪的难点形态变化?尺度变化?遮挡与消失图像模糊目标跟踪简介目标跟踪原理:检测器(ObjectDetector)+跟踪器(ObjectTrackor)Online跟踪:

只能使用当前帧及之前帧的信息来进行当前帧的跟踪。Offline跟踪:对每一帧的预测,都可以使用整个视频的信息,这样更容易获得一个全局最优解。目标跟踪单目标跟踪:VisualObjectTracking(VOT)目标跟踪多目标跟踪:MultipleObjectTracking(MOT)分离检测与特征提取的方法

(SeparateDetectionandEmbedding,SDE)联合检测与特征提取的方法

(JointDetectionandEmbedding,JDE)联合检测和跟踪的方法

(JointDetectionandTracking,JDT)目标跟踪多目标跟踪:MultipleObjectTracking(MOT)目标跟踪基于MeanShift的目标跟踪算法MeanShift跟踪算法基于MeanShift算法,通过分别计算目标区域和候选区域内像素的特征值概率得到关于目标模型和候选模型的描述,然后利用相似函数度量初始帧目标模型和当前帧的候选模版的相似性,选择使相似函数最大的候选模型并得到关于目标模型的M