基于深度学习的人体行为识别研究.pdf - 创享文库

基本信息

文件名称：基于深度学习的人体行为识别研究.pdf

文件大小：3.25 MB

总页数：60 页

更新时间：2025-08-27

总字数：约9.41万字

文档摘要

摘要

视频理解作为计算机视觉领域的重要任务，旨在赋予计算机解析视频语义内

容的能力。而视频人体行为识别作为其中基础性的研究方向，在人机交互、智能

交通、医疗诊断等领域具有重要应用价值。该方向历经传统特征工程、卷积神经

网络架构到Transformer模型的演进，时空表征学习始终是其核心的研究课题。

尽管基于Transformer的长期时序建模显著提升了行为识别的性能，但现有方法

仍面临两大挑战：（1）视频数据标注需要逐帧定位行为片段，标注成本高昂，

且受隐私保护与罕见类别样本的