基本信息
文件名称:基于深度学习的人体行为识别研究.pdf
文件大小:3.25 MB
总页数:60 页
更新时间:2025-08-27
总字数:约9.41万字
文档摘要
摘要
视频理解作为计算机视觉领域的重要任务,旨在赋予计算机解析视频语义内
容的能力。而视频人体行为识别作为其中基础性的研究方向,在人机交互、智能
交通、医疗诊断等领域具有重要应用价值。该方向历经传统特征工程、卷积神经
网络架构到Transformer模型的演进,时空表征学习始终是其核心的研究课题。
尽管基于Transformer的长期时序建模显著提升了行为识别的性能,但现有方法
仍面临两大挑战:(1)视频数据标注需要逐帧定位行为片段,标注成本高昂,
且受隐私保护与罕见类别样本的