基本信息
文件名称:基于Transformer的计算机视觉模型研究.pdf
文件大小:7.58 MB
总页数:69 页
更新时间:2026-04-03
总字数:约7.29万字
文档摘要
基于Transformer的计算机视觉模型研究
摘要
计算机视觉作为人工智能的重要分支,旨在让计算机模拟人类视觉系统,以理解
和解释视觉信息.这一领域的飞速发展得益于深度学习技术的驱动,该技术从最初的
感知机,卷积神经网络,到循环神经网络,长短期记忆网络和生成对抗网络,再到如今
的Transformer网络,逐步实现了自动学习和提取数据特征的功能.
尽管Transformer凭借全局建模优势在计算机视觉领域展现出强大潜力,但其在
图像和视