基本信息
文件名称:基于Transformer的计算机视觉模型研究.pdf
文件大小:7.58 MB
总页数:69 页
更新时间:2026-04-03
总字数:约7.29万字
文档摘要

基于Transformer的计算机视觉模型研究

摘要

计算机视觉作为人工智能的重要分支,旨在让计算机模拟人类视觉系统,以理解

和解释视觉信息.这一领域的飞速发展得益于深度学习技术的驱动,该技术从最初的

感知机,卷积神经网络,到循环神经网络,长短期记忆网络和生成对抗网络,再到如今

的Transformer网络,逐步实现了自动学习和提取数据特征的功能.

尽管Transformer凭借全局建模优势在计算机视觉领域展现出强大潜力,但其在

图像和视