基本信息
文件名称:基于Transformer的细粒度图像识别算法研究.pdf
文件大小:5.02 MB
总页数:70 页
更新时间:2025-09-26
总字数:约10.51万字
文档摘要
摘要
细粒度图像分类是计算机视觉研究的关键领域之一,具有重要的研究价值,其挑战
性在于处理的对象往往集中在同一领域,导致不同类别之间的数据特征极为相似。传统
的卷积神经网络特征提取方法,通常依赖于固定的卷积核大小和步长,这可能导致在提
取细粒度特征时缺乏足够的灵活性,且在全局信息提取上也存在明显的短板,使得分类
性能进一步提升受到了限制。因此,Transformer从一经问世就凭借其强大的全局建模能
力而备受关注,不仅进一步地提高了图像分类的准确率,还增强了模型的鲁棒性,使其
能够更好地应对各种复