基本信息
文件名称:2025年视觉Transformer预训练(含答案与解析).docx
文件大小:14.77 KB
总页数:10 页
更新时间:2025-09-08
总字数:约7.21千字
文档摘要
2025年视觉Transformer预训练(含答案与解析)
一、单选题(共15题)
1.以下哪个不是视觉Transformer预训练过程中常用的分布式训练框架?
A.PyTorchDistributed
B.TensorFlowDistribute
C.Horovod
D.Keras
2.在视觉Transformer预训练中,以下哪种方法主要用于解决梯度消失问题?
A.BatchNormalization
B.Dropout
C.LayerNormalization
D.WeightDecay
3.在视觉Transformer中,以下哪个操作有助于提高模型的