基本信息
文件名称:GeoAware-VLA: 隐式几何感知的视觉-语言-动作模型.pdf
文件大小:4.81 MB
总页数:9 页
更新时间:2026-02-13
总字数:约3.1万字
文档摘要

GeoAware-VLA:隐式几何感知的视觉-语言-动作模型

AliAbouzeid,MalakMansour,ZezhouSun,DezhenSong

Abstract—视觉-语言-动作(VLA)模型通常难以推广到TrainingViewTestingView