基本信息
文件名称:李飞飞 -AI Agent:多模态交互前沿调查.pdf
文件大小:14.9 MB
总页数:82 页
更新时间:2026-04-03
总字数:约5.85万字
文档摘要
多模态AI系统很可能会在我们的日常生活中无处不在。将这些系统具身化为
物理和虚拟环境中的代理是一种有前途的方式,以使其更加互动化。目前,
这些系统利用现有的基础模型作为构建具身代理的基本构件。将代理嵌入这
样的环境中,有助于模型处理和解释视觉和上下文数据的能力,这是创建更
复杂且具备上下文感知的AI系统的关键。例如,一个能够感知用户动作、人
类行为、环境对象、音频表达以及场景整体情绪的系统,可以用于指导代理
在特定环境中的响应行为。
目录
1引言
1.1动机
1.2背景
1.3概述
2AgentAI集成7
2.1无限AI代理
2.2基于大型