基本信息
文件名称:第17章 多模态大模型与生成式人工智能.pptx
文件大小:679.99 KB
总页数:31 页
更新时间:2025-08-04
总字数:约6.72千字
文档摘要
第17章多模态大模型与生成式人工智能
17.1多模态大模型
17.2生成式人工智能
17.3大模型与生成式AI应用、性能、问题与对策
17.4当前趋势及其他思路和范式;17.1多模态大模型
在大语言模型的基础上,构建兼有文本、视频、音频等多种模态信息的大型神经网络模型,称为多模态大语言模型(MultimodalLargeLanguageModel,MLLM),或多模态大模型(MLM)。
;多模态大模型的处理任务:
图文检索(Image-TextRetrieval)即图像到文本的检索和文本到图像