基本信息
文件名称:基于多模态学习的文本生成壁画扩图方法研究.pdf
文件大小:13.38 MB
总页数:96 页
更新时间:2025-07-31
总字数:约15.54万字
文档摘要

摘要

敦煌壁画承载着悠久的历史,数百年来历史变迁中的自然和时间侵蚀,为传

统手工的壁画修复和获取方式带来了成本和技术的挑战。近年来,基于多模态学

习的文本生成图像技术通过结合计算机视觉和自然语言处理技术,可实现复杂细

节图像和语义丰富场景的精细表达,为敦煌壁画图像扩展提供了新的实现方法。

本文围绕多模态学习文本指令引导敦煌壁画的生成和扩展,基于StableDiffusion

模型构建了文本与敦煌壁画间的跨模态交互模型,主要研究工作如下:

(1)针对现有多模态学习模型在敦煌壁画图像场景扩展