基于多模态学习的文本生成壁画扩图方法研究.pdf - 创享文库

基本信息

文件名称：基于多模态学习的文本生成壁画扩图方法研究.pdf

文件大小：13.38 MB

总页数：96 页

更新时间：2025-07-31

总字数：约15.54万字

文档摘要

摘要

敦煌壁画承载着悠久的历史，数百年来历史变迁中的自然和时间侵蚀，为传

统手工的壁画修复和获取方式带来了成本和技术的挑战。近年来，基于多模态学

习的文本生成图像技术通过结合计算机视觉和自然语言处理技术，可实现复杂细

节图像和语义丰富场景的精细表达，为敦煌壁画图像扩展提供了新的实现方法。

本文围绕多模态学习文本指令引导敦煌壁画的生成和扩展，基于StableDiffusion

模型构建了文本与敦煌壁画间的跨模态交互模型，主要研究工作如下：

（1）针对现有多模态学习模型在敦煌壁画图像场景扩展