基本信息
文件名称:动态批处理策略与显存碎片整理算法.docx
文件大小:70.08 KB
总页数:28 页
更新时间:2026-01-05
总字数:约2.29万字
文档摘要
PAGE
PAGE1
《动态批处理策略与显存碎片整理算法》
使用说明
本指导仅作为写作思路参考,具体根据实际写作类型及内容进行调整。
可根据具体研究内容调整各章节的详略程度。
带”*“标记的章节可根据研究需要选择性保留。
课题分析与写作指导
本课题《动态批处理策略与显存碎片整理算法》聚焦于高性能计算与人工智能交叉领域,特别是针对深度学习模型推理场景中的资源利用率瓶颈问题。随着大语言模型(LLM)和生成式AI应用的爆发式增长,GPU显存带宽和计算资源的利用率成为了制约系统吞吐量的关键因素。传统的静态批处理方法往往难以应对请求长度和计算需求的剧烈波动,导致显存浪费和计算碎片化。本研究旨