大模型自指：代码生成的递归式自我提升.docx

基本信息

文件名称：大模型自指：代码生成的递归式自我提升.docx

文件大小：225.11 KB

总页数：13 页

更新时间：2025-09-10

总字数：约3.41千字

文档摘要

ll摘要

近年来，人工智能系统的最新进展表明，通过“脚手架”（scaffolding）程序对语言模型进行多次结构化调用，可以显著提升输出质量。本研究提出了一种

名为“自学优化器”（Self-TaughtOptimizer，STOP）的方法：利用语言模型驱动的脚手架程序改进自身。在实验中，研究团队首先构建了一个“种子改进器”，通过多次调用语言模型生成候选解并根据效用函数选取最佳方案；随后，该改进器递归地应用于自身，从而在若干下游任务中展现出优于初始版本的表现。语言模型提出并实现了多种自我改进策略，包括束搜索（beamsearch）、遗传算