大模型自指：代码生成的递归式自我提升.pdf - 创享文库

基本信息

文件名称：大模型自指：代码生成的递归式自我提升.pdf

文件大小：1.05 MB

总页数：8 页

更新时间：2025-09-10

总字数：约3.91千字

文档摘要

摘要近年来，人工智能系统的最新进展表明，通过“脚手架”（scaffolding）程序

对语言模型进行多次结构化调用，可以显著提升输出质量。本研究提出了一种

名为“自学优化器”（Self-TaughtOptimizer，STOP）的方法：利用语言模型

驱动的脚手架程序改进自身。在实验中，研究团队首先构建了一个“种子改进器”，

通过多次调用语言模型生成候选解并根据效用函数选取最佳方案；随后，该改进器递

归地应用于自身，从而在若干下游任务中展现出优于初始版本的表现。语言模型提出

并实现了多种自我改进策略，包括束搜索（beamsearch）、遗传算法（genetic

a