基本信息
文件名称:大模型自指:代码生成的递归式自我提升.pdf
文件大小:1.05 MB
总页数:8 页
更新时间:2025-09-10
总字数:约3.91千字
文档摘要
摘要近年来,人工智能系统的最新进展表明,通过“脚手架”(scaffolding)程序
对语言模型进行多次结构化调用,可以显著提升输出质量。本研究提出了一种
名为“自学优化器”(Self-TaughtOptimizer,STOP)的方法:利用语言模型
驱动的脚手架程序改进自身。在实验中,研究团队首先构建了一个“种子改进器”,
通过多次调用语言模型生成候选解并根据效用函数选取最佳方案;随后,该改进器递
归地应用于自身,从而在若干下游任务中展现出优于初始版本的表现。语言模型提出
并实现了多种自我改进策略,包括束搜索(beamsearch)、遗传算法(genetic
a