基本信息
文件名称:大模型自指:代码生成的递归式自我提升.docx
文件大小:225.11 KB
总页数:13 页
更新时间:2025-09-10
总字数:约3.41千字
文档摘要
ll摘要
ll
近年来,人工智能系统的最新进展表明,通过“脚手架”(scaffolding)程序对语言模型进行多次结构化调用,可以显著提升输出质量。本研究提出了一种
名为“自学优化器”(Self-TaughtOptimizer,STOP)的方法:利用语言模型驱动的脚手架程序改进自身。在实验中,研究团队首先构建了一个“种子改进器”,通过多次调用语言模型生成候选解并根据效用函数选取最佳方案;随后,该改进器递归地应用于自身,从而在若干下游任务中展现出优于初始版本的表现。语言模型提出并实现了多种自我改进策略,包括束搜索(beamsearch)、遗传算