基本信息
文件名称:陶柯霏 :神经网络中的顿悟.pdf
文件大小:1.07 MB
总页数:17 页
更新时间:2026-02-03
总字数:约1.5万字
文档摘要
目录
1.历史
1.1顿悟的发现
2.相关基础知识
2.1神经网络的记忆(Memorization)与泛化(Generalization)
2.2神经网络中的涌现(EmergentAbilities)
2.3早停机制(EarlyStop)
3.顿悟的场景
3.1模运算
3.2其他算法任务
3.3非算法任务
3.4大语言模型
4.顿悟现象的可解释性分析
4.1结构化表征
4.2时钟和披萨算法
4.3控制权之争
4.4