基本信息
文件名称:大语言模型:元学习PPT教学课件.ppt
文件大小:3.34 MB
总页数:43 页
更新时间:2025-11-13
总字数:约1.87万字
文档摘要

.在神经网络中,而且需要将完整的数据集在同样的神经网络中传递多次。使用的是有限的数据集,并且使用梯度下降来优化学习过程。因此仅使用一个Epoch更新一次是不够的,需要多次使用Epoch。随着使用Epoch次数增加,神经网络中的权重的更新次数也在增加,拟合曲线从欠拟合变为过拟合。对于选择多少次Epoch才是合适的问题,对于不同的数据集则不同。(2)Batch 当一个Epoch样本(也就是所有的训练样本)数量过于庞大时,需要将其分成多个小块,也就是分成多个Batch(批)。使用Batch_Size(批大小)表示每批样本的大小,训练一批就是一次迭代。 Batch数=训练集大小/Batch