基本信息
文件名称:深度学习与强化学习:马尔可夫决策过程详解.docx
文件大小:32.92 KB
总页数:22 页
更新时间:2025-08-23
总字数:约1.99万字
文档摘要
PAGE1
PAGE1
深度学习与强化学习:马尔可夫决策过程详解
1深度学习基础
1.1神经网络基础
在深度学习中,神经网络是模仿人脑神经元结构的计算模型,由大量的节点(或称为神经元)组成,这些节点通过连接权重相互连接,形成多层结构。神经网络可以处理复杂的输入输出映射,是深度学习的核心组件。
1.1.1神经元
神经元是神经网络的基本单元,它接收输入信号,通过激活函数处理后,产生输出信号。一个神经元的数学模型可以表示为:
y
其中,x1,x2,..
1.1.2激活函数
激活函数用于引入非线性,使得神经网络能够学习和表示复杂的函数。常见的激活函数有ReLU、Sigmoid和