基本信息
文件名称:Python财务数据分析与应用(微课版)课件 09-3数据分析与机器学习.pptx
文件大小:4.06 MB
总页数:37 页
更新时间:2025-05-31
总字数:约5.17千字
文档摘要

基于机器学习的财务应用9-3DataAnalysisandMachineLearning

内容概述

本节学习目标财务数据分析财务数据分析(1)理解人工智能的概念和研究范畴;(4)利用简单的机器学习的算法进行财务数据分析。(2)了解机器学习的概念和方法;(3)掌握简单的机器学习的算法,及Python编程;

目录CONTENTS财务数据分析财务数据分析9.3基于机器学习的财务应用1人工智能2机器学习3sklearn 【Python财务数据分析】——基于上市公司年报财务指标的机器学习财务应用

人工智能PartOne01财务数据分析财务数据分析

财务数据分析财务数据分析人工智能概述20世纪50年代,图灵首次提出了“机器思维”的概念。他提出了一项测试,以确定计算机能否进行“思考”:如果一台计算机的行为、反应和互动像一个有意识的个体,那么它应该被视为有意识的,即提出了“机器能思维”的观点。人工智能(ArtificialIntelligence,AI)是由申农(ClaudeShannon)等在1956年一次会议上被提出来的。一般认为人工智能是任何类似于人的智能或高于人的智能的机器或算法统称。

财务数据分析财务数据分析人工智能学派1)符号主义符号主义(symbolicism)的观点:人工智能起源于数理逻辑,人类认知的基元是符号,认知过程是符号表示上的一种运算。基于知识的问题求解

财务数据分析财务数据分析人工智能学派2)连接主义连接主义(connectionism)的观点:人工智能起源于仿生学,特别是人脑模型,人类认知的基元是神经元,认知过程是神经元的联结活动过程。playground可视化神经网络

财务数据分析财务数据分析人工智能学派3)行为主义学派行为主义(actionism)的观点:人工智能起源于控制论,智能取决于感知和行为,是对外界复杂环境的适应,而不是推理。以自动驾驶汽车为例,它在行驶过程中,不断接收来自摄像头、激光雷达和其他传感器的数据。当遇到行人突然出现在道路上时,汽车会立即根据这些实时的感知信息采取刹车动作。这个决策不是基于预先编写的固定程序,而是基于对环境的实时感知和过去在类似情况下的学习经验(通过大量的模拟训练或实际道路测试积累),以实现安全、高效的驾驶行为。

机器学习PartTwo02财务数据分析财务数据分析

财务数据分析财务数据分析机器学习概念符号主义需要基于人类认知的规则,连接主义基于数据处理的物理模型假设空间,而行为主义需要行为结果与行为环境的交互。这些人工智能领域,本质都是数据到知识的映射。从原始数据中获取有用知识的能力被称为机器学习(machinelearning)。机器学习与人类思维的对比

财务数据分析财务数据分析数据、信息和知识1)数据数据泛指对客观事物的数量、属性、位置及其相互关系的抽象表示,以适合用人工或自然的方式进行保存、传递和处理。数据是知识阶层中最底层也是最基础的一个概念,是形成信息、知识和智能的源泉,是机器学习“原料”。换句话说,机器模型需要数据“喂养”,才能“成熟”。

财务数据分析财务数据分析数据、信息和知识3)知识数据是信息的载体,本身无确切含义。知识可以理解为信息与信息之间的关联。通过对信息使用归纳、演绎的方法得到知识。在表中9-1,我们发现:样本的特征“所有者权益”与特征“资产”和“负债”存在这种关联关系:如果“资产”和“负债”两个特征的值,就可以得到特征“所有者权益”值。这种关联关系就是知识。

财务数据分析财务数据分析数据、信息和知识

财务数据分析财务数据分析机器学习过程

财务数据分析财务数据分析机器学习过程1)机器学习前提机器之所以能够学习,是有数学原理支持的。简单地说,就是数学证明通过大量描述事物的数据,可以发现其中的规律。我们把要发现的规律视为一种假设:“未知的目标函数假设”,即机器学习的假设前提。通过事物的描述(X),存在一个理想化的映射(f):XY。X是已知样本的样本空间,Y是样本的一个新特征空间。这个假设的存在是我们机器学习的前提。

财务数据分析财务数据分析机器学习过程2)获取数据有了(1)的前提,我们需要首先要得到尽可能多且全面的事物描述数据(X),以及通过经验或过去的事实了解已知事物的特征(Y)的值,即数据集D:(X,Y)。X为目标函数(g)的左侧特征值,Y为目标函数映射的特征向量。Y的值获取具有多种途径,因此演化多种机器学习的方法,如有监督机器学习,无监督机器学习,强化学习,自学习等

财务数据分析财务数据分析机器学习过程3)数据预处理数据在学习之前,要满足学习算法的要求,如数据变换、数据标准化等。这里我们只讨论数据拆分这一步骤。通常会把数据分成2部分(有时也分为3部分,训练集、测试集和验证集),即训练集(training