基本信息
文件名称:大数据技术导论 课件 第6章 大数据分析与挖掘.ppt
文件大小:14.63 MB
总页数:31 页
更新时间:2025-08-22
总字数:约3.25千字
文档摘要
图所示是一棵结构简单的决策树,用于预测贷款用户是否具有偿还贷款的能力。贷款用户主要具备是否拥有房产、是否结婚和平均月收入这三个属性。每一个内部节点都表示一个属性条件判断,叶子节点表示贷款用户是否具有偿还能力。KNN算法KNN算法也叫作K最近邻算法,是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。图显示了KNN算法的实现。图中绿色的点就是要预测的那个点,假设K=3,那么K