基本信息
文件名称:数据挖掘原理、算法与应用 (Python语言描述)【第十二章】聚类.pptx
文件大小:1.27 MB
总页数:91 页
更新时间:2025-12-12
总字数:约1.95万字
文档摘要
第十二章聚类数据挖掘原理、算法与应用(Python语言描述)
聚类的定义聚类是典型的无监督学习方法,?聚类将数据集中相似的样本分到一组,每个组称为一个簇,相同簇的样本之间相似度较高,不同簇的样本之间相似度较低,样本之间的相似度通常是通过距离定义的,距离越远,相似度越低。
聚类与分类的区别不同于分类,分类是有监督学习,样本带有标签,分类模型重点考查的是模型的泛化能力;而聚类是按要求给样本加标签,重点考查模型聚类的效果,通常不需进行训练集与测试集的划分。
聚类的应用聚类广泛应用于社会的各个领域。如根据客户的消费记录将客户分成不同的消费群体;根据学生的不同行为习惯,将学生聚类,以便因材施教;根据全球