基本信息
文件名称:大数据分析与挖掘课件:大数据挖掘-聚类算法.pptx
文件大小:1.98 MB
总页数:37 页
更新时间:2026-01-16
总字数:约4.13千字
文档摘要

大数据分析与挖掘——大数据挖掘-聚类算法——

Part1.聚类算法简介

聚类(Clustering)“物以类聚,人以群分”是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息

聚类(Clustering)聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(Subset),这样让在同一个子集中的成员对象都有相似的一些属性其他分析算法的一个预处理步骤在这一过程中没有监督,因此是一种无监督的分类

聚类与分类聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数