基本信息
文件名称:不同距离度量对kmedian算法的影响.pdf
文件大小:2.16 MB
总页数:14 页
更新时间:2026-01-12
总字数:约9.9千字
文档摘要
摘要:在大数据分析中,聚类算法作为一种十分有效的手段,在大数据的聚类中有着广泛的实际
应用。Kmedian算法作为常用的聚类算法,距离度量的选取对其运行结果有着极其重大的影响。本文
着重于选择不同的距离度量对k-median算法进行改进,分别使用了欧几里得距离,切比雪夫距离,
曼哈顿距离,夹角余弦距离,闵可夫斯基距离,标准欧氏距离,Pearson距离,Spearman距离。收集
了十三组数据,对这些数据进行MATLAB环境下的运行。最后根据评价指标NMI,Accuracy,ARI进行
比较,根据的到的外部评价指标判断K-median算法使用哪一种距离度量得到的