基本信息
文件名称:聚类-DTW伪代码妈妈杯大数据数学建模.pdf
文件大小:2.02 MB
总页数:49 页
更新时间:2025-10-18
总字数:约5.46万字
文档摘要

学校代码:10264

研究生学号:M180711101

上海海洋大学

硕士学位论文

题目:基于热点区域模体挖掘的台风路径分类方法研究

Researchontyphoonpathclassification

英文题目:methodbasedonhotspotregionmotifmining

专业:计算机技术

研究方向:数据挖掘

姓名:许强

指导教师:苏诚教授

二O二一年五月

上海海洋大学硕士学位论文

上海海洋大学硕士学位论文

答辩委员会成员名单

姓名工作单位职称备注

刘国华东华大学教授主席

宋巍上海海洋大学教授委员

张明华上海海洋大学副教授委员

魏立斐上海海洋大学副教授委员

赵丹枫上海海洋大学讲师秘书

答辩地点信息学院答辩日期2021.5.18

上海海洋大学硕士学位论文

基于热点区域模体挖掘的台风路径分类方法研究

摘要

台风(TropicalCyclone)是最具破坏性的自然灾害之一,每年给人类社会

带来巨大的灾难。台风领域的大数据挖掘技术在学者们不断的研究中逐渐兴

起。以聚类为代表的机器学习方法因其简单易用、计算便捷的优势,有效推动

了台风领域的进一步发展。在台风领域的研究中,台风路径是分析台风特征的

重要途径,同时也是判断台风影响区域和范围的重要方法。近年来,台风路径

聚类在海洋防灾减灾等涉海领域引起了广泛的关注。由于台风路径是一种时

间序列数据,许多学者利用时间序列聚类方法对历史台风路径数据进行聚类,

并进一步对聚类后的台风路径簇进行统计分析、挖掘规律。传统的时间序列聚

类方法的精度有限且存在随机性问题,无法更好地满足台风灾害预警业务化

的需求。

为此,本文提出一种改进后的聚类算法和模体挖掘算法,对1949-2018年

西北太平洋的台风最佳路径数据展开研究,主要研究内容如下:

(1)传统台风路径分类研究方法,如主观识别和K-means聚类等方法。

这些方法存在传统聚类算法原理所产生的随机性问题,依赖人工经验设置模

型参数的智能化问题,以及针对特定台风研究而导致不具有普遍性的局限性

问题。本文针对传统分类存在的问题,提出了一种提出基于密度质心的混合聚

类算法,以地理位置的分布密度为划分标准,对台风生成点和登陆点的地理位

置分布情况进行聚类,得到了若干个热点区域。这有效减少了传统聚类方法的

随机性,并有效地提高了聚类算法的实用性;

(2