基本信息
文件名称:数据预处理设计算法思想.pdf
文件大小:191.2 KB
总页数:2 页
更新时间:2025-07-03
总字数:约1.93千字
文档摘要
1.数据预处理
Classdataset;//保存数据集,并包含对数据集基本操作的函数
1)训练数据,将数据保存至数组中
2)数据分为4列,第一列为时间time,第二列为ACK数据,第三列为所有数据包数量
all,第四列为tcp数据
3)由于数据属于连续属性,所有首先需要将数据进行离散化。离散化步骤如下:
a)初始化i=0
b)对第i列属性数据进行升序排序,这里采用快速排序方法进行。
c)一共N行数据,那么就有N-1种方法。从中点为第一个点,计