基本信息
文件名称:数据预处理设计算法思想.pdf
文件大小:191.2 KB
总页数:2 页
更新时间:2025-07-03
总字数:约1.93千字
文档摘要

1.数据预处理

Classdataset;//保存数据集,并包含对数据集基本操作的函数

1)训练数据,将数据保存至数组中

2)数据分为4列,第一列为时间time,第二列为ACK数据,第三列为所有数据包数量

all,第四列为tcp数据

3)由于数据属于连续属性,所有首先需要将数据进行离散化。离散化步骤如下:

a)初始化i=0

b)对第i列属性数据进行升序排序,这里采用快速排序方法进行。

c)一共N行数据,那么就有N-1种方法。从中点为第一个点,计