基本信息
文件名称:大数据技术与应用 课件 第4章大数据采集与预处理.pptx
文件大小:784.97 KB
总页数:40 页
更新时间:2026-03-30
总字数:约2.92千字
文档摘要
大数据技术与应用;第4章大数据采集与预处理;学习导读与目标
?本章旨在引导读者掌握大数据采集与预处理的核心概念和技术,为后续数据分析打下坚实基础。
?本章核心内容:大数据采集方法、数据清洗与转换技术、数据存储策略
?学习目标:了解采集来源与技术、掌握预处理方法、熟悉存储管理策略;;目录;4.1数据;4.1.1数据是什么?;4.1.2数据分类;;4.2数据采集;4.2.1数据采集概述;不同类型的数据来源;;;4.3日志采集组件Flume;Flume是Cloudera提供的一个高可用的、高可靠的、分布式的、用于海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制