基本信息
文件名称:大数据分析方法及应用——基于Python实现 课后习题及答案 -第1--5章.docx
文件大小:382.62 KB
总页数:77 页
更新时间:2025-08-12
总字数:约3.88万字
文档摘要
1.6习题
请简述大数据的概念。
答:数据是指那些无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。它具有海量、高增长和多样化的特点,需要采用新的处理模式才能充分发挥其决策支持、洞察发现和流程优化的潜力。值得注意的是,大数据并非单一技术,而是一个概念和技术圈,涵盖了数据采集、存储、处理、分析和应用等各个环节。
大数据的五个“V”分别指的是什么?
答:数据量大(Volume)、种类繁多(Variety)、生成快速(Velocity)、来源真实(Veracity)和数据价值(Value)。
请简述在大数据分析过程中,如何进行数据预处理?
答:预处理主要包括数据清洗(DataCle