基本信息
文件名称:大数据分析及数据库操作知识要点测试卷.docx
文件大小:15.67 KB
总页数:8 页
更新时间:2025-08-23
总字数:约2.88千字
文档摘要
大数据分析及数据库操作知识要点测试试卷
在HDFS分布式文件系统中,NameNode节点将数据文件拆分成很多个小文件,将每个小文件在不同的DataNode节点中拷贝3份*
A、正确(正确答案)
B、错误
分布式计算框架MapReduce将计算过程分为input,Splitting,Mapping,Shuffling,Reducing和output这6个过程*
A、正确(正确答案)
B、错误
分布式大数据框架Hadoop适合一次性处理海量的小文件*
A、正确
B、错误(正确答案)
Spark相比于MapReduce的优势在于更快的运行速度、丰富的函数库,以及更快的开发速度