基本信息
文件名称:大数据导论(第2版)-第8章-数据处理与分析.ppt
文件大小:2.31 MB
总页数:128 页
更新时间:2026-03-13
总字数:约2.54万字
文档摘要

8.6.4基于内存的分布式计算框架Spark2014年6月1日Shark项目和SparkSQL项目的主持人ReynoldXin宣布:停止对Shark的开发,团队将所有资源放在SparkSQL项目上,至此,Shark的发展画上了句号,但也因此发展出两个分支:SparkSQL和HiveonSparkSparkSQL作为Spark生态的一员继续发展,而不再受限于Hive,只是兼容HiveHiveonSpark是一个Hive的发展计划,该计划将Spark作为Hive的底层引擎之一,也就是说,Hive将不再受限于一个引擎,可以采用Map-Reduce、Tez、Spark等引擎