基本信息
文件名称:数据仓库基础与Apache+Hive入门.pptx
文件大小:13.87 MB
总页数:82 页
更新时间:2025-10-27
总字数:约小于1千字
文档摘要
数据仓库基础与ApacheHive入门;CATALOGUE;01;数据仓库;数据仓库起源;;数据仓库主流开发;数据仓库应用场景;数据仓库与传统数据库区别;;数据仓库ETL流程解析;数据仓库建模方法论;索引优化;02;ApacheHive概述;;任务是读取HDFS中的sales表数据,将数据根据GROUPBY中的键进行映射和中间处理,输出的中间键值对为(USA,1000)和(USA,800),以及(China,1500)和(China,700)。;映射信息记录机制;SQL语法解析与编译;Hive执行计划解读;;;Hive执行引擎对比;;03;;Hadoop特性与优点;;Hadoop发