基本信息
文件名称:大数据技术与应用 习题及答案 第7章 习题答案.doc
文件大小:26 KB
总页数:3 页
更新时间:2026-03-30
总字数:约2.81千字
文档摘要

第7章习题答案

1.Hive中的内部表和外部表有什么区别?

答案

内部表(ManagedTable)

数据所有权:创建一个内部表时,Hive会将数据移动到其自身的仓库目录下(通常是/user/hive/warehouse/),这意味着Hive对这些数据拥有完全的控制权。

生命周期管理:如果删除了一个内部表,不仅表的元数据会被删除,实际存储的数据也会从HDFS中移除。

使用场景:希望Hive完全负责数据的生命周期管理时使用,适用于那些只在Hive中使用的数据。

外部表(ExternalTable)

数据所有权:外部表允许指定数据的位置,数据可以存储在任何HDFS位置。Hive不会将数据移