课题分析二手房数据
课时2课时(90min)
知识目标:
(1)熟悉数据仓库分层设计的方法
(2)掌握Hive数据定义的相关知识
(3)掌握Hive数据导入与导出的相关知识
(4)掌握Hive数据查询的相关知识
(5)掌握Hive函数的相关知识
教学目标
(6)掌握Hive性能优化的相关知识
技能目标:
(1)能够使用数据仓库与Hive的相关知识独立构建二手房数据仓库,并查询和分析二手房数据
(2)能够举一反三,参照二手房数据的分析过程分析其他数据
素养目标:
懂得团结合作能让工作事半功倍的道理
教学重点:使用数据仓库与Hive的相关知识构建二手房数据仓库,并查询和分析二手房数据
教学重难点
教学难点:举一反三,参照二手房数据的分析过程分析其他数据
教学方法案例分析法、问答法、讨论法、讲授法
教学用具电脑、投影仪、多媒体课件、教材
教学过主要教学内容及步骤
【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课
前任务
课前任务
请大家了解Hive数据仓库技术的应用案例。
【学生】完成课前任务
【教师】使用APP进行签到
考勤
【学生】班干部报请假人员及原因
【教师】提出以下问题:
问题导入设计数据仓库的第一步应做什么?
【学生】思考、举手回答
【教师】通过学生的回答引入要讲的知识,介绍设计二手房数据仓库、定义二手房数据仓库的存储结
构、向二手房数据仓库中导入数据、查询并分析二手房数据、导出二手房数据的相关知识
8.1设计二手房数据仓库
?【教师】利用多媒体展示“二手房数据文件‘house.txt’的部分内容”图片(详见教材),并
进行讲解
二手房数据文件“house.txt”中包含区、地铁站、户型、面积(单位:平方米)、楼层、房屋总价
传授新知
(单位:万元)、房屋单价(单位:元/平方米)和是否近地铁等信息,如图所示。
8.1.1需求分析
为了从不同角度分析北京市二手房的市场行情,二手房信息网站需要构建一个二手房数据仓库。使
用该数据仓库,二手房信息网站可以结合不同的用户需求查询和统计以下二手房数据,并对查询和统计
1
的结果进行分析,从而为用户提供二手房的信息,并帮助用户挑选合适的房源。
(1)统计北京市内各区二手房的平均房价和在售数量。
(2)查询北京市某区内二手房平均房价排名前3的房屋户型。
(3)查询北京市某区内二手房在售数量排名前3的房屋户型。
(4)统计北京市某区内不同面积二手房的平均房价。
(5)统计北京市某区内不同面积二手房的在售数量。
(6)查询北京市某区内二手房平均房价最高的房屋楼层。
(7)查询北京市某区内二手房在售数量最多的房屋楼层。
(8)查询北京市某区内近地铁和非近地铁二手房的平均房价。
(9)查