26-Hadoop大数据处理技术-0615003032.pdf

基本信息

文件名称：26-Hadoop大数据处理技术-0615003032.pdf

文件大小：483.68 KB

总页数：11 页

更新时间：2025-09-18

总字数：约9.36千字

文档摘要

Hadoop大数据处理技术

教学大纲

院（系/部）：计算机科学与技术学院

教研室：网络工程

日期：2023.06

Hadoop大数据处理技术课程教学大纲

课程英文名称：HadoopBigDataProcessing课程编码：0615003032

总学分/总学时：3/48理论学时/实验学时：48/0

课程性质：专业拓展课先修课程：Java程序设计语言、数据库

系统原理

课程负责人：陈姝颖适用专业：网络工程

开课单位：计算机科学与技术学院大纲制定者：陈姝颖

大纲审定者：程大鹏大纲审定时间：2023.06

本大纲适用2023年版网络工程专业人才培养方案

一、课程简介

随着互联网、移动互联网和物联网的发展，人类社会产生的数据正呈爆炸式增长,我

们已经迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容

进行抓取、管理和处理的数据集合，对大数据的分析已经成为一个非常重要且紧迫的需求。

Hadoop是目前应用最成功也是最广泛的批处理平台，国内外的企业和机构的数据处理系

统纷纷向Hadoop处理平台过渡和转型，Hadoop已经成为大数据处理的工业标准。本课程

的开设为高年级本科生搭建起通向大数据知识空间的桥梁，为今后继续从事大数据领域的

工作奠定基础。

通过本课程的学习，能够建立对大数据知识体系的轮廓性认识，了解大数据的基本概

念、发展历程、研究背景、应用领域、关键技术、处理模式和发展前景；能够了解Hadoop

的起源、重要特性和版本的衍化，熟练掌握Hadoop平台的安装和使用方法；掌握Hadoop

分布式文件系统HDFS的重要概念、特点、体系结构、存储原理和读写过程，并熟练掌握

HDFS的使用方法；能够熟练掌握MapReduce的基本原理和编程方法；能够了解HBase数

据库的特点、架构和原理，并熟练掌握HBase的使用方法；掌握Hive数据仓库的使用方

法，了解复杂类型及Hive函数。

二、课程目标与毕业要求关系

（一）课程目标

1．知识传授目标

1-1掌握Hadoop基础

深入了解Hadoop的起源、发展历史、重要特性和应用现状；

理解Hadoop项目结构及其各个组件的功能和相互关系；

掌握Hadoop平台的安装、配置和基本使用方法。

1-2理解大数据处理架构

掌握分布式文件系统HDFS的基本概念、体系结构、存储原理和读写过程；

熟悉分布式数据库HBase的访问接口、数据模型、实现原理和运行机制；

理解MapReduce编程模型的基本理论和应用场景。

1-3掌握Hadoop生态圈技术

了解并掌握Hadoop生态圈中常用组件的安装配置流程，如Hive、Spark等；

熟悉NoSQL数据库、云数据库等相关技术及其在大数据处理中的应用；

掌握ETL工具在数据采集与迁移中的使用方法。

2.能力培养目标

2-1提升技术能力

能够熟练完成基于Hadoop的全分布式集群安装与部署；

能够熟练使用HDFS进行文件存储和读取操作；

能够使用MapReduce完成数据清洗和分析任务。

2-2增强实践能力

能够应用Hive技术完成数据分析任务，并编写符合语法规范的Hive操作程序；

能够使用Spark技术进行离线数据分析，掌握Spark计算框架的基本原理和编程模式；

能够通过实践项目，如日志分析等，将所学知识应用于实际问题解决中。

2-3拓展创新思维

培养学生利用大数据技术进行创新思考的能力，鼓励探索新的数据处理方法和应用场

景；

引导学生关注大数据领域的前沿技术和趋势，激发对未来技术发