基本信息
文件名称:大数据平台与编程实践课程实验六-spark的基本使用.doc
文件大小:3.64 MB
总页数:19 页
更新时间:2025-05-23
总字数:约2.07千字
文档摘要
南华大学计算机学院
实验报告
(2021学年秋季学期)
课程名称
大数据平台与编程实践
实验名称
Spark的基本使用
一、实验目的
??1.了解spark和spark生态系统
2.了解spark运行基本流程和运行原理
二、实验环境
VMwareWorkstationPro虚拟机下的Linux操作系统
Hadoop
Spark
实验内容
启动hadoop集群和spark集群,启动spark-shell
2.RDD创建
2-1从文件系统中加载数据创建RDD
2-2从hdfs系统中加载数据创建RDD