基本信息
文件名称:大数据平台与编程实践课程实验六-spark的基本使用.doc
文件大小:3.64 MB
总页数:19 页
更新时间:2025-05-23
总字数:约2.07千字
文档摘要

南华大学计算机学院

实验报告

(2021学年秋季学期)

课程名称

大数据平台与编程实践

实验名称

Spark的基本使用

一、实验目的

??1.了解spark和spark生态系统

2.了解spark运行基本流程和运行原理

二、实验环境

VMwareWorkstationPro虚拟机下的Linux操作系统

Hadoop

Spark

实验内容

启动hadoop集群和spark集群,启动spark-shell

2.RDD创建

2-1从文件系统中加载数据创建RDD

2-2从hdfs系统中加载数据创建RDD