基本信息
文件名称:企业管理- MapReduce 的工作流程.pdf
文件大小:157.84 KB
总页数:4 页
更新时间:2025-07-12
总字数:约2.03千字
文档摘要



企业管理-MapReduce的工作流程

一、数据输入与分片

(一)数据存储与读取

MapReduce处理的数据通常存储在分布式文件系统(如

Hadoop分布式文件系统HDFS)中。任务启动时,主节

点(JobTracker,在Hadoop1.x版本中,Hadoop2.x版

本为ResourceManager)会从文件系统读取数据文件。例

如,在处理大规模日志文件时,文件会被存储在HDFS