基本信息
文件名称:对大数据处理框架的认识和实践.docx
文件大小:40.33 KB
总页数:5 页
更新时间:2025-09-19
总字数:约3.95千字
文档摘要
对大数据处理框架的认识和实践
●Hadoop架构概述
如果你在百度查询“大数据”,会发现“大数据”和“Hadoop”會成对出现,乃至很多人认为大数据就是Hadoop,这里特别要指出,大数据代表的是一种理念、一种问题解决思路、一系列处理方式的集合。大数据也并不特指Hadoop,Hadoop由Apache公司开发,是应用Google的上述论文的核心技术,采用Java语言进行的开源实现。它以分布式文件系统HDFS(HadoopDistributedFileSystem)和MapReduce计算框架为核心,支持海量结构化、半结构化、非结构化数据的存储处理,以及一些支持Hadoop的其他子项目的通