基本信息
文件名称:HDFS与Hadoop应用及项目实战指南.pdf
文件大小:349.55 KB
总页数:6 页
更新时间:2026-02-06
总字数:约4.08千字
文档摘要

一、基于HDFS云盘系统

1、网盘的底层就是HDFS(网盘的小文件是如何解决的,比如网盘如何做的)。

需要实现那些操作

HDFS集群;

HA

云盘的极速秒传是如何实现的?实际上没有传文件,其设计思路,对每个文件生成

一个hashcode,在库中查询是否有对应的文件。【重在思考这种方式有什么好处】

页面布局到Hbase中去。

二、Hadoop三行版本

apache在企业中使用的并不多,这个版本是最基础的一个版本。

Cloudera80%公司的软件包;