更新时间:2022-09-08 GMT+08:00
适用场景
HDFS(Hadoop Distribute File System)是一个适合运行在通用硬件之上,具备高度容错特性,支持高吞吐量数据访问的分布式文件系统,非常适合大规模数据集应用。
HDFS适用于如下场景:
- 处理海量数据(TB或PB级别以上)
- 需要很高的吞吐量
- 需要高可靠性
- 需要很好的可扩展能力
HDFS不适用以下场景:
- 大量小文件、随机写入、低延迟读取。
父主题: HDFS