更新时间:2025-08-07 GMT+08:00
使用HDFS
- HDFS容量达到100%导致上层服务HBase、Spark等不可用
- 启动HDFS和Yarn服务报错“Permission denied”
- 集群外节点访问MRS HDFS报错
- 修改RPC端口后HDFS NameNode实例都变为备状态
- 内存不足导致HDFS NameNode启动失败
- 单NameNode长期故障时如何使用客户端手动checkpoint
- 删除大量文件后重启NameNode耗时长
- EditLog不连续导致NameNode启动失败
- 当备NameNode存储元数据时,断电后备NameNode启动失败
- 备NameNode节点长时间未启动,导致启动失败
- HDFS的DataNode一直显示退服中
- DataNode偶现CPU占用接近100%导致节点无法连接
- 由于HDFS块丢失导致DataNode退服失败
- dfs.datanode.data.dir中定义的磁盘数量等于dfs.datanode.failed.volumes.tolerated的值时,DataNode启动失败
- HDFS写文件失败,报错“item limit of xxx is exceeded”
- HDFS读写文件失败,报错“Failed to place enough replicas”
- HDFS读取文件失败,报错“FileNotFoundException”
- HDFS读文件失败,报错“No common protection layer”
- HDFS写数据时报错“java.net.SocketException”
- HDFS写文件并发较大时报副本不足
- HDFS客户端写文件close失败
- HDFS目录配额不足导致写文件失败
- 文件错误导致上传文件到HDFS失败
- 集群外节点安装客户端上传HDFS文件失败
- 查询或者删除HDFS文件失败
- 文件最大打开句柄数设置太小导致读写文件异常
- 调整HDFS Shell客户端日志级别
- 使用普通模式集群的HDFS客户端时报错“error creating DomainSocket”
- 执行distcp跨集群拷贝文件报错“Source and target differ in block-size”
- 使用distcp命令拷贝空文件夹报错
- HDFS客户端无法删除超长目录
- HDFS调用FileInputFormat的getsplit的时候出现数组越界
- ntpdate修改时间导致HDFS出现大量丢块
- 界面配置dfs.blocksize后上传数据,block大小未改变
- 通过公网IP连接使用HDFS客户端报错
- 使用Python远程连接HDFS的端口失败
- 执行balance常见问题定位方法
- 非HDFS数据残留导致数据分布不均衡
- HDFS客户端安装在数据节点导致数据分布不均衡
- 节点内DataNode磁盘使用率不均衡
- MRS集群上报HDFS磁盘空间不足告警但是实际磁盘空间未被占满
- NameNode节点存在ALM-12027主机PID使用率超过阈值告警
- 集群出现ALM-14012 Journalnode数据不同步告警