华为云 APP

您的云计算服务助手——让您安全、实时、高效、便捷的掌控云端资源。

立即下载
 
 
 

    应用故障隔离 更多内容
  • 内置注入故障

    内置注入故障 带波动的延时故障 基于延时基数和抖动幅度创建带有波动的延时故障。具体触发要结合故障注入功能是否开启、注入故障概率、延时注入开关、延时故障生效概率决定。 异常故障 内置如下异常故障,结合故障注入功能是否开启、注入故障概率、异常注入开关、异常故障生效概率决定是否触发,触发故障为对应模块随机一种异常。

    来自:帮助中心

    查看更多 →

  • 故障处理类

    故障处理类 日志提示解析日期格式失败时怎么处理? 字段映射界面无法显示所有列怎么处理? CDM 迁移数据到DWS时如何选取分布列? 迁移到DWS时出现value too long for type character varying怎么处理? OBS导入数据到SQL Server时出现Unable

    来自:帮助中心

    查看更多 →

  • 故障现象登记

    故障现象登记”。 进入“故障现象登记”页面。 扫描/输入故障产品的产品条码,按回车键。 录入故障现象: 故障现象代码:数据来源于故障与缺陷代码中故障现象分类数据。 故障现象说明:对产品故障现象进行说明。 图1 故障现象登记 单击“确认”。 父主题: 质量检验

    来自:帮助中心

    查看更多 →

  • 业务故障类

    业务故障类 网络流量异常的原因? DDoS攻击导致客户端禁止访问,怎么办? 遭受流量攻击,如何查询公网IP的具体防护信息? 没有受到攻击,触发了流量清洗? 父主题: DDoS原生基础防护常见问题

    来自:帮助中心

    查看更多 →

  • HBase故障排除

    HBase故障排除 HBase客户端连接服务端时,长时间无法连接成功 在HBase连续对同一个表名做删除创建操作时出现创建表异常 HBase占用网络端口,连接数过大会导致其他服务不稳定 有210000个map和10000个reduce的HBase BulkLoad任务运行失败 使

    来自:帮助中心

    查看更多 →

  • 网络故障

    网络故障 TE10/TE20如何进行网络测试? TE10打不开输入激活码的页面,提示“华为云获取地址失败,请检查网络”? 硬终端显示丢包率阈值A和B分别表示什么意思? 网络测试ping包和终端提示丢包率的区别是什么以及终端丢包率检测机制是什么? 硬终端激活时,提示“华为云获取地址失败,请检查网络”?

    来自:帮助中心

    查看更多 →

  • CarbonData故障排除

    CarbonData故障排除 当在Filter中使用Big Double类型数值时,过滤结果与Hive不一致 executor内存不足导致查询性能下降 为什么数据查询/加载失败,且发生“org.apache.carbondata.core.memory.MemoryException:

    来自:帮助中心

    查看更多 →

  • Hue故障排除

    Hue故障排除 使用Hive输入use database语句失效 使用Hue WebUI访问HDFS文件失败 在Hue页面上传大文件失败 集群未安装Hive服务时Hue原生页面无法正常显示 访问Hue原生页面时间长,文件浏览器报错Read timed out 父主题: 使用Hue

    来自:帮助中心

    查看更多 →

  • HBase故障排除

    HBase故障排除 HBase客户端连接服务端时长时间无法连接成功 在HBase连续对同一个表名做删除创建操作时出现创建表异常 HBase占用网络端口,连接数过大会导致其他服务不稳定 有210000个map和10000个reduce的HBase BulkLoad任务运行失败 使用

    来自:帮助中心

    查看更多 →

  • Hive故障排除

    Hive故障排除 如何对insert overwrite自读自写场景进行优化 父主题: 使用Hive

    来自:帮助中心

    查看更多 →

  • 硬盘限制故障

    硬盘限制故障 下载或读取文件报错,提示超时、无剩余空间 复制数据至容器中空间不足 Tensorflow多节点作业下载数据到/cache显示No space left 日志文件的大小达到限制 日志提示"write line error" 日志提示“No space left on device”

    来自:帮助中心

    查看更多 →

  • 环境配置故障

    环境配置故障 Notebook提示磁盘空间已满 Notebook中使用Conda安装Keras 2.3.1报错 Notebook中安装依赖包报错ERROR: HTTP error 404 while getting xxx Notebook中已安装对应库,仍报错import numba

    来自:帮助中心

    查看更多 →

  • GPU故障处理

    GPU故障处理 前提条件 如需将GPU事件同步上报至AOM,集群中需安装云原生日志采集插件,您可前往AOM服务查看GPU插件隔离事件。 GPU插件隔离事件 当GPU显卡出现异常时,系统会将出现问题的GPU设备进行隔离,详细事件如表1所示。 表1 GPU插件隔离事件 事件原因 详细信息

    来自:帮助中心

    查看更多 →

  • 容器类故障

    ;server_ip ;server_port ;fault_repetition ;fault_interval 应用程序类 表3 应用程序类参数配置 故障类型 故障模式 设置参数 进程 容器内杀进程 类型:docker_id /docker_name;docker_id /docker_name;num

    来自:帮助中心

    查看更多 →

  • 高频故障案例

    高频故障案例 弹性云服务器 访问中国大陆外网站时加载缓慢怎么办? ping不通或丢包时如何进行链路测试? 访问E CS 实例上运行的网站卡顿,如何定位问题? 网站无法访问怎么办? 云服务器 端口不通怎样排查? 云 服务器 带宽占用高怎么办? Windows云服务器卡顿怎么办? Linux云服务器卡顿怎么办?

    来自:帮助中心

    查看更多 →

  • 故障信息收集

    故障信息收集 故障信息收集方法 如何获取显卡ID 如何查询显卡详细信息 如何查询显卡在位信息 如何查询NVIDIA的错误信息 如何查询XID报错信息 如何收集NVIDIA日志 如何查询内核信息 如何收集驱动安装信息 父主题: GPU实例故障自诊断

    来自:帮助中心

    查看更多 →

  • 故障注入

    故障注入 故障注入是一种有效的测试方法,它能够将错误引入系统,以确保系统能够承受错误的并从错误中恢复。开启故障注入,可以通过配置灵活注入延迟或特定错误,开展故障测试。 以延迟故障注入为例,YAML设置如下(根据实际需求调整配置参数): route: - destination:

    来自:帮助中心

    查看更多 →

  • HDFS故障排除

    HDFS故障排除 往HDFS写数据时报错“java.net.SocketException” 删除大量文件后重启NameNode耗时长 EditLog不连续导致NameNode启动失败 当备NameNode存储元数据时,断电后备NameNode启动失败 dfs.datanode.data

    来自:帮助中心

    查看更多 →

  • CarbonData故障处理

    CarbonData故障处理 当在Filter中使用Big Double类型数值时,过滤结果与Hive不一致 executor内存不足导致查询性能下降 父主题: 使用CarbonData( MRS 3.x及之后版本)

    来自:帮助中心

    查看更多 →

  • 故障现象登记

    > 故障现象登记”。 进入“故障现象登记”页面。 扫描/输入故障产品的产品条码,按回车键。 录入故障现象: 故障现象代码:数据来源于故障与缺陷代码中故障现象分类数据。 故障现象说明:对产品故障现象进行说明。 图1 故障现象登记 单击“确认”。 父主题: 质量检验

    来自:帮助中心

    查看更多 →

  • 故障全面检测

    故障全面检测 高可用性系统必须具有完善的故障检测能力,以确保能够快速发现那些可能导致故障的事件、显示正在发展的故障、激活的故障,以及潜在的故障的事件。在几乎所有情况下,故障检测能力都是故障恢复的前提。 RES06 故障检测 RES07 监控告警 父主题: 韧性支柱

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了