- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
- AppStage使用前准备
- AI原生应用引擎用户指南
- 开发中心用户指南
-
运维中心用户指南
- 运维中心简介
- 运维中心使用前准备
- 运维中心使用流程
- 进入运维中心
- 接入资源
- 部署应用
- 监控资源和应用
- 管理已纳管资源
- 管理运行时资源
- 管理工单
- 运营中心用户指南
- 最佳实践
- 开发指南
- API参考
- SDK参考
-
常见问题
- 权限管理
-
AI原生应用引擎
- 我创建的微调数据集会被其他用户调用去训练他们的大模型吗?
- 模型微调任务一直在等待中是什么原因?
- 大模型微调需要的数据有要求吗?
- AI原生应用引擎支持所有数据集进行数据标注吗?
- AI原生应用引擎中预置了哪些提示语?
- AI原生应用引擎训练好后的模型如何获取?
- 模型调测时,无法选择模型服务商API是什么原因?
- 我接入的模型需要满足什么要求才能在创建Agent时作为思考模型?
- Agent问答的时候报错“很抱歉,我的系统似乎遇到了一些故障问题,暂时无法为您提供服务”
- 自接入的模型在模型调测的时候报错是什么原因?
- 开源模型怎么部署?
- 平台有没有预置模型?
- 思考模型和问答模型的区别
- 工作流中知识库节点、LLM节点都需要配置实例,实例的API Key填什么?
- 工作流中工具节点的实例如何配置?
- 如何获取Agent发布时所需的API Key?
- 如何保证Agent每次问答都调用知识库?
- 工作流的返回是json格式,但是大模型会进行总结,如何以json格式直接输出?
- 如何在工作流中定制逻辑实现特定任务,比如时间格式转换、数组对象的push等
- 资产中心的工具怎么使用?
- Code代码节点的输入输出参数如何与其他节点进行交互和传递?
- Agent问答的时候没有回答
- 发布Agent的时候提示套餐校验失败
- 一站式创建Agent时如何取消选择默认模型,更换为其他模型
- 按照标题切分的时候,分段长度是什么意思?
- 工作流已启用,为什么在创建Agent时仍然无法选用?
- 如何通过调用Agent API将变量传递到工作流?
- 开发中心
- 运维中心部署服务
-
运维中心监控服务
- 如何查看EAP详细日志?
- 删除告警任务失败
- 告警后触发知识编排任务提示alert_type不存在
- 创建CES指标采集报错
- 如何卸载虚拟机上安装的filebeat?
-
异常检测Judge定时任务失败
- KeyError
- TypeError: not supported between instances of 'str' and 'float'
- TypeError("Cannot index by location index with a non-integer key")
- judge长时间处于SUBMIT状态直至失败
- fail to load model json
- judge日志无法查看,提示get request error
- judge日志大小1KB,且不刷新日志内容
- PSQLException: ERROR: invalid input syntax for type numeric
- PSQLException: ERROR: syntax error at or near
- too much null size
- judge_data_size(in):0
- ERROR - fail to load
- canceling statement due to user request
- 保存异常检测告警配置时报错
- 运维中心弹性资源服务
- 运维中心弹性网络服务
- 运维中心主机管理服务
- 运维中心微服务平台
-
运维中心负载均衡
-
SLB同步异常相关问题
- SSL_do_handshake() failed
- test nginx: nginx: [emerg] host not found in upstream "后端服务器名称" in /.../server...conf:17 nginx: .../nginx.conf test failed [FAILED
- no "ssl_certificate" is defined for the "listen ... ssl""
- no such file or directory......./ssl/dummy.pem
- test nginx: nginx: [alert] mmap(MAP_ANON|MAP_SHARED, 524288000) failed (12: Cannot allocate memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed
- duplicate value "error" in /opt/huawei/openresty/nginx/.../xxx.conf:40
- SLB同步检查不一致
- SLB一直同步,心跳异常
-
SLB部署失败相关问题
- FATAL Can't get local ip
- /etc/rc.d/init.d/functions: No such file or directory
- nginx is stopped
- will_upgrade\old_version:1.4.7
- Need to modify /etc/hosts,but no permission.
- system param fs.nr_open should not less than fs.file-max”or“system param net.ipv4.ip_local_port_range should >=30000
- some permission denied files in /opt/huawei/openresty/nginx/conf/
- Permission denied: '/opt/huawei/release/lf_test/SLB/
- install_slb_failed for /opt/huawei/openresty exists not for slb
- not all conf included in vhosts or slb_conf
- watchdog still running
- job 28e7241e42904334b failed
- [Service proxy.apply_sudo._wrapped_f]: fail to operator sudo,message: send request fail, status code: 400, error: None, message: illegal param\",\"status\":-2}
- some html not in /opt/huawei/openresty/nginx/html
- cannot access /opt/huawei/openresty/nginx/conf/ssl/sample/resty-auto-ssl-fallback.pem.Permission denined
- fail to operator sudo, message: send request fail, status code: 400, task: control sudo permission, status: failed
- some certificate not in /opt/huawei/openresty/nginx/conf/ssl
- crontab -l \n+ echo 'Permission denied crontab'
- 资源间绑定服务不一致
-
SLB同步异常相关问题
- 运维中心数据库治理
- 运维中心访问凭据管理服务
- 运营中心
- 管理控制台用户指南(即将下线)
- 业务控制台用户指南(即将下线)
-
运行时引擎用户指南(即将下线)
- AppStage运行时引擎简介
- AppStage运行时引擎使用前准备
- 进入AppStage运行时引擎
- 通过微服务平台管理微服务及相关资源
- 配置运行时引擎负载均衡
- 管理Cloud Map中的服务资源
- 配置运行时引擎数据库治理
- 配置访问凭据管理服务
- 文档下载
- 通用参考
- 异常1:Username is Emty!
- 异常2:Access denied for user
- 异常3:NodeDataSource can't init或者init dataSource Params Error!
- 异常4:dbGroupKey can not be null
- 异常5:Key not found, cause 或者 item lose
- 异常6:datasource.properties没有更新,或者没有拉取到某个数据库配置
- 异常7:启动时报ETCD fault,can't not connect
- 异常9:启动时报java.sql.SQLException: NodeDataSource XXXX@XXXX has closed
- 异常10:启动时报Could not create connection to database server. Attempted reconnect 3 times. Giving up
展开导读
链接复制成功!
常见问题
异常1:Username is Emty!
异常:ERROR com.huawei.rainbow.utils.parser.DbNodeConfParser:46 - [] - appConfStr is not json format
原因:业务直接往ETCD里面set值,但set格式不是有效的json格式。
解决:使用工具检查,是否使用正确的Json串。
异常2:Access denied for user
异常:java.sql.SQLException: Access denied for user 'xxxx'@'xx.xx.xx.xx' (using password: YES)
- 原因1:密码错误或者服务器分配权限错误。现网问题定位占了60%左右。数据库登录密码是否使用了明文!
- 请认真检查密码配置,检查MySQL权限是否分配正确。
- 通过dump内存,搜索相关关键字判断解密字符为需要的字符串。
解决:使用正确的密码。
异常3:NodeDataSource can't init或者init dataSource Params Error!
异常:com.huawei.rainbow.exception.RainbowRunTimeException: NodeDataSource can't init: dsKey=xx.xx.xx.xx:3306@mysql或者Caused by: com.huawei.rainbow.exception.DbNodeInitialException: [ConfigError]init dataSource Params Error! config is
- 原因1:大部分就是密码为null或者空串。
- 请认真检查密码配置是否解密成功。通过搜索Rainbow日志关键字:Password is Empty! 请检查解密类是否继承了基类com.huawei.rainbow.utils.PasswordCoder。
- 搜索rainbow日志关键字:DbNodeConfig Check,查看是否校验失败。
解决:使用正确的密码。
- 原因2:如果用的是cloud+stsl连的高斯数据库,原因是没有STS的调用步骤。
通过搜索rainbow日志关键字:Password is Empty!
解决:正确调用STS。
- 原因3:本地连接报这个错。
- 先把配置信息删除,给Schema创建新的业务账号,新增配置信息。
- 把config目录下的rainbow.properties里面的ETCD地址和密码注释掉。
异常4:dbGroupKey can not be null
异常:ParameterErrorException: dbGroupKey can not be null, length need bigger than 0(或者类似参数异常错误)。
原因1:dbGroupKey为null或者空串。 必填字段会做参数校验,请检查相关参数是否设置。
原因2:确定是否在rainbow.properties 中配置ETCD地址。
解决: 找到设置参数的地方,咨询核对配置的appName,dbGroupKey,dbName是否正确。
异常5:Key not found, cause 或者 item lose
异常:类似 Key not found, cause: /Dbmonitor/status/DB/Services/xzjDB/xzjDB/activeDBs/mysql222, at index: 211562166
或者: item lose 关键字
或者:Caused by: com.huawei.rainbow.exception.ParameterErrorException: xxxx can not be null, length need bigger than 0
- 原因1:检查ETCD的IP配置。
- 原因2:在DCG导入的监控:是否监控成功(管理台亮绿灯),如果没有成功,一般是dbmonitor的权限没有配置正确,请检查。如果已经成功,查看前台的权重是否生成?没有生成则需要到后台查看。
- 原因3: 配置的appName(DCG界面的serviceName),appGroupKey(DCG的ClusterName),DBName(DCG的dbNname)是否配置正确。经常有业务将appName、appGroupKey与DCG配置的值搞得不一致,从而启动不了。
- 原因4:rainbow.properties文件路径没有读到。 关键字 "no etcd IP configured" 。
- 原因5:业务检查下,是否存在三方件引入的netty版本不一致导致冲突,检查netty-all版本和单独依赖的netty-handle等版本是否一致,如果不一致请业务统一升级到最新版本保持一致。
- 原因6:业务集成Rainbow使用的是oneJar的方式,在oneJar内和外面都定义了rainbow.properties 文件,存在冲突问题。验证方式:logback配置 jetcd日志com.huawei.dcs.jetcd、com.huawei.wisecloud.jetcd为INFO级别连接时会打印ETCD的地址,如:
<AsyncLogger name="com.huawei.dcs.jetcd" level="INFO" includeLocation="true" additivity="false"> <AppenderRef ref="rainbow-common"/> </AsyncLogger> <AsyncLogger name="com.huawei.wisecloud.jetcd" level="INFO" includeLocation="true" additivity="false"> <AppenderRef ref="rainbow-common"/> </AsyncLogger>
定位:
- 通过命令检查ETCD里面是否已经存在相关值。
curl http://{etcdip:port}/v2/keys/Dbmonitor/conf/DB/Services/{appName}/{dbGroupKey}/DBnames/{dbName}/{IP:port}
curl http://{etcdip:port}/v2/keys/Dbmonitor/status/DB/Services/{appName}/{dbGroupKey}/activeDBs/{dbName}
{xxx}为变量,替换成实际的字段。
- rainbow.properties文件必须放到classpath目录下,否则读取不到。classpath目录下不能有多级目录,如classpath:db/目录。
解决:检查配置的 appName,appGroupKey,DBName字段是否正确。配置的ETCD地址是否需要连接的地址。appName对应DCG的ServiceName,appGroupKey对应 instanceName。业务配置的appName是老的字段,导致报此错误。
异常6:datasource.properties没有更新,或者没有拉取到某个数据库配置
原因1:ETCD地址是否配错。
原因2:检查是否配置了DBDataSource的懒加载模式,只有当用数据库的时候才初始化,拉取配置。
定位:
- 检查ETCD地址是否配错,查看日志是否有ETCD连接相关的错误。如果有,请修改重启。
- 检查是否配置了DBDataSource的懒加载模式、只有当用数据库的时候才初始化,拉取配置。如果是,触发一次数据库操作,看下是否更新。
异常7:启动时报ETCD fault,can't not connect
原因1:ETCD连接不上。
原因2:调用close()方法后,再调用了get etcd的方法。
定位:
1. 检查rainbow.properties文件路径有没有读到。 关键字 "no etcd IP configured" 。
2. 检查日志是否打印“close rainbow instance”关闭了Rainbow。
异常9:启动时报java.sql.SQLException: NodeDataSource XXXX@XXXX has closed
原因:Rainbow已经调用了close方法,导致无数据源。检查nuwa.out是不是有其他失败异常。
定位:检查日志中是否打印了“close rainbow instance”关闭了Rainbow。初始化失败时也会调用close方法。
异常10:启动时报Could not create connection to database server. Attempted reconnect 3 times. Giving up
原因:初始化失败,ping一下检查是否数据库是否联通。