- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
- AppStage使用前准备
- AI原生应用引擎用户指南
- 开发中心用户指南
-
运维中心用户指南
- 运维中心简介
- 运维中心使用前准备
- 运维中心使用流程
- 进入运维中心
- 接入资源
- 部署应用
- 监控资源和应用
- 管理已纳管资源
- 管理运行时资源
- 管理工单
- 运营中心用户指南
- 最佳实践
- 开发指南
- API参考
- SDK参考
-
常见问题
- 权限管理
-
AI原生应用引擎
- 我创建的微调数据集会被其他用户调用去训练他们的大模型吗?
- 模型微调任务一直在等待中是什么原因?
- 大模型微调需要的数据有要求吗?
- AI原生应用引擎支持所有数据集进行数据标注吗?
- AI原生应用引擎中预置了哪些提示语?
- AI原生应用引擎训练好后的模型如何获取?
- 模型调测时,无法选择模型服务商API是什么原因?
- 我接入的模型需要满足什么要求才能在创建Agent时作为思考模型?
- Agent问答的时候报错“很抱歉,我的系统似乎遇到了一些故障问题,暂时无法为您提供服务”
- 自接入的模型在模型调测的时候报错是什么原因?
- 开源模型怎么部署?
- 平台有没有预置模型?
- 思考模型和问答模型的区别
- 工作流中知识库节点、LLM节点都需要配置实例,实例的API Key填什么?
- 工作流中工具节点的实例如何配置?
- 如何获取Agent发布时所需的API Key?
- 如何保证Agent每次问答都调用知识库?
- 工作流的返回是json格式,但是大模型会进行总结,如何以json格式直接输出?
- 如何在工作流中定制逻辑实现特定任务,比如时间格式转换、数组对象的push等
- 资产中心的工具怎么使用?
- Code代码节点的输入输出参数如何与其他节点进行交互和传递?
- Agent问答的时候没有回答
- 发布Agent的时候提示套餐校验失败
- 一站式创建Agent时如何取消选择默认模型,更换为其他模型
- 按照标题切分的时候,分段长度是什么意思?
- 工作流已启用,为什么在创建Agent时仍然无法选用?
- 如何通过调用Agent API将变量传递到工作流?
- 开发中心
- 运维中心部署服务
-
运维中心监控服务
- 如何查看EAP详细日志?
- 删除告警任务失败
- 告警后触发知识编排任务提示alert_type不存在
- 创建CES指标采集报错
- 如何卸载虚拟机上安装的filebeat?
-
异常检测Judge定时任务失败
- KeyError
- TypeError: not supported between instances of 'str' and 'float'
- TypeError("Cannot index by location index with a non-integer key")
- judge长时间处于SUBMIT状态直至失败
- fail to load model json
- judge日志无法查看,提示get request error
- judge日志大小1KB,且不刷新日志内容
- PSQLException: ERROR: invalid input syntax for type numeric
- PSQLException: ERROR: syntax error at or near
- too much null size
- judge_data_size(in):0
- ERROR - fail to load
- canceling statement due to user request
- 保存异常检测告警配置时报错
- 运维中心弹性资源服务
- 运维中心弹性网络服务
- 运维中心主机管理服务
- 运维中心微服务平台
-
运维中心负载均衡
-
SLB同步异常相关问题
- SSL_do_handshake() failed
- test nginx: nginx: [emerg] host not found in upstream "后端服务器名称" in /.../server...conf:17 nginx: .../nginx.conf test failed [FAILED
- no "ssl_certificate" is defined for the "listen ... ssl""
- no such file or directory......./ssl/dummy.pem
- test nginx: nginx: [alert] mmap(MAP_ANON|MAP_SHARED, 524288000) failed (12: Cannot allocate memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed
- duplicate value "error" in /opt/huawei/openresty/nginx/.../xxx.conf:40
- SLB同步检查不一致
- SLB一直同步,心跳异常
-
SLB部署失败相关问题
- FATAL Can't get local ip
- /etc/rc.d/init.d/functions: No such file or directory
- nginx is stopped
- will_upgrade\old_version:1.4.7
- Need to modify /etc/hosts,but no permission.
- system param fs.nr_open should not less than fs.file-max”or“system param net.ipv4.ip_local_port_range should >=30000
- some permission denied files in /opt/huawei/openresty/nginx/conf/
- Permission denied: '/opt/huawei/release/lf_test/SLB/
- install_slb_failed for /opt/huawei/openresty exists not for slb
- not all conf included in vhosts or slb_conf
- watchdog still running
- job 28e7241e42904334b failed
- [Service proxy.apply_sudo._wrapped_f]: fail to operator sudo,message: send request fail, status code: 400, error: None, message: illegal param\",\"status\":-2}
- some html not in /opt/huawei/openresty/nginx/html
- cannot access /opt/huawei/openresty/nginx/conf/ssl/sample/resty-auto-ssl-fallback.pem.Permission denined
- fail to operator sudo, message: send request fail, status code: 400, task: control sudo permission, status: failed
- some certificate not in /opt/huawei/openresty/nginx/conf/ssl
- crontab -l \n+ echo 'Permission denied crontab'
- 资源间绑定服务不一致
-
SLB同步异常相关问题
- 运维中心数据库治理
- 运维中心访问凭据管理服务
- 运营中心
- 管理控制台用户指南(即将下线)
- 业务控制台用户指南(即将下线)
-
运行时引擎用户指南(即将下线)
- AppStage运行时引擎简介
- AppStage运行时引擎使用前准备
- 进入AppStage运行时引擎
- 通过微服务平台管理微服务及相关资源
- 配置运行时引擎负载均衡
- 管理Cloud Map中的服务资源
- 配置运行时引擎数据库治理
- 配置访问凭据管理服务
- 文档下载
- 通用参考
链接复制成功!
常见问题
常见问题
- SDK初始化失败
SDK初始化失败,graysdk的run和debug日志会打印初始化失败原因,一般原因有如下几种:
- ETCD服务器配置错误(检查conf/graysdk.properties文件中server配置是否正确)。
- ETCD未启动或者网络原因不可用(检查网络以及ETCD是否正常)。
- ETCD中不存在此微服务名称的灰度配置。
- ETCD未启用用户名/密码认证方式,但是SDK配置了认证(检查conf/graysdk.properties文件是否配置了username)。
- jsonRuleFilePath没有配置。
- 灰度规则匹配失败
- 实际传入的参数和值,不满足配置的微服务灰度规则。
- 灰度开关关闭(检查conf/graysdk.properties文件graySwitch是否为1)。
- 灰度规则执行异常(检查graysdk的debug日志)。
- 联系灰度平台开发人员定位。
- 灰度参数的设置
消费端需要在CSE的invocation设置想要进行灰度的参数,有两种方法:
- 确定需要进行灰度的参数 ,在后端的接口中使用@RequestParam参数来指定。
- 业务直接在消费端设置参数,例如:ContextUtils.getInvocationContext().addContext("x-is-gray", "1")。
第一种方式直接在请求流量的URL中通过设置参数的值来标识灰度流量,第二种是业务在调用SDK之前改变invocation中参数的值来标识灰度。
- 后端灰度节点的判断
后端的节点在自己的microservice.yaml文件中设置参数描述(参照CSE开发网站)。
- 按照版本筛选灰度节点,需要在yaml中的service_description中先定义版本号,然后在管理台上选择按照版本进行灰度,填入定义的版本。
- 按照自定义参数筛选灰度节点,需要在yaml中的instance_description中先自定义灰度参数,并填入值,接着在管理台选择按照自定义参数进行灰度,填入自定义的参数。
附录
- SDK错误码
在调用SDK接口时,出现异常情况时SDK会返回一个GrayException异常,可以通过e.toString()查看详细的异常说明,通过e.getCode()获取异常错误码,同时通过SDK的debug日志可以看到更详细的异常错误信息。
表1 SDK错误码 异常编码
异常原因
异常处理方法
13300
内部处理错误,一般为配置错误导致。
查看graysdk的debug日志,查看error日志,同时联系灰度平台开发人员定位。
13301
参数错误,一般为传入SDK的微服务名称为空或者空串。
- 检查graysdk.properties文件etcd.serviceName配置是否正确。
- 检查graysdk的run日志,查看sdk是否初始化成功。
13302
cloudsoa security解密密码失败。
检查graysdk.properties文件etcd.password是否配置正确。
13303
操作ETCD失败(读取ETCD配置触发异常)。
- 检查graysdk.properties文件etcd.server配置是否正确。
- 检查ETCD服务器是否工作正常。
- 性能统计日志
日志字段默认采用“|” 分隔,一条日志一行,采用“\n”结尾,默认1s(可配置)打印一条。
表2 节点级日志 字段名称
必选(M)/可选(O)
字段说明
时间
M
YYYY-MM-DD<1SP>hh:mm:ss[.SSS]
请求次数
M
周期值,每个周期清零,重新计数。
未进行匹配次数
M
未进行灰度匹配的请求次数。一般为灰度完成、灰度暂停、未开启灰度等。
周期值,每个周期清零,重新计数。
匹配成功次数
M
周期值,每个周期清零,重新计数。
匹配失败次数
M
周期值,每个周期清零,重新计数。
匹配异常次数
M
周期值,每个周期清零,重新计数。
匹配超时次数
M
周期值,每个周期清零,重新计数。
请求平均时延
M
周期内请求的平均时延,单位:微秒。
请求最大时延
M
周期内请求的最大时延,单位:微秒。
请求最小时延
M
周期内请求的最小时延,单位:微秒。
表3 服务级日志 字段名称
必选(M)/可选(O)
字段说明
时间
M
YYYY-MM-DD<1SP>hh:mm:ss[.SSS]
微服务名
M
被调用的微服务名称。
灰度服务名
M
为被调用的微服务名称,或为被调用的微服务的映射服务名称。
请求次数
M
周期值,每个周期清零,重新计数。
未进行匹配次数
M
未进行灰度匹配的请求次数。一般为灰度完成、灰度暂停、未开启灰度等。
周期值,每个周期清零,重新计数。
匹配成功次数
M
周期值,每个周期清零,重新计数。
匹配失败次数
M
周期值,每个周期清零,重新计数。
匹配异常次数
M
周期值,每个周期清零,重新计数。
匹配超时次数
M
周期值,每个周期清零,重新计数。
请求平均时延
M
周期内请求的平均时延,单位:微秒。
请求最大时延
M
周期内请求的最大时延,单位:微秒。
请求最小时延
M
周期内请求的最小时延,单位:微秒。
- 告警日志
日志字段默认采用“|” 分隔,一条日志一行,采用“\n”结尾。
字段名称
必选(M)/可选(O)
字段说明
时间
M
YYYY-MM-DD<1SP>hh:mm:ss[.SSS]
告警ID
M
graysdk000000001-4
告警名称
M
graysdk000000001:gray servers all down alarm
graysdk000000002:etcd connect error
graysdk000000003:gray rule execute exception
graysdk000000004:gray rule execute timeout
本机IP
M
本机IP
告警类别
M
Firing:告警发生
Resolved:告警解除
详细信息
M
告警详细信息
告警方式
M
自动告警
开始时间
M
Firing时,为告警发生时间,Resolved时为0。
结束时间
M
Resolved时,为告警解除时间,Firing时为0。
service.json文件
{ "enableGrayMapping": "1", "services": [{ "name": "demoA", "wgpServiceName": "demoB" }, { "name": "demoC", "wgpServiceName": "demoB" }] }
NUWA配置项
nuwa: wgp: graySwitch: 1 jsonRuleFilePath: /opt/huawei/data/ serviceName: xxxxxx(业务自己配置) sdkServiceUrl: xxxxxxx enableCseGrayFilter: true enableCommonGrayFilter: false reportUrl: http://10.28.0.181:18080/dispatchProxy/v1