更新时间:2025-07-08 GMT+08:00
运行推理服务
前提条件
- 已有可正常使用的华为云账号。具体操作,请参见创建IAM用户并授权使用DataArtsFabric和配置DataArtsFabric服务委托权限。
- 已有至少一个正常可用的工作空间。具体操作,请参见创建工作空间。
- 已有至少一个Ray服务。具体操作,请参见创建Ray服务。
运行推理服务
- 登录DataArtsFabric工作空间管理台。
- 选择已创建的工作空间,单击“进入工作空间”,选择“资源与资产 > Ray服务”。
- 在“Ray服务”页面的“推理地址”列,获取目标Ray服务的推理地址。
- 使用API工具或其他方法调用推理地址,查询推理结果。
如图,使用curl进行推理:
curl -s -k --location -X POST 'https://fabric-inference-url/v1/workspaces/{workSpaceId}/endpoints/{endPointId}/rayservice/fruit' --header "X-Auth-Token: $(cat test.json)" --header 'Content-Type: application/json' --data-raw '["MANGO", 3]'
得到推理结果:9
查看Ray服务的Dashboard
- 登录DataArtsFabric工作空间管理台。
- 选择已创建的工作空间,单击“进入工作空间”,选择“资源与资产 > Ray服务”。
- 在“Ray服务”页面,单击目标Ray服务名称。
- 在“Ray服务详情”页面的“概览”页签,单击“Dashboard”右侧的“立即查看”,进入Ray服务的Dashboard,查看推理服务具体信息。
父主题: 管理Ray服务