文档首页/ MaaS模型即服务/ API参考/ MaaS调用统计/ 获取服务统计信息列表

更新时间：2026-07-03 GMT+08:00

获取服务统计信息列表

功能介绍

获取服务统计信息列表接口用于获取用户已开通的预置服务、已创建的自定义接入点或已部署成功的我的服务三种类型服务，并展示每个服务的调用次数、调用失败率、调用总Tokens数、输入Tokens数、输出Tokens数、端到端时延等指标信息。仅保存30天内的统计数据。

接口约束

区域限制：仅支持西南-贵阳一区域。
API流量限制：所有用户对该API的总请求次数上限，1分钟内不超过1000次。
用户流量限制：单个用户对该API的请求次数上限，1分钟内不超过200次。
限流响应：超出限流阈值时，API将返回HTTP 429状态码（Too Many Requests）。
重试建议：遇到限流时，建议等待60秒后重试。

URI

POST /v1/{project_id}/maas/monitoring/list-service-statistics

表1 路径参数
参数	是否必选	参数类型	描述
project_id	是	String	参数解释：项目ID。关于如何获取项目ID，请参见获取项目ID和名称。约束限制：不涉及。取值范围：只能由小写英文字母和数字组成，长度32字符。默认取值：不涉及。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	是	String	参数解释：用户Token。通过调用IAM服务的获取用户Token接口获取（响应消息头中X-Subject-Token的值）。获取方式请参见认证鉴权。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。

表3 请求Body参数
参数	是否必选	参数类型	描述
service_names	否	Array of strings	参数解释：服务名称列表，根据传入的服务名称列表筛选；不传则查找所有服务名称下的数据。支持模糊匹配服务名称。约束限制：不涉及。取值范围：服务列表包含已开通的预置服务、已创建的自定义接入点和已部署成功的我的服务。默认取值：不涉及。
service_type	是	Integer	参数解释：服务类型。约束限制：不涉及。取值范围：枚举类型，取值如下： 1：我的服务，在“我的服务”页面部署的模型服务，更多信息，请参见部署模型服务。 2：预置服务，在“预置服务”页签开通的模型服务。具体操作，请参见开通预置服务。 4：自定义接入点，在“自定义接入点”页签创建的接入点服务。更多信息，请参见创建自定义接入点。默认取值：不涉及。
api_keys	否	Array of strings	参数解释：API Key标签列表，根据传入的API Key标签列表筛选。 MaaS的服务支持API Key调用和在线体验两种方式。 API Key标签获取方式：进入API Key 管理页面，API Key列表中“标签”字段的值即为API Key的标签。如下图所示：约束限制：不涉及。取值范围：查询在线体验调用数据时示例：api_keys: [""]。查询部分API Key下的调用数据时，传入对应API Key的标签；示例：api_keys: ["test01"，"test02"]。查询在线体验和部分API Key下的调用数据时，示例：api_keys: ["test01", "test02", ""] 查询全部调用数据时，不传该参数。默认取值：不涉及。
ips	否	Array of strings	参数解释：IP地址列表，指已产生调用量的客户端源IP地址，不传则查询用户全部IP地址下的数据。可使用查询IP列表接口查询IP地址。约束限制：需符合IP地址格式。取值范围：不涉及。默认取值：不涉及。
start_time	是	Long	参数解释：开始时间，毫秒时间戳。约束限制：结束时间与开始时间相差不超过30天。取值范围：数值大于0，小于等于end_time的取值。默认取值：不涉及。
end_time	是	Long	参数解释：结束时间，毫秒时间戳。约束限制：结束时间与开始时间相差不超过30天。取值范围：数值大于0。默认取值：不涉及。
limit	否	Integer	参数解释：分页条数,表示本次最多返回多少条数据。为0则表示不分页返回全部数据。约束限制：不涉及。取值范围：大于等于0。默认取值：0。
offset	否	Integer	参数解释：分页偏移量，表示跳过多少条数据查询后面的数据。约束限制：不涉及。取值范围：大于等于0。默认取值：0。
timezone	否	String	参数解释：时区。约束限制：不涉及。取值范围：遵循IANA时区规范（如Asia/Shanghai、UTC）。默认取值：Asia/Shanghai（东八区）。
infer_type	是	String	参数解释：服务的推理类型。取值范围：枚举类型，取值如下： real_time：在线推理。 batch：批量推理（批量推理当前处于受限使用阶段，如需使用请提交工单）。约束限制：不涉及。默认取值：不涉及。
model_type	否	string	参数解释：模型类型。取值范围：模型类型取值如下： Text Generation：文本生成类模型。 Video Generation：视频生成类模型。 Image Generation：图像生成类模型。 Vector Model：文本向量化。 Embedding： Embedding模型。 Image Understanding：图像理解类模型。 Rerank：重排序类模型。约束限制：不涉及。默认取值：Text Generation。

响应参数

状态码：200

表4 响应Body参数
参数	参数类型	描述
total	Integer	参数解释：查询到的数据总数。取值范围：不涉及。
count	Integer	参数解释：当前返回分页最大数据条数。取值范围：分页时其值等于入参limit，不分页时为查询到的数据总数。
items	Array of ServiceStatItem objects	参数解释：服务信息列表。取值范围：服务列表只显示已开通的预置服务、已创建的自定义接入点或已部署成功的我的服务。

表5 ServiceStatItem
参数	参数类型	描述
service_id	String	参数解释：服务ID。取值范围：不涉及。
service_name	String	参数解释：服务名称。取值范围：不涉及。
request_count	Integer	参数解释：调用次数。取值范围：不涉及。
error_count	Integer	参数解释：调用失败次数（当类型为批量推理时，该参数表示推理失败次数，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
error_rate	Double	参数解释：调用失败率（当类型为批量推理时，该参数表示推理失败率，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：0-1。
total_token	Double	参数解释：调用总Tokens数（千tokens）（当类型为批量推理时，该参数表示总Tokens数，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
prompt_token	Double	参数解释：输入Tokens数（千tokens）。取值范围：不涉及。
completion_token	Double	参数解释：输出Tokens数。取值范围：不涉及。
avg_latency	Double	参数解释：平均端到端时延（ms）。取值范围：不涉及。
avg_ttft	Double	参数解释：平均首Tokens时延（ms）。取值范围：不涉及。
avg_tpot	Double	参数解释：平均增量Tokens时延（ms）。取值范围：不涉及。
infer_times	Integer	参数解释：推理总量（次）（该参数与批量推理有关，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
scc_count	Integer	参数解释：调用成功次数（当类型为批量推理时，该参数表示推理成功次数，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
avg_consume_time	Double	参数解释：平均任务处理时长（分钟）（该参数与批量推理有关，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
completion_tasks_count	Integer	参数解释：已完成任务数（该参数与批量推理有关，批量推理当前处于受限使用阶段，如需使用请提交工单）。取值范围：不涉及。
cache_token	Double	参数解释：缓存命中数（千tokens）。取值范围：不涉及。
cache_hit_ratio	Double	参数解释：缓存命中率，缓存命中的Tokens数/输入的Tokens数。取值范围：不涉及。
avg_generation_time	Double	参数解释：平均生成时长，平均生成每图片/视频实际花费的时间，仅视频、图片类模型。取值范围：不涉及。
generation_type	String	参数解释：模型类型。取值范围：模型类型取值如下： Text Generation：文本生成类模型。 Video Generation：视频生成类模型。 Image Generation：图像生成类模型。 Vector Model：文本向量化。 Embedding： Embedding模型。 Image Understanding：图像理解类模型。 Rerank：重排序类模型。
video_generate_duration	Double	参数解释：生成的视频的总时长取值范围：不涉及。
image_generate_nums	Integer	参数解释：生成的图片总张数取值范围：不涉及。

状态码：400

表6 响应Body参数
参数	参数类型	描述
error_code	String	参数解释：错误码，标识错误类型，详情请参考MaaS错误码。取值范围：不涉及。
error_msg	String	参数解释：错误描述信息。详情请参考MaaS错误码。取值范围：不涉及。

请求示例

查询用户预置服务在线推理时间在1770048000000到1770103717647之间的调用统计信息，数据分页返回，每页最多100条。

v1/{{project_id}}/maas/monitoring/list-service-statistics

{
  "start_time" : 1770048000000,
  "end_time" : 1770103717647,
  "service_type" : 2,
  "limit" : 100,
  "offset" : 0,
  "service_names" : [ ],
  "infer_type" : "real_time",
  "model_type" : "Text Generation"
}

响应示例

状态码：200

成功响应。

{
  "total" : 6,
  "count" : 100,
  "items" : [ {
    "service_id" : "21699c35-f333-462b-8a5d-66599926c26f",
    "service_name" : "DeepSeek-R1",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 47.872,
    "prompt_token" : 15.104,
    "completion_token" : 32.768,
    "avg_latency" : 33548.47,
    "avg_ttft" : 343.83,
    "avg_tpot" : 32.46,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  }, {
    "service_id" : "3f23f78d-96e3-4146-885a-74fc392ed190",
    "service_name" : "DeepSeek-V3.2",
    "generation_type" : "Text Generation",
    "request_count" : 35,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 68.11,
    "prompt_token" : 32.27,
    "completion_token" : 35.84,
    "avg_latency" : 35744.14,
    "avg_ttft" : 1139.02,
    "avg_tpot" : 33.73,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  }, {
    "service_id" : "44e8ee1d-890e-4f8d-9b05-2b2f03a9e514",
    "service_name" : "DeepSeek-V3",
    "generation_type" : "Text Generation",
    "request_count" : 17,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 33.065,
    "prompt_token" : 15.657,
    "completion_token" : 17.408,
    "avg_latency" : 30236.35,
    "avg_ttft" : 328.66,
    "avg_tpot" : 29.24,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  }, {
    "service_id" : "780caccf-c894-4fd9-8a8e-ba31f1c644fe",
    "service_name" : "Qwen3-32B-32K",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 70.316,
    "prompt_token" : 32.48,
    "completion_token" : 37.836,
    "avg_latency" : 21912.5,
    "avg_ttft" : 349.18,
    "avg_tpot" : 18.2,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  }, {
    "service_id" : "8f658111-64af-44dd-bd3b-a78ec500bc88",
    "service_name" : "DeepSeek-V3.2-Exp",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 57.17,
    "prompt_token" : 15.088,
    "completion_token" : 42.082,
    "avg_latency" : 36555.44,
    "avg_ttft" : 0,
    "avg_tpot" : 0,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  }, {
    "service_id" : "ecd6ff0d-4634-4a50-bbe5-641c27b26087",
    "service_name" : "DeepSeek-V3.1",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 59.302,
    "prompt_token" : 29.568,
    "completion_token" : 29.734,
    "avg_latency" : 31596.78,
    "avg_ttft" : 504.26,
    "avg_tpot" : 32.93,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0,
    "video_generate_duration": 0,
    "image_generate_nums": 0
  } ]
}

状态码：400

失败响应。

{
  "error_code" : "ModelArts.0104",
  "error_msg" : "参数无效，问题：结束时间不能早于开始时间。"
}

状态码

状态码	描述
200	成功响应
400	失败响应。

错误码

请参见错误码。

父主题： MaaS调用统计

上一篇：获取汇总统计

下一篇：获取服务指标时间分布统计信息

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问