文档首页/ MaaS模型即服务/ API参考/ Maas调用统计/ 获取服务统计信息列表
更新时间:2026-03-16 GMT+08:00
分享

获取服务统计信息列表

功能介绍

获取服务统计信息列表接口用于获取用户已开通的预置服务、已创建的自定义接入点或已部署成功的我的服务三种类型服务,并展示每个服务的调用次数、调用失败率、调用总Tokens数、输入Tokens数、输出Tokens数、端到端时延等指标信息。仅保存30天内的统计数据。

接口约束

  • 区域限制:仅支持西南-贵阳一区域。
  • API流量限制:所有用户对该API的总请求次数上限,1分钟内不超过1000次。
  • 用户流量限制:单个用户对该API的请求次数上限,1分钟内不超过200次。
  • 限流响应:超出限流阈值时,API将返回HTTP 429状态码(Too Many Requests)。
  • 重试建议:遇到限流时,建议等待60秒后重试。

URI

POST /v1/{project_id}/maas/monitoring/list-service-statistics

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

参数解释:项目ID。关于如何获取项目ID,请参见获取项目ID和名称

约束限制:不涉及。

取值范围:只能由小写英文字母和数字组成,长度32字符。

默认取值:不涉及。

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

参数解释:用户Token。通过调用IAM服务的获取用户Token接口获取(响应消息头中X-Subject-Token的值)。获取方式请参见认证鉴权

约束限制:不涉及。

取值范围:不涉及。

默认取值:不涉及。

表3 请求Body参数

参数

是否必选

参数类型

描述

service_names

Array of strings

参数解释:服务名称列表,根据传入的服务名称列表筛选;不传则查找所有服务名称下的数据。支持模糊匹配服务名称。

约束限制:不涉及。

取值范围:服务列表只包含已开通的预置服务、已创建的自定义接入点或已部署成功的我的服务。

默认取值:不涉及。

service_type

Integer

参数解释:服务类型。

约束限制:不涉及。

取值范围:枚举类型,取值如下:

  • 1:我的服务,在“我的服务”页面部署的模型服务,更多信息,请参见部署模型服务
  • 2:预置服务,在“预置服务”页签开通的模型服务。具体操作,请参见开通预置服务
  • 3:自定义接入点,在“自定义接入点”页签创建的接入点服务。更多信息,请参见创建自定义接入点

默认取值:不涉及。

api_keys

Array of strings

参数解释:API Key列表,根据传入的API Key列表筛选。

Maas的服务支持API Key调用和在线体验两种方式。请参见管理API KeyMaaS在线体验

  • 如果需查询在线体验调用统计信息,可在数组内传入一个空字符串("")。
  • 如果需要查API Key下的调用数据,可在数组内传入API Key。
  • 如果不传该入参则查找所有API Key与在线体验下的数据。

约束限制:不涉及。

取值范围: 传入的API Key需满足长度 1-128 字符,仅支持大小写字母、数字、下划线 (_)、短横线 (-)。

默认取值:不涉及。

ips

Array of strings

参数解释:IP地址列表,指已产生调用量的客户端源IP地址,不传则查询用户全部IP地址下的数据。可使用查询IP列表接口查询IP地址。

约束限制:需符合IP地址格式。

取值范围:不涉及。

默认取值:不涉及。

start_time

Long

参数解释:开始时间,毫秒时间戳。

约束限制:结束时间与开始时间相差不超过30天。

取值范围:数值大于0,小于等于end_time的取值。

默认取值:不涉及。

end_time

Long

参数解释:结束时间,毫秒时间戳。

约束限制:结束时间与开始时间相差不超过30天。

取值范围:数值大于0。

默认取值:不涉及。

limit

Integer

参数解释:分页条数,表示本次最多返回多少条数据。为0则表示不分页返回全部数据。

约束限制:不涉及。

取值范围:大于等于0。

默认取值:0。

offset

Integer

参数解释:分页偏移量,表示跳过多少条数据查询后面的数据。

约束限制:不涉及。

取值范围:大于等于0。

默认取值:0。

timezone

String

参数解释:时区。

约束限制:不涉及。

取值范围:遵循IANA时区规范(如Asia/Shanghai、UTC)。

默认取值:Asia/Shanghai(东八区)。

infer_type

String

参数解释:服务的推理类型。

取值范围:枚举类型,取值如下:

  • real_time:在线推理。
  • batch:批量推理(批量推理当前处于受限使用阶段,如需使用请提交工单)。

约束限制:不涉及。

默认取值:不涉及。

响应参数

状态码:200

表4 响应Body参数

参数

参数类型

描述

total

Integer

参数解释:查询到的数据总数。

取值范围:不涉及。

count

Integer

参数解释:当前返回分页最大数据条数。

取值范围:分页时其值等于入参limit,不分页时为查询到的数据总数。

items

Array of ServiceStatItem objects

参数解释:服务信息列表。

取值范围:服务列表只显示已开通的预置服务、已创建的自定义接入点或已部署成功的我的服务。

表5 ServiceStatItem

参数

参数类型

描述

service_id

String

参数解释:服务ID。

取值范围:不涉及。

service_name

String

参数解释:服务名称。

取值范围:不涉及。

request_count

Integer

参数解释:调用次数。

取值范围:不涉及。

error_count

Integer

参数解释:调用失败次数(当类型为批量推理时,该参数表示推理失败次数,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

error_rate

Double

参数解释:调用失败率(当类型为批量推理时,该参数表示推理失败率,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:0-1。

total_token

Double

参数解释:调用总Tokens数(千tokens)(当类型为批量推理时,该参数表示总Tokens数,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

prompt_token

Double

参数解释:输入Tokens数(千tokens)。

取值范围:不涉及。

completion_token

Double

参数解释:输出Tokens数。

取值范围:不涉及。

avg_latency

Double

参数解释:平均端到端时延(ms)。

取值范围:不涉及。

avg_ttft

Double

参数解释:平均首Tokens时延(ms)。

取值范围:不涉及。

avg_tpot

Double

参数解释:平均增量Tokens时延(ms)。

取值范围:不涉及。

infer_times

Integer

参数解释:推理总量(次)(该参数与批量推理有关,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

scc_count

Integer

参数解释:调用成功次数(当类型为批量推理时,该参数表示推理成功次数,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

avg_consume_time

Double

参数解释:平均任务处理时长(分钟)(该参数与批量推理有关,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

completion_tasks_count

Integer

参数解释:已完成任务数(该参数与批量推理有关,批量推理当前处于受限使用阶段,如需使用请提交工单)。

取值范围:不涉及。

cache_token

Double

参数解释:缓存命中数(千tokens)。

取值范围:不涉及。

cache_hit_ratio

Double

参数解释:缓存命中率,缓存命中的Tokens数/输入的Tokens数。

取值范围:不涉及。

avg_generation_time

Double

参数解释:平均生成时长,平均生成每图片/视频实际花费的时间,仅视频、图片类模型。

取值范围:不涉及。

generation_type

String

参数解释:模型类型。

取值范围:模型类型取值如下:

  • Text Generation:文本生成类模型。
  • Video Generation:视频生成类模型。
  • Image Generation:图像生成类模型。
  • Vector Model:文本向量化。
  • Embedding: Embedding模型。
  • Image Understanding:图像理解类模型。
  • Rerank:重排序类模型。

状态码:400

表6 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:错误码,标识错误类型,详情请参考MaaS错误码

取值范围:不涉及。

error_msg

String

参数解释:错误描述信息。详情请参考MaaS错误码

取值范围:不涉及。

请求示例

查询用户预置服务在线推理时间在1770048000000到1770103717647之间的调用统计信息,数据分页返回,每页最多100条。

v1/{{project_id}}/maas/monitoring/list-service-statistics

{
  "start_time" : 1770048000000,
  "end_time" : 1770103717647,
  "service_type" : 2,
  "limit" : 100,
  "offset" : 0,
  "service_names" : [ ],
  "infer_type" : "real_time"
}

响应示例

状态码:200

成功响应。

{
  "total" : 6,
  "count" : 100,
  "items" : [ {
    "service_id" : "21699c35-f333-462b-8a5d-66599926c26f",
    "service_name" : "DeepSeek-R1",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 47.872,
    "prompt_token" : 15.104,
    "completion_token" : 32.768,
    "avg_latency" : 33548.47,
    "avg_ttft" : 343.83,
    "avg_tpot" : 32.46,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  }, {
    "service_id" : "3f23f78d-96e3-4146-885a-74fc392ed190",
    "service_name" : "DeepSeek-V3.2",
    "generation_type" : "Text Generation",
    "request_count" : 35,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 68.11,
    "prompt_token" : 32.27,
    "completion_token" : 35.84,
    "avg_latency" : 35744.14,
    "avg_ttft" : 1139.02,
    "avg_tpot" : 33.73,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  }, {
    "service_id" : "44e8ee1d-890e-4f8d-9b05-2b2f03a9e514",
    "service_name" : "DeepSeek-V3",
    "generation_type" : "Text Generation",
    "request_count" : 17,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 33.065,
    "prompt_token" : 15.657,
    "completion_token" : 17.408,
    "avg_latency" : 30236.35,
    "avg_ttft" : 328.66,
    "avg_tpot" : 29.24,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  }, {
    "service_id" : "780caccf-c894-4fd9-8a8e-ba31f1c644fe",
    "service_name" : "Qwen3-32B-32K",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 70.316,
    "prompt_token" : 32.48,
    "completion_token" : 37.836,
    "avg_latency" : 21912.5,
    "avg_ttft" : 349.18,
    "avg_tpot" : 18.2,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  }, {
    "service_id" : "8f658111-64af-44dd-bd3b-a78ec500bc88",
    "service_name" : "DeepSeek-V3.2-Exp",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 57.17,
    "prompt_token" : 15.088,
    "completion_token" : 42.082,
    "avg_latency" : 36555.44,
    "avg_ttft" : 0,
    "avg_tpot" : 0,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  }, {
    "service_id" : "ecd6ff0d-4634-4a50-bbe5-641c27b26087",
    "service_name" : "DeepSeek-V3.1",
    "generation_type" : "Text Generation",
    "request_count" : 32,
    "error_count" : 0,
    "error_rate" : 0,
    "total_token" : 59.302,
    "prompt_token" : 29.568,
    "completion_token" : 29.734,
    "avg_latency" : 31596.78,
    "avg_ttft" : 504.26,
    "avg_tpot" : 32.93,
    "avg_generation_time" : 0,
    "completion_tasks_count" : 0,
    "infer_times" : 0,
    "scc_count" : 0,
    "avg_consume_time" : 0,
    "cache_token" : 0,
    "cache_hit_ratio" : 0
  } ]
}

状态码:400

失败响应。

{
  "error_code" : "ModelArts.0104",
  "error_msg" : "参数无效,问题:结束时间不能早于开始时间。"
}

状态码

状态码

描述

200

成功响应

400

失败响应。

错误码

请参见错误码

相关文档