更新时间:2025-06-18 GMT+08:00
分享

SDK接口概览

表1总结了EMS Python SDK支持的接口及功能描述,每个接口的详细介绍和示例代码请前往接口详情页查看。

SDK API概览

表1 Python SDK API概览

接口名

方法

功能描述

初始化

Ems.init

初始化EMS客户端。

获取ContextCaching对象

Ems.get_cc

获取ContextCaching对象,用户后续可以访问对象中的读取/保存KVCache等接口。

健康检查

Ems.check_health

EMS健康检查,可以通过接口探测EMS内存池是否正常工作。

同步保存KVCache

ContextCaching.save

同步保存推理请求产生的KVCache到EMS内存池。

异步保存KVCache

ContextCaching.async_save

异步保存推理请求产生的KVCache到EMS内存池。

同步加载KVCache

ContextCaching.load

从EMS内存池中同步加载KVCache到加速卡显存。

异步加载KVCache

ContextCaching.async_load

从EMS内存池中异步加载KVCache到加速卡显存。

相关文档