文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek&Qwen3基于Lite Server&Cluster推理/
DeepSeek&Qwen3模型基于Lite Server适配NPU的PD分离推理解决方案/
特性补充说明/
PD分离部署下图编译缓存使用操作/
图编译缓存特性说明
更新时间:2025-11-04 GMT+08:00
图编译缓存特性说明
场景描述
实现节点上的图编译缓存复用,加速模型推理启动速度和减小故障恢复时间。
约束限制
特性存在较多缓存不兼容情况,需要用户确保图编译缓存的准确性,不推荐使用该特性。
- 部署版本变化,缓存存在不兼容情况。
- 修改部署服务的启动参数,图编译缓存存在不兼容情况。
- 升级HDK版本,图编译缓存存在不兼容情况。
- DeepSeek图编译缓存目录权限必须设置为600,否则图编译缓存无效。
- 版本或者启动参数等发生变化,需要按照以下步骤生成新的图编译缓存,并配置新的图编译缓存目录。
- 多副本实例并发写入缓存存在问题。
父主题: PD分离部署下图编译缓存使用操作