更新时间:2024-01-12 GMT+08:00
分享

附录

Gearbox程序工作流程介绍

本方案以Maya渲染任务为示例,演示Gearbox程序如何自动进行Deadline集群弹性扩缩容。

  1. 提交Maya任务(仅供参考)。

    图1 任务示例

  2. 查看云监控告警状态。当作业状态为“queued”时,代表作业job在排队中,当前集群计算节点资源不足。此时查看自定义监控中workload值>1,将通知弹性伸缩实例进行自动扩容。

    图2 workload值变化状态

  3. 登录弹性伸缩AS控制台,单击打开该方案创建的弹性伸缩组,查看弹性伸缩正在创建实例。

    图3 触发弹性扩容

  4. 弹性扩容的ECS实例,使用固定资源池中计算节点镜像创建,登录密码与原服务器保持一致,登录创建好的实例,并运行Deadline程序即可被纳管进入Deadline集群,参与作业。

    图4 弹性扩容的ECS实例

  5. 被纳管进入Deadline集群的可用ECS计算节点实例,Deadline调度节点(master)将会下发作业任务给这些实例。
  6. Gearbox将周期检查Deadline集群中计算节点node状态。检查空闲的node节点并node状态设置为DRAIN;检查集群中状态为DRAIN的node,是否还有任务正在该计算节点运行,如果没有,将该实例删除(成功后,node状态将变为DOWN);检查集群中状态为DOWN或DRAIN*的node,将node记录从Deadline集群移除。

    (参数说明:drain(节点故障),alloc(节点在用),idle(节点可用),down(节点下线),mix(节点部分占用,但仍有剩余资源)
    图5 将空闲实例状态修改为drain

  7. 登录弹性伸缩AS控制台,单击打开该方案创建的弹性伸缩组,查看弹性伸缩已删除实例。

    图6 空闲实例被移出

名词解释

基本概念、云服务简介、专有名词解释
  • 弹性云服务器ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。
  • 弹性文件服务SFS Turbo:为用户提供一个完全托管的共享文件存储,能够弹性伸缩至320TB规模,具备高可用性和持久性,为海量的小文件、低延迟高IOPS型应用提供有力支持。
  • Deadline:Deadline是AWS下属的Thinkbox软件公司的一款渲染农场软件。
  • Gearbox: Gearbox是一个华为云自研开源的资源协同系统。Gearbox系统与调度平台(Deadline)协同,协调云下、云上资源使用。支持自定义业务负载指标,提供基于指标的自动扩容能力,感知业务任务状态,闲置自动释放,提供无损的弹性伸缩能力。

相关文档