AI加速型
AI加速型云服务器(AI Accelerated Cloud Server,AIACS)是专门为AI业务提供加速服务的云服务器。搭载昇腾系列芯片及软件栈。
该类型弹性云服务器默认开启超线程,每个vCPU对应一个底层超线程HT(Hyper-Threading)。
AI推理加速型系列:搭载自研昇腾310芯片,为AI推理业务加速。
AI加速型实例总览
规格名称 |
计算 |
磁盘类型 |
网络 |
---|---|---|---|
Ai1s |
|
|
|
Ai1 |
|
Ai1s为Ai1的增强机型,建议首选Ai1s。
- Ai1s使用的驱动和CANN仅支持21.0.2(3.0.1)版本,不支持驱动和CANN升级。
- Ai1使用的驱动版本为V100R001C32B080,不支持驱动和CANN升级。
适用于AI加速型实例的公共镜像列表
类别 |
实例 |
支持的公共镜像 |
---|---|---|
AI推理加速增强I型 |
Ai1s |
Ubuntu Server 18.04 64bit CentOS 7.6 64bit |
AI推理加速I型 |
Ai1 |
Ubuntu Server 16.04 64bit CentOS 7.4 64bit |
AI推理加速增强I型Ai1s
概述
AI推理加速增强I型实例Ai1s是以昇腾310(Ascend 310)芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力AI推理业务的快速普及。通过AI推理加速型实例Ai1s将Ascend 310芯片的计算加速能力在云平台上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。
AI推理加速型实例Ai1s基于Atlas 300I加速卡设计,更多详细信息请参考昇腾社区。
AI加速型云服务器可用于机器视觉,安防监控,智慧园区,智慧城市,智慧交通,智慧零售,互联网音视频,视频编解码等业务场景。
规格
规格名称 |
vCPU |
内存 (GiB) |
最大带宽/基准带宽 |
最大收发包能力 (万/PPS) |
Ascend 310 |
Ascend RAM (GiB) |
网卡多队列数 |
网卡个数上限 |
虚拟化类型 |
---|---|---|---|---|---|---|---|---|---|
ai1s.3xlarge.2 |
12 |
24 |
12/6 |
75 |
4 |
32 |
4 |
6 |
KVM |
ai1s.4xlarge.2 |
16 |
32 |
15/8 |
100 |
4 |
32 |
8 |
8 |
KVM |
ai1s.5xlarge.2 |
20 |
40 |
25/15 |
200 |
4 |
32 |
8 |
8 |
KVM |
ai1s.9xlarge.2 |
36 |
72 |
30/18 |
550 |
4 |
32 |
16 |
8 |
KVM |
ai1s.large.4 |
2 |
8 |
4/1.3 |
20 |
1 |
8 |
2 |
2 |
KVM |
ai1s.xlarge.4 |
4 |
16 |
6/2 |
35 |
2 |
16 |
2 |
3 |
KVM |
ai1s.2xlarge.4 |
8 |
32 |
10/4 |
50 |
4 |
32 |
4 |
4 |
KVM |
ai1s.4xlarge.4 |
16 |
64 |
15/8 |
100 |
8 |
64 |
8 |
8 |
KVM |
ai1s.8xlarge.4 |
32 |
128 |
25/15 |
200 |
16 |
128 |
8 |
8 |
KVM |
功能
Ai1s加速型弹性云服务器功能如下:
- 处理器与内存配比为1:4或1:2。
- 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz,或英特尔® 至强® 可扩展处理器 6151,主频3.0GHz,睿频3.4GHz。
- 支持Ascend 310芯片,每张Atlas 300I加速卡包含4个Ascend 310芯片。
- 单芯片整数精度(INT8)16TeraOPS。
- 单芯片提供8GiB显存,内存带宽50GiB/s。
- 内置硬件视频编解码引擎,支持5路全高清视频解码器(H.264/265)。
使用须知
- Ai1s实例支持如下版本的公共镜像:
- Ubuntu Server 18.04 64bit
- CentOS 7.6 64bit
- Ai1s型弹性云服务器不支持规格变更。
- Ai1s型云服务器所在物理机发生故障时,云服务器支持自动恢复。
AI推理加速I型Ai1
概述
AI推理加速型实例Ai1是以昇腾310(Ascend 310)芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力AI推理业务的快速普及。通过AI推理加速型实例Ai1将Ascend 310芯片的计算加速能力在云平台上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。
AI推理加速型实例Ai1基于Atlas 300I加速卡设计,更多详细信息请参考昇腾社区。
AI加速型云服务器可用于机器视觉、语音识别、自然语言处理通用技术,支撑智能零售、智能园区、机器人云大脑、平安城市等场景。
规格
规格名称 |
vCPU |
内存 (GiB) |
最大带宽/基准带宽 |
最大收发包能力 (万/PPS) |
Ascend 310 |
Ascend RAM (GiB) |
网卡多队列数 |
网卡个数上限 |
虚拟化类型 |
---|---|---|---|---|---|---|---|---|---|
ai1.large.4 |
2 |
8 |
4/1.3 |
20 |
1 |
8 |
2 |
2 |
KVM |
ai1.xlarge.4 |
4 |
16 |
6/2 |
35 |
2 |
16 |
2 |
3 |
KVM |
ai1.2xlarge.4 |
8 |
32 |
10/4 |
50 |
4 |
32 |
4 |
4 |
KVM |
ai1.4xlarge.4 |
16 |
64 |
15/8 |
100 |
8 |
64 |
8 |
8 |
KVM |
ai1.8xlarge.4 |
32 |
128 |
25/15 |
200 |
16 |
128 |
8 |
8 |
KVM |
功能
Ai1加速型弹性云服务器功能如下:
- 处理器与内存配比为1:4。
- 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz。或英特尔® 至强® 可扩展处理器 6151,主频3.0GHz,睿频3.4GHz。
- 支持Ascend 310芯片,每张Atlas 300I加速卡包含4个Ascend 310芯片。
- 单芯片半精度(FP16)8TeraFLOPS。
- 单芯片整数精度(INT8)16TeraOPS。
- 单芯片提供8GiB显存,内存带宽50GiB/s。
- 内置硬件视频编解码引擎,支持16路全高清视频解码器(H.264/265)。
使用须知
- Ai1实例支持如下版本的操作系统:
- Ubuntu Server 16.04 64bit
- CentOS 7.4 64bit
- Ai1型弹性云服务器不支持规格变更。
- Ai1型云服务器所在物理机发生故障时,云服务器支持自动恢复。
如何使用AI加速型云服务器
使用AI加速型云服务器的流程如下:
- 创建云服务器,详细步骤,请参考自定义购买ECS。
- 在“规格”设置时,选择AI加速型相关规格。
- 在“镜像”设置时,可以选择“公共镜像”和“私有镜像”。
- 公共镜像:已经默认安装了CANN 3.1.0的开发套件包,并配置了环境变量,请验证环境的可用性。
- 私有镜像:需要安装驱动、固件和开发套件,并配置环境变量。详细步骤,请参考昇腾文档中心对应版本的《CANN软件安装指南》。
- 远程登录云服务器。
对于Linux操作系统的云服务器,登录时请以SSH密码方式登录。具体操作,请参见密码方式登录Linux弹性云服务器(SSH方式)。
- 验证环境可用性。
请参考昇腾文档中心中对应CANN版本《应用开发指南》中的“样例使用指导”,选择一个样例进行编译运行,验证环境的正确性。
例如,选择“基于Caffe ResNet-50网络实现图片分类(图片解码+缩放+同步推理)”样例进行验证。