更新时间:2024-01-11 GMT+08:00

GPU加速型

GPU加速型云服务器(GPU Accelerated Cloud Server,GACS)能够提供强大的浮点计算能力,从容应对高实时、高并发的海量计算场景。

GPU加速型云服务器包括G系列和P系列两类。其中:
  • G系列:图形加速型弹性云服务器,适合于3D动画渲染、CAD等。
  • P系列:计算加速型或推理加速型弹性云服务器,适合于深度学习、科学计算、CAE等。

GPU加速实例总览

主售:计算加速型P2s推理加速型Pi2

在售:除主售外的其他GPU机型均为在售机型,如果在售机型售罄,推荐使用主售机型

图形加速增强型G6

概述

G6型弹性云服务器使用NVIDIA Tesla T4 GPU显卡,能够支持DirectX、OpenGL、Vulkan接口,提供16GiB显存,理论性能Pixel Rate:101.8GPixel/s,Texture Rate:254.4GTexel/s,满足专业级的图形处理需求。

请按需选择您所需要的类型和规格。

规格

表1 G6型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽(Gbps)

最大收发包能力

(万PPS)

网卡多队列数

网卡个数上限

GPU

显存

(GiB)

虚拟化类型

g6.4xlarge.4

16

64

15/8

200

8

8

1 × T4

16

KVM

g6.6xlarge.4

24

96

25/15

200

8

8

1 × T4

16

KVM

g6.9xlarge.7

36

252

25/15

200

16

8

1 × T4

16

KVM

g6.18xlarge.7

72

504

30/30

400

32

16

2 × T4

32

KVM

G6弹性云服务器功能如下

  • 处理器:第二代英特尔® 至强® 可扩展处理器 6266,主频3.0GHz,睿频3.4GHz。
  • 支持图形加速接口:
    • DirectX 12、Direct2D、DirectX Video Acceleration (DXVA)
    • OpenGL 4.5
    • Vulkan 1.0
  • 支持CUDA和OpenCL。
  • 支持NVIDIA T4 GPU卡。
  • 支持图形加速应用。
  • 支持CPU重载推理应用。
  • 自动化的调度G6型弹性云服务器到装有NVIDIA T4 GPU卡的可用区。
  • 内置1个NVENC和2个NVDEC。

常规支持软件列表

G6型弹性云服务器主要用于图形加速场景,例如图像渲染、云桌面、3D可视化。应用软件如果依赖GPU的DirectX、OpenGL硬件加速能力可以使用G6型云服务器。常用的图形处理软件支持列表如下:

  • AutoCAD
  • 3DS MAX
  • MAYA
  • Agisoft PhotoScan
  • ContextCapture

使用须知

  • G6型弹性云服务器当前支持如下版本的操作系统:
    • Windows Server 2019 标准版 64bit
    • Windows Server 2016 标准版 64bit
    • CentOS 8.2 64bit
    • CentOS 7.6 64bit
    • Ubuntu Server 20.04 64bit
    • Ubuntu Server 18.04 64bit
  • 使用公共镜像创建的G6型弹性云服务器默认已安装特定版本的GRID驱动,但GRID License需自行购买和配置使用,请提前确认云GRID驱动版本是否符合需求,并配置GRID License。

    配置GRID License步骤请参考GPU加速型实例安装GRID驱动

  • 使用私有镜像创建的G6型弹性云服务器,请确认在制作私有镜像时安装GRID驱动。如果未安装,请在创建完成后安装GRID驱动,以实现图形加速功能。

    详细安装操作请参考GPU加速型实例安装GRID驱动

图形加速增强型G5

概述

G5型弹性云服务器基于NVIDIA GRID虚拟化GPU技术,能够提供全面的专业级的图形加速能力。G5型弹性云服务器使用NVIDIA Tesla V100 GPU显卡,能够支持DirectX、OpenGL、Vulkan接口,提供1GiB显存规格,满足从入门级到专业级的图形处理需求。

请选择您所需要的类型和规格。

规格
表2 G5型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽

(Gbps)

最大收发包能力

(万PPS)

网卡多队列数

GPU

显存

(GiB)

虚拟化类型

g5.xlarge.2

4

8

4/1.3

20

2

V100-1Q

1

KVM

g5.2xlarge.2

8

16

6/2

35

4

V100-2Q

2

KVM

g5.4xlarge.4

16

64

10/4

50

8

V100-8Q

8

KVM

V100-xQ,表示云服务器使用GRID技术将V100 GPU虚拟为不同规格和型号的vGPU, x对应于vGPU的显存大小,Q表示该类型的vGPU主要适用于工作站和桌面场景。更多关于GRID虚拟GPU的介绍,请参见NVIDIA官方文档

G5型弹性云服务器功能如下
  • 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz,或英特尔® 至强® 可扩展处理器 6151,主频3.0GHz,睿频3.4GHz。
  • 支持图形加速接口:
    • DirectX 12、Direct2D、DirectX Video Acceleration (DXVA)
    • OpenGL 4.5
    • Vulkan 1.0
  • 支持CUDA和OpenCL。
  • 支持Quadro vDWS特性,为专业级图形应用提供加速。
  • 支持NVIDIA V100 GPU卡。
  • 支持图形加速应用。
  • 提供GPU硬件虚拟化(vGPU)。
  • 自动化的调度G5型弹性云服务器到装有NVIDIA V100 GPU卡的可用区。
  • 可以提供最大显存16GiB,分辨率为4096×2160的图形图像处理能力。

常规支持软件列表

G5型弹性云服务器主要用于图形加速场景,例如图像渲染、云桌面、3D可视化。应用软件如果依赖GPU的DirectX、OpenGL硬件加速能力可以使用G5型云服务器。常用的图形处理软件支持列表如下:
  • AutoCAD
  • 3DS MAX
  • MAYA
  • Agisoft PhotoScan
  • ContextCapture

使用须知

  • G5型弹性云服务器当前支持如下版本的操作系统:
    • Windows Server 2019 Standard 64bit
    • Windows Server 2016 Standard 64bit
    • CentOS 8.2 64bit
    • CentOS 7.6 64bit
    • CentOS 7.5 64bit
    • Ubuntu Server 20.04 64bit
    • Ubuntu Server 18.04 64bit
  • G5型Windows操作系统云服务器启动时默认加载了GRID驱动,使用vGPU显卡作为默认视频输出,暂不支持使用管理控制台提供的“远程登录”功能。请使用RDP协议(如Windows远程桌面MSTSC)访问G5型实例,之后安装远程访问工具,如VNC工具等第三方VDI工具。
  • G5型弹性云服务器,需在弹性云服务器创建完成后配置GRID License使用。
  • 使用公共镜像创建的G5型弹性云服务器默认已安装特定版本的GRID驱动,但GRID License需自行购买和配置使用,请提前确认云GRID驱动版本是否符合需求,并配置GRID License。

    配置GRID License步骤请参考GPU加速型实例安装GRID驱动

  • 使用私有镜像创建的G5型弹性云服务器,请确认在制作私有镜像时安装GRID驱动。如果未安装,请在创建完成后安装GRID驱动,以实现图形加速功能。

    详细安装操作请参考GPU加速型实例安装GRID驱动

图形加速增强型G3

概述

G3型弹性云服务器基于PCI直通技术,独享整张GPU卡,提供专业级的图形加速能力。同时,G3型弹性云服务器使用NVIDIA Tesla M60 GPU卡,能够支持DirectX、OpenGL接口,可以提供最大显存16GiB,支持最大4096 × 2160分辨率,是专业级图形工作站的首选。

规格
表3 G3型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽

(Gbps)

最大收发包能力

(万PPS)

网卡多队列数

GPU

显存

(GiB)

虚拟化类型

g3.4xlarge.4

16

64

8/2.5

50

2

1 × M60核心

1×8

KVM

g3.8xlarge.4

32

128

10/5

100

4

2 × M60核心

2×8

KVM

G3型弹性云服务器功能如下:
  • 处理器:英特尔® 至强® 处理器 E5-2697 v4,主频2.3GHz,睿频3.5GHz。
  • 支持专业级图形加速接口。
  • 支持NVIDIA M60 GPU卡。
  • 支持图形加速应用。
  • 提供GPU直通的能力。
  • 自动化的调度G3型弹性云服务器到装有NVIDIA M60 GPU卡的可用区。
  • 可以提供最大显存16GiB,分辨率为4096×2160的图形图像处理能力。

使用须知

  • G3型弹性云服务器当前支持如下版本的操作系统:
    • Windows Server 2019 Standard 64bit
    • Windows Server 2016 Standard 64bit
  • G3型Windows操作系统云服务器启动时默认加载了GRID驱动,使用vGPU显卡作为默认视频输出,暂不支持使用管理控制台提供的“远程登录”功能。请使用RDP协议(如Windows远程桌面MSTSC)访问G3型实例,之后安装远程访问工具,如VNC工具等第三方VDI工具。
  • 使用公共镜像创建的G3型弹性云服务器默认已安装特定版本的GRID驱动。
  • 使用私有镜像创建的G3型弹性云服务器,请确认在制作私有镜像时安装GRID驱动。如果未安装,请在创建完成后安装GRID驱动,以实现图形加速功能。详细安装操作请参考GPU加速型实例安装GRID驱动

计算加速型P2s

概述

P2s型弹性云服务器采用NVIDIA Tesla V100 GPU,在提供云服务器灵活性的同时,提供高性能计算能力和优秀的性价比。P2s型弹性云服务器能够提供超高的通用计算能力,适用于AI深度学习、科学计算,在深度学习训练、科学计算、计算流体动力学、计算金融、地震分析、分子建模、基因组学等领域都能表现出巨大的计算优势。

规格

表4 P2s型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽(Gbps)

最大收发包能力(万PPS)

网卡多队列数

网卡个数上限

GPU

GPU连接技术

显存(GiB)

虚拟化类型

p2s.2xlarge.8

8

64

10/4

50

4

4

1 × V100

PCIe Gen3

1 × 32GiB

KVM

p2s.4xlarge.8

16

128

15/8

100

8

8

2 × V100

PCIe Gen3

2 × 32GiB

KVM

p2s.8xlarge.8

32

256

25/15

200

16

8

4 × V100

PCIe Gen3

4 × 32GiB

KVM

p2s.16xlarge.8

64

512

30/30

400

32

8

8 × V100

PCIe Gen3

8 × 32GiB

KVM

P2s型弹性云服务器功能如下:
  • 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz,或英特尔® 至强® 可扩展处理器 6151,主频3.0GHz,睿频3.4GHz。
  • 支持NVIDIA Tesla V100 GPU卡,每台云服务器支持最大8张Tesla V100显卡。
  • 支持NVIDIA CUDA并行计算,支持常见的深度学习框架Tensorflow、Caffe、PyTorch、MXNet等。
  • 单精度能力14 TFLOPS,双精度能力7 TFLOPS。
  • 支持NVIDIA Tensor Core能力,深度学习混合精度运算能力达到112 TFLOPS。
  • 单实例最大网络带宽30Gb/s。
  • 使用32GiB HBM2显存,显存带宽900Gb/s。
  • 完整的基础能力:
    • 网络自定义,自由划分子网、设置网络访问策略。
    • 海量存储,弹性扩容,支持备份与恢复,让数据更加安全。
    • 弹性伸缩,快速增加或减少云服务器数量。
  • 灵活选择:

    与普通云服务器一样,P2s型云服务器可以做到分钟级快速发放。

  • 优秀的超算生态:

    拥有完善的超算生态环境,用户可以构建灵活弹性、高性能、高性价比的计算平台。大量的HPC应用程序和深度学习框架已经可以运行在P2s实例上。

常规软件支持列表

P2s型云服务器主要用于计算加速场景,例如深度学习训练、推理、科学计算、分子建模、地震分析等场景。应用软件如果使用到GPU的CUDA并行计算能力,可以使用P2s型云服务器。常用的软件支持列表如下:
  • Tensorflow、Caffe、PyTorch、MXNet等常用深度学习框架
  • RedShift for Autodesk 3dsMax、V-Ray for 3ds Max等支持CUDA的GPU渲染
  • Agisoft PhotoScan
  • MapD
使用须知
  • P2s型云服务器当前支持如下版本的操作系统:
    • Windows Server 2016 Standard 64bit
  • 使用公共镜像创建的P2s型云服务器,默认已安装Tesla驱动。
  • 使用私有镜像创建的P2s型云服务器,请确认在制作私有镜像时已安装Tesla驱动。如果未安装,请在创建完成后安装驱动,以实现计算加速功能。详细操作请参考GPU加速型实例安装Tesla驱动及CUDA工具包

计算加速型P2

概述

P2型弹性云服务器采用NVIDIA Tesla V100 GPU,单/双精度计算能力较之上一代GPU提升50%,深度学习计算能力达到112 TFLOPS。

规格

表5 P2型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽(Gbps)

最大收发包能力(万PPS)

网卡多队列数

网卡个数上限

GPU

显存

(GiB)

本地盘

(GiB )

虚拟化类型

p2.2xlarge.8

8

64

10/4

50

2

12

1 × V100

1 × 16

1 × 800

KVM

p2.4xlarge.8

16

128

15/8

100

4

12

2 × V100

2 × 16

2 × 800

KVM

p2.8xlarge.8

32

256

25/15

200

8

12

4 × V100

4 × 16

4 × 800

KVM

P2型弹性云服务器功能如下:
  • 处理器:Intel Xeon E5-2690V4 2.6GHz。
  • 支持NVIDIA Tesla V100 GPU卡。
  • 提供GPU硬件直通能力。
  • 单精度能力14 TFLOPS,双精度能力7 TFLOPS,深度学习计算能力达到112 TFLOPS。
  • 最大网络带宽12Gb/s。
  • 使用16GiB HBM2显存,显存带宽900Gb/s。
  • 使用800GiB的NVMe SSD卡作为本地临时存储。
  • 完整的基础能力:
    • 网络自定义,自由划分子网、设置网络访问策略。
    • 海量存储,弹性扩容,支持备份与恢复,让数据更加安全。
    • 弹性伸缩,快速增加或减少云服务器数量。
  • 灵活选择:

    与普通云服务器一样,P2型云服务器可以做到分钟级快速发放。

  • 优秀的超算生态:

    拥有完善的超算生态环境,用户可以构建灵活弹性、高性能、高性价比的计算平台。大量的HPC应用程序和深度学习框架已经可以运行在P2实例上。

常规软件支持列表

P2型云服务器主要用于计算加速场景,例如深度学习训练、推理、科学计算、分子建模、地震分析等场景。应用软件如果使用到GPU的CUDA并行计算能力,可以使用P2型云服务器。常用的软件支持列表如下:
  • Tensorflow、Caffe、PyTorch、MXNet等常用深度学习框架
  • RedShift for Autodesk 3dsMax、V-Ray for 3ds Max等支持CUDA的GPU渲染
  • Agisoft PhotoScan
  • MapD
使用须知
  • P2型云服务器包含NVMe SSD本地盘,关机后仍然收费,如果停止计费,需删除弹性云服务器。了解更多请参考弹性云服务器关机后还会计费吗?
  • P2型云服务器配置了NVMe SSD本地盘,专为深度学习训练、HPC高性能计算等对存储I/O性能有极高要求的业务场景设计。本地盘与特定规格的云服务器绑定,不可单独购买,不可卸载并挂载到另一台云服务器上使用。

    P2型云服务器配置的NVMe SSD本地盘有丢失数据的风险(比如NVMe SSD故障或宿主机故障时),强烈建议您在本地NVMe SSD磁盘中存放临时数据,如需存放重要数据,请做好数据备份。

  • P2型弹性云服务器不支持规格变更。
  • P2型弹性云服务器不支持自动恢复功能。
  • P2型云服务器当前支持如下版本的操作系统:

    Ubuntu Server 16.04 64bit

  • 删除P2型弹性云服务器后,本地NVMe SSD磁盘的数据会被自动清除。
  • 使用公共镜像创建的P2型云服务器,默认已安装Tesla驱动。
  • 使用私有镜像创建的P2型云服务器,请确认在制作私有镜像时已安装Tesla驱动。如果未安装,请在创建完成后安装驱动,以实现计算加速功能。详细操作请参考GPU加速型实例安装Tesla驱动及CUDA工具包

推理加速型Pi2

概述

Pi2型弹性云服务器采用专为AI推理打造的NVIDIA Tesla T4 GPU,能够提供超强的实时推理能力。Pi2型弹性云服务器借助T4的INT8运算器,能够提供最大130TOPS的INT8算力。Pi2也可以支持轻量级训练场景。

规格

表6 Pi2型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽(Gbps)

最大收发包能力

(万PPS)

网卡多队列数

网卡个数上限

GPU

显存

(GiB)

本地盘

虚拟化类型

pi2.2xlarge.4

8

32

10/4

50

4

4

1 × T4

1 × 16

-

KVM

pi2.4xlarge.4

16

64

15/8

100

8

8

2 × T4

2 × 16

-

KVM

pi2.8xlarge.4

32

128

25/15

200

16

8

4 × T4

4 × 16

-

KVM

Pi2型弹性云服务器功能如下

  • 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz,或英特尔® 至强® 可扩展处理器 6151,主频3.0GHz,睿频3.4GHz。
  • 支持NVIDIA Tesla T4 GPU卡,单实例最大支持4张T4 GPU卡。
  • 提供GPU硬件直通能力。
  • 单GPU单精度计算能力最高8.1 TFLOPS。
  • 单GPU INT8计算能力最高130 TOPS。
  • 单GPU提供16GiB GDDR6显存,带宽320GiB/s。
  • 内置1个NVENC和2个NVDEC。

常规支持软件列表

Pi2实例主要用于GPU推理计算场景,例如图片识别、语音识别、自然语言处理等场景。也可以支持轻量级训练场景。

常用的软件支持列表如下:

  • Tensorflow、Caffe、PyTorch、MXNet等深度学习框架。

使用须知

  • Pi2型云服务器,关机后基础资源(包括vCPU、内存、镜像、GPU)不计费,但系统盘仍会收取容量对应的费用。 如有其他绑定的产品,如云硬盘、弹性IP、带宽等,按各自产品的计费方法进行收费。

    Pi2型云服务器,关机后资源会被释放,下次开机时如果后台资源不足,可能会导致云服务器开机失败。如果您需要长期使用该云服务器,建议保持开机状态。

  • Pi2型弹性云服务器当前支持如下版本的操作系统:
    • Windows Server 2019 Standard 64bit
    • Windows Server 2016 Standard 64bit
    • CentOS 7.5 64bit
  • Pi2型云服务器,所在物理机发生故障时,云服务器支持自动恢复。
  • 使用公共镜像创建的Pi2型云服务器,默认已安装Tesla驱动。
  • 使用私有镜像创建的Pi2型云服务器,请确认在制作私有镜像时已安装Tesla驱动。如果未安装,请在云服务器创建完成后安装驱动,以实现计算加速功能。详细操作请参考GPU加速型实例安装Tesla驱动及CUDA工具包