Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.

Central de ajuda/ Elastic Cloud Server/ Visão geral de serviço/ x86 Especificações e Tipos de ECS/ Os ECS acelerados por GPU

Atualizado em 2023-04-28 GMT+08:00

Ver PDF

Os ECS acelerados por GPU

Os ECS acelerados por GPU fornecem excelentes recursos de computação de ponto flutuante. Eles são adequados para aplicativos que exigem computação massiva em tempo real e altamente simultânea.

Tipos de ECS acelerados por GPU

Recomendado: PI2 acelerado por inferência

Disponível agora: Todos os modelos de GPU, exceto os recomendados.

série G
- Melhoria acelerada por gráficos G5
Série P
- P2s acelerado por computação (recomendado)
- P2v acelerado por computação
- PI2 acelerado por inferência (recomendado)
- PI1 acelerado por inferência

Links úteis:

**Tabela 1** Os ECS acelerados por GPU
Classificação	Tipo ECS	GPU	Núcleos CUDA por GPU	Desempenho de GPU única	Cenário da aplicação	Rede	Observações
Gráficos-acelerados	G5	NVIDIA V100	5120	14 TFLOPS de computação de ponto flutuante de precisão única 7 TFLOPS de computação de ponto flutuante de dupla precisão 112 Tensor Cores TFLOPS para aceleração de aprendizagem profunda	Desktop em nuvem, renderização de imagens, visualização 3D e design gráfico de carga pesada	Suporte para IPv6	O login remoto no console de gerenciamento não está disponível. Para fazer login em tal ECS, use o VNC ou o VDI de terceiros.
Computação-acelerada	P2s	NVIDIA V100	5120	14 TFLOPS de computação de ponto flutuante de precisão única 7 TFLOPS de computação de ponto flutuante de dupla precisão 112 Tensor Cores TFLOPS para aceleração de aprendizagem profunda	Treinamento de aprendizado profundo de IA, computação científica, dinâmica de fluidos computacional, finanças computacionais, análise sísmica, modelagem molecular e genômica.	Suporte para IPv6	-
Computação-acelerada	P2v	NVIDIA V100 NVLink (passagem de GPU)	5120	15,7 TFLOPS de computação de ponto flutuante de precisão única 7,8 TFLOPS de computação de ponto flutuante de dupla precisão 125 Tensor Cores TFLOPS para aceleração de aprendizagem profunda NVLINK de 300 GiB/s	Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia	Suporte para IPv6	Nenhum
Inferência-acelerada	PI2	NVIDIA T4 (passagem de GPU)	2560	8,1 TFLOPS de computação de ponto flutuante de precisão única 130 TOPS INT8 260 TOPS INT4	Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia	-	Nenhum
Inferência-acelerada	PI1	NVIDIA P4 (passagem de GPU)	2560	5,5 TFLOPS de computação de ponto flutuante de precisão única	Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia	-	Nenhum

Imagens suportadas pelos ECS acelerados por GPU

**Tabela 2** Lista de imagens
Classificação	Tipo ECS	Imagem Suportada
Gráficos-acelerados	G5	Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit CentOS 7.5 64bit
Computação-acelerada	P2s	Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit Ubuntu Server 16.04 64bit CentOS 7.7 64bit CentOS 7.4 64bit
Computação-acelerada	P2v	Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit Ubuntu 16.04 64bit CentOS 7.4 64bit EulerOS 2.2 64bit
Inferência-acelerada	PI2	Windows Server 2016 Standard 64bit Ubuntu 16.04 64bit CentOS 7.5 64bit
Inferência-acelerada	PI1	Ubuntu 16.04 64bit Ubuntu 14.04 64bit CentOS 7.3 64bit

Melhoria acelerada por gráficos G5

Visão geral

Os ECS de G5 usam GPUs NVIDIA Tesla V100 e suportam DirectX, OpenGL e Vulkan. Esses ECS fornecem 16 GiB de memória de GPU e resolução de até 4096 x 2160, atendendo aos requisitos de processamento gráfico profissional.

Selecione o tipo e as especificações de ECS acelerado por GPU desejados.

Especificações

**Tabela 3** Especificações do G5 ECS
Variante	As vCPU	Memória (GiB)	Largura de banda máxima/garantida (Gbit/s)	Máximo PPS (10.000)	NIC Multi-fila	As GPU	Memória da GPU (GiB)	Tipo de virtualização
g5.8xlarge.4	32	128	25/15	200	16	1 x V100	16	KVM

Um ECS de g5.8xlarge.4 usa exclusivamente uma GPU V100 para aceleração gráfica profissional. Esse ECS pode ser usado para inferência de CPU de carga pesada.

Recursos do G5 ECS

CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 3,0 GHz de frequência base e 3,4 GHz de frequência turbo)
APIs de aceleração de gráficos
- DirectX 12, Direct2D, Aceleração de Vídeo DirectX (DXVA)
- O OpenGL 4.5
- Vulkan 1.0
CUDA e OpenCL
GPUs NVIDIA V100
Aplicações de aceleração gráfica
Inferência de CPU de carga pesada
Fluxo de aplicativos idêntico aos ECS comuns
Agendamento automático dos ECS de G5 para AZs onde as GPUs NVIDIA V100 são usadas
Especificação máxima de 16 GiB de memória da GPU e resolução de 4096 x 2160 para processamento de gráficos e vídeos

Software comum suportado

Os ECS de G5 são usados em cenários de aceleração gráfica, como renderização de vídeo, desktop em nuvem e visualização 3D. Se o software depender de aceleração de hardware GPU DirectX e OpenGL, use os ECS de G5. Os ECS de G5 suportam os seguintes softwares de processamento gráfico comumente usados:

AutoCAD
3DS MAX
MAYA
PhotoScan da Agisoft
ContextCapture
Software de modelagem 3D Smart3D

Notas

Os ECS de G5 são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- CentOS 7.5 64bit

Um ECS de G5 requer a configuração de uma licença GRID após a criação do ECS.
Os ECS de G5 criados usando uma imagem pública tiveram o driver GRID de uma versão específica instalado por padrão. No entanto, você precisa comprar e configurar a licença GRID por si mesmo. Certifique-se de que a versão do driver GRID atende aos requisitos de serviço.

Para obter instruções sobre como configurar uma licença GRID, consulte Instalando um driver GRID em um ECS acelerado por GPU.
Se um ECS de G5 for criado usando uma imagem privada, verifique se o driver GRID foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de gráficos após a criação do ECS.

Para obter detalhes, consulte Instalando um driver GRID em um ECS acelerado por GPU.

P2s acelerado por computação

Visão geral

Os ECS dos P2 usam GPUs NVIDIA Tesla V100 para fornecer flexibilidade, computação de alto desempenho e economia. Os ECS P2s oferecem excelentes recursos gerais de computação e têm pontos fortes em aprendizado profundo baseado em IA, computação científica, dinâmica de fluidos computacional (CFD), finanças computacionais, análise sísmica, modelagem molecular e genômica.

Especificações

**Tabela 4** Especificações do ECS dos P2
Variante	As vCPU	Memória (GiB)	Largura de banda máxima/garantida (Gbit/s)	Máximo PPS (10.000)	NIC Multi-fila	Máximo das NIC	As GPU	Conexão da GPU	Memória da GPU (GiB)	Tipo de virtualização
p2s.2xlarge.8	8	64	10/4	50	4	4	1 x V100	PCIe Gen3	1 x 32 GiB	KVM
p2s.4xlarge.8	16	128	15/8	100	8	8	2 x V100	PCIe Gen3	2 x 32 GiB	KVM
p2s.8xlarge.8	32	256	25/15	200	16	8	4 x V100	PCIe Gen3	4 x 32 GiB	KVM
p2s.16xlarge.8	64	512	30/30	400	32	8	8 x V100	PCIe Gen3	8 x 32 GiB	KVM

Recursos do P2s ECS

CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 .0 GHz de frequência base e 3,4 GHz de frequência turbo)
Até oito GPUs NVIDIA Tesla V100 em um ECS
Computação paralela NVIDIA CUDA e estruturas comuns de aprendizado profundo, como TensorFlow, Caffe PyTorch e MXNet
14 TFLOPS de computação de precisão única e 7 TFLOPS de computação de precisão dupla
Núcleos NVIDIA Tensor com 112 TFLOPS de computação de precisão simples e dupla para aprendizado profundo
Até 30 Gbit/s de largura de banda de rede em um único ECS
32 GiB de memória GPU HBM2 com uma largura de banda de 900 Gbit/s
Capacidades básicas abrangentes
As redes são definidas pelo usuário, as sub-redes podem ser divididas e as políticas de acesso à rede podem ser configuradas conforme necessário. O armazenamento em massa é usado, a expansão da capacidade elástica, bem como o backup e a restauração são suportados para tornar os dados mais seguros. O Auto Scaling permite que você adicione ou reduza o número dos ECS rapidamente.
Flexibilidade
Semelhante a outros tipos dos ECS, os ECS P2s podem ser provisionados em poucos minutos.
Excelente ecossistema de supercomputação
O ecossistema de supercomputação permite que você crie uma plataforma de computação flexível, de alto desempenho e econômica. Um grande número de aplicativos de HPC e estruturas de aprendizado profundo podem ser executados nos ECS de P2s.

Software comum suportado

Os ECS P2s são usados em cenários de aceleração de computação, como treinamento de aprendizado profundo, inferência, computação científica, modelagem molecular e análise sísmica. Se o software for necessário para suportar GPU CUDA, use os ECS de P2s. Os ECS P2s suportam os seguintes softwares comumente usados:

Estruturas comuns de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
Renderização de GPU CUDA suportada pelo RedShift para Autodesk 3dsMax e V-Ray para 3ds Max
PhotoScan da Agisoft
MapD

Notas

Os ECS de P2s são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.7 64bit
- CentOS 7.4 64bit
Por padrão, os ECS P2s criados usando uma imagem pública têm o driver Tesla instalado.
Se um ECS P2s for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.

P2v acelerado por computação

Visão geral

Os ECS P2v usam GPUs NVIDIA Tesla V100 e oferecem alta flexibilidade, computação de alto desempenho e alta relação custo-benefício. Esses ECS usam o NVLink da GPU para comunicação direta entre as GPUs, melhorando a eficiência da transmissão de dados. Os ECS P2v oferecem excelentes recursos gerais de computação e têm pontos fortes em aprendizado profundo baseado em IA, computação científica, dinâmica de fluidos computacional (CFD), finanças computacionais, análise sísmica, modelagem molecular e genômica.

Especificações

**Tabela 5** Especificações do P2v ECS
Variante	As vCPU	Memória (GiB)	Largura de banda máxima/garantida (Gbit/s)	Máximo PPS (10.000)	NIC Multi-fila	Máximo das NIC	As GPU	Conexão da GPU	Memória da GPU (GiB)	Tipo de virtualização
p2v.2xlarge.8	8	64	10/4	50	4	4	1 x V100	N/A	1 × 16 GiB	KVM
p2v.4xlarge.8	16	128	15/8	100	8	8	2 x V100	NVLink	2 × 16 GiB	KVM
p2v.8xlarge.8	32	256	25/15	200	16	8	4 x V100	NVLink	4 × 16 GiB	KVM
p2v.16xlarge.8	64	512	30/30	400	32	8	8 x V100	NVLink	8 × 16 GiB	KVM

Recursos do P2v ECS

CPU: Processadores 6151 escaláveis Intel® Xeon® (3,0 GHz de frequência base e 3,4 GHz de frequência turbo)
Até oito GPUs NVIDIA Tesla V100 em um ECS
Computação paralela NVIDIA CUDA e estruturas comuns de aprendizado profundo, como TensorFlow, Caffe PyTorch e MXNet
15,7 TFLOPS de computação de precisão única e 7,8 TFLOPS de computação de precisão dupla
Núcleos NVIDIA Tensor com 125 TFLOPS de computação de precisão simples e dupla para aprendizado profundo
Até 30 Gbit/s de largura de banda de rede em um único ECS
16 GiB de memória GPU HBM2 com uma largura de banda de 900 Gbit/s
Capacidades básicas abrangentes
As redes são definidas pelo usuário, as sub-redes podem ser divididas e as políticas de acesso à rede podem ser configuradas conforme necessário. O armazenamento em massa é usado, a expansão da capacidade elástica, bem como o backup e a restauração são suportados para tornar os dados mais seguros. O Auto Scaling permite que você adicione ou reduza o número dos ECS rapidamente.
Flexibilidade
Semelhante a outros tipos dos ECS, os ECS P2v podem ser provisionados em poucos minutos.
Excelente ecossistema de supercomputação
O ecossistema de supercomputação permite que você crie uma plataforma de computação flexível, de alto desempenho e econômica. Um grande número de aplicativos de HPC e estruturas de aprendizado profundo podem ser executados nos ECS de P2v.

Software comum suportado

Os ECS P2v são usados em cenários de aceleração de computação, como treinamento de aprendizado profundo, inferência, computação científica, modelagem molecular e análise sísmica. Se o software for necessário para suportar GPU CUDA, use os ECS de P2v. Os ECS P2v suportam os seguintes softwares comumente usados:

Estruturas comuns de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
Renderização de GPU CUDA suportada pelo RedShift para Autodesk 3dsMax e V-Ray para 3ds Max
PhotoScan da Agisoft
MapD

Notas

Os ECS de P2v são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.7 64bit
- EulerOS 2.5 64bit
Por padrão, os ECS P2v criados usando uma imagem pública têm o driver Tesla instalado.
Se um ECS P2v for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.

PI2 acelerado por inferência

Visão geral

Os ECS de PI2 usam GPUs NVIDIA Tesla T4 dedicadas para inferência de IA em tempo real. Esses ECS usam a calculadora T4 INT8 para até 130 TOPS de computação INT8. Os ECS de PI2 também podem ser usados para treinamento de carga leve.

Especificações

**Tabela 6** Especificações do PI2 ECS
Variante	As vCPU	Memória (GiB)	Largura de banda máxima/garantida (Gbit/s)	Máximo PPS (10.000)	NIC Multi-fila	Máximo das NIC	As GPU	Memória da GPU (GiB)	Discos Locais	Tipo de virtualização
pi2.2xlarge.4	8	32	10/4	50	4	4	1 x T4	1×16	N/A	KVM
pi2.4xlarge.4	16	64	15/8	100	8	8	2 x T4	2×16	N/A	KVM
pi2.8xlarge.4	32	128	25/15	200	16	8	4 x T4	4×16	N/A	KVM

Recursos do PI2 ECS

CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 .0 GHz de frequência base e 3,4 GHz de frequência turbo)
Até quatro GPUs NVIDIA Tesla T4 em um ECS
Passagem de hardware da GPU
Até 8,1 TFLOPS de computação de precisão única em uma única GPU
Até 130 TOPS de computação INT8 em uma única GPU
16 GiB de memória de GPU GDDR6 com uma largura de banda de 320 GiB/s em uma única GPU
Uma GPU NVENC integrada e duas NVDEC

Software comum suportado

Os ECS de PI2 são usados em cenários de computação de inferência baseada em GPU, como reconhecimento de imagem, reconhecimento de fala e processamento de linguagem natural. Os ECS de PI2 também podem ser usados para treinamento de carga leve.

Os ECS PI2 suportam os seguintes softwares comumente usados:

Estruturas de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch

Notas

Os recursos básicos, incluindo as vCPU, memória e imagem de um PI2 ECS de pagamento por uso de sabor pi2.2xlarge.4, pi2.4xlarge.4, ou pi2.8xlarge.4 não são cobrados depois que o ECS é interrompido, mas o disco do sistema do ECS ainda está sendo cobrado de acordo com a capacidade do disco. Os recursos associados ao ECS, como discos do EVS, EIP, e a largura de banda, são cobrados separadamente.

Os recursos de um ECS PI2 de pagamento por uso de pi2.2xlarge.4, pi2.4xlarge.4 ou pi2.8xlarge.4 são liberados depois que o ECS é interrompido. Se os recursos de back-end forem insuficientes quando o ECS for iniciado, a inicialização do ECS poderá falhar. Se você quiser usar esse ECS por um longo período de tempo, altere seu modo de cobrança para anual/mensal ou não interrompa o ECS.
Os ECS de PI2 são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.5 64bit
Os ECS de PI2 suportam a recuperação automática quando os hosts que acomodam esses ECS se tornam defeituosos.
Por padrão, os ECS PI2 criados usando uma imagem pública têm o driver Tesla instalado.
Se um ECS PI2 for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e ferramenta de CUDA em um ECS acelerado por GPU.

PI1 acelerado por inferência

Visão geral

Os ECS de PI1 usam GPUs NVIDIA Tesla P4 dedicadas para inferência de IA em tempo real. Trabalhando com calculadoras P4 INT8, os ECS de PI1 encurtaram a latência de inferência em 15 vezes. Trabalhando com mecanismos de decodificação de hardware, os ECS de PI1 suportam simultaneamente transcodificação e inferência de vídeo HD de 35 canais em tempo real.

Especificações

**Tabela 7** Especificações do PI1 ECS
Variante	As vCPU	Memória (GiB)	Largura de banda máxima/garantida (Gbit/s)	Máximo PPS (10.000)	NIC Multi-fila	As GPU	Memória da GPU (GiB)	Discos Locais	Tipo de virtualização
pi1.2xlarge.4	8	32	5/1,6	40	2	1 x P4	1 × 8 GiB	N/A	KVM
pi1.4xlarge.4	16	64	8/3,2	70	4	2 x P4	2 × 8 GiB	N/A	KVM
pi1.8xlarge.4	32	128	10/6,5	140	8	4 x P4	4 × 8 GiB	N/A	KVM

Recursos do PI1 ECS

CPU: Processadores Intel® Xeon® E5-2697 v4 (2,3 GHz de frequência de base e 3,5 GHz de frequência turbo)
Até quatro GPUs NVIDIA Tesla P4 em um ECS
Passagem de hardware da GPU
Até 5,5 TFLOPS de computação de precisão única em uma única GPU
Até 22 TOPS de computação INT8 em uma única GPU
8 GiB de memória de GPU ECC com uma largura de banda de 192 GiB/s em uma única GPU
Mecanismos de codificação e decodificação de vídeo de hardware incorporados em GPUs para transcodificação e inferência simultâneas de vídeo HD de 35 canais em tempo real

Software comum suportado

Os ECS de PI1 são usados em cenários de computação de inferência baseada em GPU, como reconhecimento de imagem, reconhecimento de fala e processamento de linguagem natural.

Os ECS PI1 suportam os seguintes softwares comumente usados:

Estruturas de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch

Notas

Os recursos básicos, incluindo as vCPU, memória e imagem de um PI1 ECS de pagamento por uso de sabor pi1.2xlarge.4, pi1.4xlarge.4, ou pi1.8xlarge.4 não são cobrados depois que o ECS é interrompido, mas o disco do sistema do ECS ainda está sendo cobrado de acordo com a capacidade do disco. Os recursos associados ao ECS, como discos do EVS, EIP, e a largura de banda, são cobrados separadamente.

Os recursos de um ECS PI1 de pagamento por uso de pi1.2xlarge.4, pi1.4xlarge.4 ou pi1.8xlarge.4 são liberados depois que o ECS é interrompido. Se os recursos de back-end forem insuficientes quando o ECS for iniciado, a inicialização do ECS poderá falhar. Se você quiser usar esse ECS por um longo período de tempo, altere seu modo de cobrança para anual/mensal ou não interrompa o ECS.

Os ECS de PI1 não suportam modificação de especificações.
Os ECS de PI1 são compatíveis com os seguintes sistemas operacionais:
- Ubuntu Server 16.04 64bit
- Ubuntu Server 14.04 64bit
- CentOS 7.3 64bit
Os ECS de PI1 suportam a recuperação automática quando os hosts que acomodam esses ECS se tornam defeituosos.
Por padrão, os ECS PI1 criados usando uma imagem pública têm o driver Tesla instalado.
Se um ECS PI1 for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.