Os ECS acelerados por GPU
Os ECS acelerados por GPU fornecem excelentes recursos de computação de ponto flutuante. Eles são adequados para aplicativos que exigem computação massiva em tempo real e altamente simultânea.
Tipos de ECS acelerados por GPU
Recomendado: PI2 acelerado por inferência
Disponível agora: Todos os modelos de GPU, exceto os recomendados.
- série G
- Série P
- P2s acelerado por computação (recomendado)
- P2v acelerado por computação
- PI2 acelerado por inferência (recomendado)
- PI1 acelerado por inferência
Classificação |
Tipo ECS |
GPU |
Núcleos CUDA por GPU |
Desempenho de GPU única |
Cenário da aplicação |
Rede |
Observações |
---|---|---|---|---|---|---|---|
Gráficos-acelerados |
G5 |
NVIDIA V100 |
5120 |
|
Desktop em nuvem, renderização de imagens, visualização 3D e design gráfico de carga pesada |
Suporte para IPv6 |
O login remoto no console de gerenciamento não está disponível. Para fazer login em tal ECS, use o VNC ou o VDI de terceiros. |
Computação-acelerada |
P2s |
NVIDIA V100 |
5120 |
|
Treinamento de aprendizado profundo de IA, computação científica, dinâmica de fluidos computacional, finanças computacionais, análise sísmica, modelagem molecular e genômica. |
Suporte para IPv6 |
- |
Computação-acelerada |
P2v |
NVIDIA V100 NVLink (passagem de GPU) |
5120 |
|
Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia |
Suporte para IPv6 |
Nenhum |
Inferência-acelerada |
PI2 |
NVIDIA T4 (passagem de GPU) |
2560 |
|
Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia |
- |
Nenhum |
Inferência-acelerada |
PI1 |
NVIDIA P4 (passagem de GPU) |
2560 |
5,5 TFLOPS de computação de ponto flutuante de precisão única |
Aprendizado de máquina, aprendizado profundo, treinamento de inferência, computação científica, análise sísmica, computação financeira, renderização, codificação e decodificação de multimídia |
- |
Nenhum |
Imagens suportadas pelos ECS acelerados por GPU
Classificação |
Tipo ECS |
Imagem Suportada |
---|---|---|
Gráficos-acelerados |
G5 |
Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit CentOS 7.5 64bit |
Computação-acelerada |
P2s |
Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit Ubuntu Server 16.04 64bit CentOS 7.7 64bit CentOS 7.4 64bit |
Computação-acelerada |
P2v |
Windows Server 2016 Standard 64bit Windows Server 2012 R2 Standard 64bit Ubuntu 16.04 64bit CentOS 7.4 64bit EulerOS 2.2 64bit |
Inferência-acelerada |
PI2 |
Windows Server 2016 Standard 64bit Ubuntu 16.04 64bit CentOS 7.5 64bit |
Inferência-acelerada |
PI1 |
Ubuntu 16.04 64bit Ubuntu 14.04 64bit CentOS 7.3 64bit |
Melhoria acelerada por gráficos G5
Visão geral
Os ECS de G5 usam GPUs NVIDIA Tesla V100 e suportam DirectX, OpenGL e Vulkan. Esses ECS fornecem 16 GiB de memória de GPU e resolução de até 4096 x 2160, atendendo aos requisitos de processamento gráfico profissional.
Selecione o tipo e as especificações de ECS acelerado por GPU desejados.
Especificações
Variante |
As vCPU |
Memória (GiB) |
Largura de banda máxima/garantida (Gbit/s) |
Máximo PPS (10.000) |
NIC Multi-fila |
As GPU |
Memória da GPU (GiB) |
Tipo de virtualização |
---|---|---|---|---|---|---|---|---|
g5.8xlarge.4 |
32 |
128 |
25/15 |
200 |
16 |
1 x V100 |
16 |
KVM |
Um ECS de g5.8xlarge.4 usa exclusivamente uma GPU V100 para aceleração gráfica profissional. Esse ECS pode ser usado para inferência de CPU de carga pesada.
- CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 3,0 GHz de frequência base e 3,4 GHz de frequência turbo)
- APIs de aceleração de gráficos
- DirectX 12, Direct2D, Aceleração de Vídeo DirectX (DXVA)
- O OpenGL 4.5
- Vulkan 1.0
- CUDA e OpenCL
- GPUs NVIDIA V100
- Aplicações de aceleração gráfica
- Inferência de CPU de carga pesada
- Fluxo de aplicativos idêntico aos ECS comuns
- Agendamento automático dos ECS de G5 para AZs onde as GPUs NVIDIA V100 são usadas
- Especificação máxima de 16 GiB de memória da GPU e resolução de 4096 x 2160 para processamento de gráficos e vídeos
Software comum suportado
- AutoCAD
- 3DS MAX
- MAYA
- PhotoScan da Agisoft
- ContextCapture
- Software de modelagem 3D Smart3D
Notas
- Os ECS de G5 são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- CentOS 7.5 64bit
- Um ECS de G5 requer a configuração de uma licença GRID após a criação do ECS.
- Os ECS de G5 criados usando uma imagem pública tiveram o driver GRID de uma versão específica instalado por padrão. No entanto, você precisa comprar e configurar a licença GRID por si mesmo. Certifique-se de que a versão do driver GRID atende aos requisitos de serviço.
Para obter instruções sobre como configurar uma licença GRID, consulte Instalando um driver GRID em um ECS acelerado por GPU.
- Se um ECS de G5 for criado usando uma imagem privada, verifique se o driver GRID foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de gráficos após a criação do ECS.
Para obter detalhes, consulte Instalando um driver GRID em um ECS acelerado por GPU.
P2s acelerado por computação
Visão geral
Os ECS dos P2 usam GPUs NVIDIA Tesla V100 para fornecer flexibilidade, computação de alto desempenho e economia. Os ECS P2s oferecem excelentes recursos gerais de computação e têm pontos fortes em aprendizado profundo baseado em IA, computação científica, dinâmica de fluidos computacional (CFD), finanças computacionais, análise sísmica, modelagem molecular e genômica.
Especificações
Variante |
As vCPU |
Memória (GiB) |
Largura de banda máxima/garantida (Gbit/s) |
Máximo PPS (10.000) |
NIC Multi-fila |
Máximo das NIC |
As GPU |
Conexão da GPU |
Memória da GPU (GiB) |
Tipo de virtualização |
---|---|---|---|---|---|---|---|---|---|---|
p2s.2xlarge.8 |
8 |
64 |
10/4 |
50 |
4 |
4 |
1 x V100 |
PCIe Gen3 |
1 x 32 GiB |
KVM |
p2s.4xlarge.8 |
16 |
128 |
15/8 |
100 |
8 |
8 |
2 x V100 |
PCIe Gen3 |
2 x 32 GiB |
KVM |
p2s.8xlarge.8 |
32 |
256 |
25/15 |
200 |
16 |
8 |
4 x V100 |
PCIe Gen3 |
4 x 32 GiB |
KVM |
p2s.16xlarge.8 |
64 |
512 |
30/30 |
400 |
32 |
8 |
8 x V100 |
PCIe Gen3 |
8 x 32 GiB |
KVM |
- CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 .0 GHz de frequência base e 3,4 GHz de frequência turbo)
- Até oito GPUs NVIDIA Tesla V100 em um ECS
- Computação paralela NVIDIA CUDA e estruturas comuns de aprendizado profundo, como TensorFlow, Caffe PyTorch e MXNet
- 14 TFLOPS de computação de precisão única e 7 TFLOPS de computação de precisão dupla
- Núcleos NVIDIA Tensor com 112 TFLOPS de computação de precisão simples e dupla para aprendizado profundo
- Até 30 Gbit/s de largura de banda de rede em um único ECS
- 32 GiB de memória GPU HBM2 com uma largura de banda de 900 Gbit/s
- Capacidades básicas abrangentes
As redes são definidas pelo usuário, as sub-redes podem ser divididas e as políticas de acesso à rede podem ser configuradas conforme necessário. O armazenamento em massa é usado, a expansão da capacidade elástica, bem como o backup e a restauração são suportados para tornar os dados mais seguros. O Auto Scaling permite que você adicione ou reduza o número dos ECS rapidamente.
- Flexibilidade
Semelhante a outros tipos dos ECS, os ECS P2s podem ser provisionados em poucos minutos.
- Excelente ecossistema de supercomputação
O ecossistema de supercomputação permite que você crie uma plataforma de computação flexível, de alto desempenho e econômica. Um grande número de aplicativos de HPC e estruturas de aprendizado profundo podem ser executados nos ECS de P2s.
Software comum suportado
- Estruturas comuns de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
- Renderização de GPU CUDA suportada pelo RedShift para Autodesk 3dsMax e V-Ray para 3ds Max
- PhotoScan da Agisoft
- MapD
- Os ECS de P2s são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.7 64bit
- CentOS 7.4 64bit
- Por padrão, os ECS P2s criados usando uma imagem pública têm o driver Tesla instalado.
- Se um ECS P2s for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.
P2v acelerado por computação
Visão geral
Os ECS P2v usam GPUs NVIDIA Tesla V100 e oferecem alta flexibilidade, computação de alto desempenho e alta relação custo-benefício. Esses ECS usam o NVLink da GPU para comunicação direta entre as GPUs, melhorando a eficiência da transmissão de dados. Os ECS P2v oferecem excelentes recursos gerais de computação e têm pontos fortes em aprendizado profundo baseado em IA, computação científica, dinâmica de fluidos computacional (CFD), finanças computacionais, análise sísmica, modelagem molecular e genômica.
Especificações
Variante |
As vCPU |
Memória (GiB) |
Largura de banda máxima/garantida (Gbit/s) |
Máximo PPS (10.000) |
NIC Multi-fila |
Máximo das NIC |
As GPU |
Conexão da GPU |
Memória da GPU (GiB) |
Tipo de virtualização |
---|---|---|---|---|---|---|---|---|---|---|
p2v.2xlarge.8 |
8 |
64 |
10/4 |
50 |
4 |
4 |
1 x V100 |
N/A |
1 × 16 GiB |
KVM |
p2v.4xlarge.8 |
16 |
128 |
15/8 |
100 |
8 |
8 |
2 x V100 |
NVLink |
2 × 16 GiB |
KVM |
p2v.8xlarge.8 |
32 |
256 |
25/15 |
200 |
16 |
8 |
4 x V100 |
NVLink |
4 × 16 GiB |
KVM |
p2v.16xlarge.8 |
64 |
512 |
30/30 |
400 |
32 |
8 |
8 x V100 |
NVLink |
8 × 16 GiB |
KVM |
- CPU: Processadores 6151 escaláveis Intel® Xeon® (3,0 GHz de frequência base e 3,4 GHz de frequência turbo)
- Até oito GPUs NVIDIA Tesla V100 em um ECS
- Computação paralela NVIDIA CUDA e estruturas comuns de aprendizado profundo, como TensorFlow, Caffe PyTorch e MXNet
- 15,7 TFLOPS de computação de precisão única e 7,8 TFLOPS de computação de precisão dupla
- Núcleos NVIDIA Tensor com 125 TFLOPS de computação de precisão simples e dupla para aprendizado profundo
- Até 30 Gbit/s de largura de banda de rede em um único ECS
- 16 GiB de memória GPU HBM2 com uma largura de banda de 900 Gbit/s
- Capacidades básicas abrangentes
As redes são definidas pelo usuário, as sub-redes podem ser divididas e as políticas de acesso à rede podem ser configuradas conforme necessário. O armazenamento em massa é usado, a expansão da capacidade elástica, bem como o backup e a restauração são suportados para tornar os dados mais seguros. O Auto Scaling permite que você adicione ou reduza o número dos ECS rapidamente.
- Flexibilidade
Semelhante a outros tipos dos ECS, os ECS P2v podem ser provisionados em poucos minutos.
- Excelente ecossistema de supercomputação
O ecossistema de supercomputação permite que você crie uma plataforma de computação flexível, de alto desempenho e econômica. Um grande número de aplicativos de HPC e estruturas de aprendizado profundo podem ser executados nos ECS de P2v.
Software comum suportado
- Estruturas comuns de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
- Renderização de GPU CUDA suportada pelo RedShift para Autodesk 3dsMax e V-Ray para 3ds Max
- PhotoScan da Agisoft
- MapD
- Os ECS de P2v são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Windows Server 2012 R2 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.7 64bit
- EulerOS 2.5 64bit
- Por padrão, os ECS P2v criados usando uma imagem pública têm o driver Tesla instalado.
- Se um ECS P2v for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.
PI2 acelerado por inferência
Visão geral
Os ECS de PI2 usam GPUs NVIDIA Tesla T4 dedicadas para inferência de IA em tempo real. Esses ECS usam a calculadora T4 INT8 para até 130 TOPS de computação INT8. Os ECS de PI2 também podem ser usados para treinamento de carga leve.
Especificações
Variante |
As vCPU |
Memória (GiB) |
Largura de banda máxima/garantida (Gbit/s) |
Máximo PPS (10.000) |
NIC Multi-fila |
Máximo das NIC |
As GPU |
Memória da GPU (GiB) |
Discos Locais |
Tipo de virtualização |
---|---|---|---|---|---|---|---|---|---|---|
pi2.2xlarge.4 |
8 |
32 |
10/4 |
50 |
4 |
4 |
1 x T4 |
1×16 |
N/A |
KVM |
pi2.4xlarge.4 |
16 |
64 |
15/8 |
100 |
8 |
8 |
2 x T4 |
2×16 |
N/A |
KVM |
pi2.8xlarge.4 |
32 |
128 |
25/15 |
200 |
16 |
8 |
4 x T4 |
4×16 |
N/A |
KVM |
Recursos do PI2 ECS
- CPU: Processadores Intel® Xeon® escaláveis 6278 de segunda geração (2,6 GHz de frequência base e 3,5 GHz de frequência turbo) ou processadores Intel® Xeon® Scalable 6151 .0 GHz de frequência base e 3,4 GHz de frequência turbo)
- Até quatro GPUs NVIDIA Tesla T4 em um ECS
- Passagem de hardware da GPU
- Até 8,1 TFLOPS de computação de precisão única em uma única GPU
- Até 130 TOPS de computação INT8 em uma única GPU
- 16 GiB de memória de GPU GDDR6 com uma largura de banda de 320 GiB/s em uma única GPU
- Uma GPU NVENC integrada e duas NVDEC
Software comum suportado
Os ECS de PI2 são usados em cenários de computação de inferência baseada em GPU, como reconhecimento de imagem, reconhecimento de fala e processamento de linguagem natural. Os ECS de PI2 também podem ser usados para treinamento de carga leve.
Os ECS PI2 suportam os seguintes softwares comumente usados:
- Estruturas de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
Notas
- Os recursos básicos, incluindo as vCPU, memória e imagem de um PI2 ECS de pagamento por uso de sabor pi2.2xlarge.4, pi2.4xlarge.4, ou pi2.8xlarge.4 não são cobrados depois que o ECS é interrompido, mas o disco do sistema do ECS ainda está sendo cobrado de acordo com a capacidade do disco. Os recursos associados ao ECS, como discos do EVS, EIP, e a largura de banda, são cobrados separadamente.
Os recursos de um ECS PI2 de pagamento por uso de pi2.2xlarge.4, pi2.4xlarge.4 ou pi2.8xlarge.4 são liberados depois que o ECS é interrompido. Se os recursos de back-end forem insuficientes quando o ECS for iniciado, a inicialização do ECS poderá falhar. Se você quiser usar esse ECS por um longo período de tempo, altere seu modo de cobrança para anual/mensal ou não interrompa o ECS.
- Os ECS de PI2 são compatíveis com os seguintes sistemas operacionais:
- Windows Server 2016 Standard 64bit
- Ubuntu Server 16.04 64bit
- CentOS 7.5 64bit
- Os ECS de PI2 suportam a recuperação automática quando os hosts que acomodam esses ECS se tornam defeituosos.
- Por padrão, os ECS PI2 criados usando uma imagem pública têm o driver Tesla instalado.
- Se um ECS PI2 for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e ferramenta de CUDA em um ECS acelerado por GPU.
PI1 acelerado por inferência
Visão geral
Os ECS de PI1 usam GPUs NVIDIA Tesla P4 dedicadas para inferência de IA em tempo real. Trabalhando com calculadoras P4 INT8, os ECS de PI1 encurtaram a latência de inferência em 15 vezes. Trabalhando com mecanismos de decodificação de hardware, os ECS de PI1 suportam simultaneamente transcodificação e inferência de vídeo HD de 35 canais em tempo real.
Especificações
Variante |
As vCPU |
Memória (GiB) |
Largura de banda máxima/garantida (Gbit/s) |
Máximo PPS (10.000) |
NIC Multi-fila |
As GPU |
Memória da GPU (GiB) |
Discos Locais |
Tipo de virtualização |
---|---|---|---|---|---|---|---|---|---|
pi1.2xlarge.4 |
8 |
32 |
5/1,6 |
40 |
2 |
1 x P4 |
1 × 8 GiB |
N/A |
KVM |
pi1.4xlarge.4 |
16 |
64 |
8/3,2 |
70 |
4 |
2 x P4 |
2 × 8 GiB |
N/A |
KVM |
pi1.8xlarge.4 |
32 |
128 |
10/6,5 |
140 |
8 |
4 x P4 |
4 × 8 GiB |
N/A |
KVM |
- CPU: Processadores Intel® Xeon® E5-2697 v4 (2,3 GHz de frequência de base e 3,5 GHz de frequência turbo)
- Até quatro GPUs NVIDIA Tesla P4 em um ECS
- Passagem de hardware da GPU
- Até 5,5 TFLOPS de computação de precisão única em uma única GPU
- Até 22 TOPS de computação INT8 em uma única GPU
- 8 GiB de memória de GPU ECC com uma largura de banda de 192 GiB/s em uma única GPU
- Mecanismos de codificação e decodificação de vídeo de hardware incorporados em GPUs para transcodificação e inferência simultâneas de vídeo HD de 35 canais em tempo real
Software comum suportado
Os ECS de PI1 são usados em cenários de computação de inferência baseada em GPU, como reconhecimento de imagem, reconhecimento de fala e processamento de linguagem natural.
Os ECS PI1 suportam os seguintes softwares comumente usados:
- Estruturas de aprendizado profundo, como TensorFlow, Caffe , MXNet e PyTorch
- Os recursos básicos, incluindo as vCPU, memória e imagem de um PI1 ECS de pagamento por uso de sabor pi1.2xlarge.4, pi1.4xlarge.4, ou pi1.8xlarge.4 não são cobrados depois que o ECS é interrompido, mas o disco do sistema do ECS ainda está sendo cobrado de acordo com a capacidade do disco. Os recursos associados ao ECS, como discos do EVS, EIP, e a largura de banda, são cobrados separadamente.
Os recursos de um ECS PI1 de pagamento por uso de pi1.2xlarge.4, pi1.4xlarge.4 ou pi1.8xlarge.4 são liberados depois que o ECS é interrompido. Se os recursos de back-end forem insuficientes quando o ECS for iniciado, a inicialização do ECS poderá falhar. Se você quiser usar esse ECS por um longo período de tempo, altere seu modo de cobrança para anual/mensal ou não interrompa o ECS.
- Os ECS de PI1 não suportam modificação de especificações.
- Os ECS de PI1 são compatíveis com os seguintes sistemas operacionais:
- Ubuntu Server 16.04 64bit
- Ubuntu Server 14.04 64bit
- CentOS 7.3 64bit
- Os ECS de PI1 suportam a recuperação automática quando os hosts que acomodam esses ECS se tornam defeituosos.
- Por padrão, os ECS PI1 criados usando uma imagem pública têm o driver Tesla instalado.
- Se um ECS PI1 for criado usando uma imagem privada, certifique-se de que o driver Tesla foi instalado durante a criação da imagem privada. Caso contrário, instale o driver para aceleração de computação após a criação do ECS. Para obter detalhes, Consulte Instalando um Tesla Driver e Ferramenta de CUDA em um ECS acelerado por GPU.