HPC
Contexto
HPC é a abreviação de computação de alto desempenho. Um sistema ou ambiente HPC é composto por um único sistema de computador com muitas CPUs ou um cluster de vários clusters de computadores. Ele pode lidar com uma grande quantidade de dados e executar computação de alto desempenho que seria bastante difícil para PCs. A HPC possui capacidade ultra-alta em computação de ponto flutuante e pode ser usada para campos de computação intensiva e intensiva em dados, como design industrial, biociência, exploração de energia, renderização de imagens e computação heterogênea. Diferentes cenários colocam diferentes requisitos no sistema de arquivos:
- Design industrial: na fabricação de automóveis, CAE e software de simulação CAD são amplamente utilizados. Quando o software está operando, os nós de computação precisam se comunicar uns com os outros de perto, o que requer alta largura de banda e baixa latência do sistema de arquivos.
- Biociência: o sistema de arquivos deve ter alta largura de banda e grande armazenamento, e ser fácil de expandir.
- Bioinformática: para sequenciar, costurar e comparar genes.
- Dinâmica molecular: para simular as mudanças de proteínas em níveis moleculares e atômicos.
- R&D de nova droga: completar a triagem de alta taxa de transferência (HTS) para encurtar o ciclo de P&D e reduzir o investimento.
- Exploração de energia: operações de campo, prospecção geológica, processamento e interpretação de dados geológicos e identificação de reservatórios de petróleo e gás requerem grande memória e alta largura de banda do sistema de arquivos.
- Renderização da imagem: o processamento de imagens, a renderização 3D e o processamento frequente de arquivos pequenos exigem alto desempenho de leitura/gravação, grande capacidade e alta largura de banda dos sistemas de arquivos.
- Computação heterogênea: os elementos de computação podem ter diferentes arquiteturas de conjunto de instruções, exigindo que o sistema de arquivos forneça alta largura de banda e baixa latência.
O SFS é um serviço de armazenamento compartilhado baseado em sistemas de arquivos. Possui compartilhamento de dados de alta velocidade, armazenamento dinâmico em camadas, bem como redimensionamento on-demand, suave e on-line. Esses recursos excepcionais permitem que o SFS atenda aos exigentes requisitos de HPC em termos de capacidade de armazenamento, taxa de transferência, IOPS e latência.
Uma empresa biológica precisa realizar bastante sequenciamento genético usando software. No entanto, devido às etapas triviais, implantação lenta, processo complexo e baixa eficiência, os clusters auto construídos relutam em acompanhar o desenvolvimento dos negócios. No entanto, as coisas estão melhorando desde que a empresa recorreu ao software profissional de gerenciamento de processos do serviço HPC. Com recursos massivos de computação e armazenamento da plataforma em nuvem, o investimento inicial e o custo durante a O&M são bastante reduzidos, o tempo de implantação do serviço é reduzido e a eficiência é aumentada.
Processo de configuração
- Organize os arquivos de sequenciamento de DNA a serem carregados.
- Faça logon no console do SFS. Crie um sistema de arquivos para armazenar os arquivos do sequenciamento de DNA.
- Faça logon nos servidores que funcionam como nó principal e nó de computação e monte o sistema de arquivos.
- No nó principal, carregue os arquivos no sistema de arquivos.
- No nó de cálculo, edite os arquivos.
Pré-requisitos
- Uma VPC foi criada.
- Os ECSs que funcionam como nós principais e nós de cálculo foram criados e atribuídos à VPC. Para obter detalhes sobre como carregar arquivos de sequenciamento de genes no local para o SFS Capacity-Oriented, consulte Migração de dados usando o Direct Connect.
- O SFS foi habilitado.
Exemplo de configuração
- Faça logon no console do SFS.
- Na página Create File System, defina os parâmetros conforme as instruções.
- Após a conclusão da configuração, clique em Create Now.
Para montar um sistema de arquivos para ECSs do Linux, consulte Montagem de um sistema de arquivos NFS para ECSs (Linux). Para montar um sistema de arquivos para ECSs do Windows, consulte Montagem de um sistema de arquivos NFS para ECSs (Windows) e Montagem de um sistema de arquivos CIFS para ECSs (Windows).
- Efetue logon no nó principal e carregue os arquivos no sistema de arquivos.
- Inicie o sequenciamento de genes e o nó de cálculo obtém o arquivo de sequenciamento de genes do sistema de arquivos montado para cálculo.