Passo 6: avaliar o desempenho da tabela otimizada
Compare o tempo de carregamento, o uso do espaço de armazenamento e o tempo de execução da consulta antes e depois do ajuste da tabela.
A tabela a seguir mostra os resultados de exemplo do cluster usado neste tutorial. Seus resultados serão diferentes, mas devem mostrar melhorias semelhantes.
Referência |
Antes de |
Depois |
Alteração |
Porcentagem (%) |
---|---|---|---|---|
Tempo de carregamento (11 mesas) |
341584 ms |
257241 ms |
-84343 ms |
-24,7% |
Espaço de armazenamento ocupado |
- |
- |
||
Store_Sales |
42 GB |
14 GB |
-28 GB |
-66,7% |
Date_Dim |
11 MB |
27 MB |
16 MB |
145,5% |
Store |
232 KB |
4352 KB |
4120 KB |
1775,9% |
Item |
110 MB |
259 MB |
149 MB |
1354,5% |
Time_Dim |
11 MB |
14 MB |
13 MB |
118,2% |
Promotion |
256 KB |
3200 KB |
2944 KB |
1150% |
Customer_Demographics |
171 MB |
11 MB |
-160 MB |
-93,6 |
Customer_Address |
170 MB |
27 MB |
-143 MB |
-84,1% |
Household_Demographics |
504 KB |
1280 KB |
704 KB |
139,7% |
Customer |
441 MB |
111 MB |
-330 MB |
-74,8% |
Income_Band |
88 KB |
896 KB |
808 KB |
918,2% |
Espaço total de armazenamento |
42 GB |
15 GB |
-27 GB |
-64,3% |
Tempo de execução da consulta |
- |
- |
||
Consulta 1 |
14552,05 ms |
1783,353 ms |
-12768,697 ms |
-87,7% |
Consulta 2 |
27952,36 ms |
14247,803 ms |
-13704,557 ms |
-49,0% |
Consulta 3 |
17721,15 ms |
11441,659 ms |
-6279,491 ms |
-35,4% |
Tempo total de execução |
60225,56 ms |
27472,815 ms |
-32752,745 ms |
-54,4% |
Avaliar a tabela após a otimização
- O tempo de carregamento foi reduzido em 24,7%.
O modo de distribuição tem um impacto óbvio no carregamento de dados. O modo de distribuição de hash melhora a eficiência de carregamento. O modo de distribuição de replicação reduz a eficiência de carregamento. Quando a CPU e a I/O são suficientes, o nível de compactação tem pouco impacto na eficiência de carregamento. Normalmente, a eficiência de carregar uma tabela de armazenamento de colunas é maior do que a de uma tabela de armazenamento de linhas.
- O espaço de uso de armazenamento foi reduzido em 64,3%.
O nível de compressão, o armazenamento da coluna e a distribuição de hash podem economizar o espaço de armazenamento. Uma tabela de replicação aumenta o uso do armazenamento, mas reduz a sobrecarga da rede. Usar o modo de replicação para pequenas tabelas é uma maneira positiva de usar pequeno espaço para desempenho.
- O desempenho da consulta (velocidade) aumentou 54,4%, indicando que o tempo de consulta diminuiu 54,4%.
O desempenho da consulta é melhorado pela otimização dos modos de armazenamento, modos de distribuição e chaves de distribuição. Em uma consulta de análise estatística em tabelas de várias colunas, o armazenamento de colunas pode melhorar o desempenho da consulta. Em uma tabela de hash, os recursos de I/O em cada nó podem ser usados durante a leitura/gravação de I/O, o que melhora a velocidade de leitura/gravação de uma tabela.
Muitas vezes, o desempenho da consulta pode ser melhorado ainda mais reescrevendo consultas e configurando o gerenciamento de carga de trabalho (WLM). Para obter mais informações, consulte Visão geral da otimização de desempenho de consulta.
Você pode adaptar as operações em Práticas da otimização de tabela para melhorar ainda mais a distribuição de tabelas e o desempenho do carregamento, armazenamento e consulta de dados.
Excluir recursos
Após concluir o exercício, exclua o cluster consultando Exclusão de um cluster.
Se você quiser manter o cluster, mas excluir o espaço de armazenamento usado pelas tabelas SS, execute os seguintes comandos:
1 2 3 4 5 6 7 8 9 10 11 |
DROP TABLE store_sales; DROP TABLE date_dim; DROP TABLE store; DROP TABLE item; DROP TABLE time_dim; DROP TABLE promotion; DROP TABLE customer_demographics; DROP TABLE customer_address; DROP TABLE household_demographics; DROP TABLE customer; DROP TABLE income_band; |