Quais são as diferenças entre um armazém de dados e a plataforma de Big data Hadoop?
A plataforma de Big data Hadoop pode ser considerada como um sistema de armazém de dados de próxima geração. Tem as características dos armazéns de dados modernos e é amplamente utilizado pelas empresas. Devido à escalabilidade do MPP, o sistema de armazém de dados baseado em MPP às vezes é classificado como uma plataforma de Big data.
No entanto, os armazéns de dados diferem muito da plataforma Hadoop em função e experiência do usuário em diferentes cenários. Para obter detalhes, consulte a tabela a seguir.
Característica |
Hadoop |
Data Warehouse |
---|---|---|
Número de nós de computação |
1000s |
Máximo 256 |
Volume de dados |
Mais de 10 PB |
Máximo 10 PB |
Tipos de dados |
Relacional, semi-relacional, não estruturado (voz, imagens e vídeo) |
Apenas relacional |
Latência |
Média a alta |
Baixa |
Ecossistema de aplicação |
Inovador/AI |
Tradicional/BI |
API de desenvolvimento de aplicações |
SQL e outras APIs de linguagem de programação, como MapReduce |
SQL de banco de dados padrão |
Escalabilidade |
Ilimitada, com APIs de programação abrangentes |
Limitada, suportada por UDFs |
Suporte a transações |
Limitada |
Abrangente |
Os armazéns de dados e a plataforma Hadoop trabalham juntos em diferentes cenários. O GaussDB (DWS) na nuvem pública pode integrar-se perfeitamente com o MRS baseado em Hadoop na nuvem pública para fornecer o compartilhamento de dados SQL-over-Hadoop entre plataformas e serviços. O GaussDB (DWS) serve como um armazém de dados para gerenciar dados massivos enquanto aprecia a abertura, a conveniência e a inovação da plataforma Hadoop. Você também pode aproveitar as aplicações de camada superior de armazéns de dados convencionais, especialmente aplicações de BI, usando o GaussDB (DWS).