Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ GaussDB(DWS)/ Preguntas frecuentes/ Problemas generales/ ¿Cuáles son las diferencias entre un almacén de datos y la plataforma de big data de Hadoop?
Actualización más reciente 2023-10-12 GMT+08:00

¿Cuáles son las diferencias entre un almacén de datos y la plataforma de big data de Hadoop?

La plataforma de big data de Hadoop puede considerarse como un sistema de almacenamiento de datos de próxima generación. Tiene las características de los almacenes de datos modernos y es ampliamente utilizado por las empresas. Debido a la escalabilidad de MPP, el sistema de almacenamiento de datos basado en MPP a veces se clasifica como una plataforma de big data.

Sin embargo, los almacenes de datos difieren mucho de la plataforma Hadoop en función y experiencia del usuario en diferentes escenarios. Para más detalles, consulte la siguiente tabla.

Tabla 1 Comparación de características entre los almacenes de datos y la plataforma de big data de Hadoop

Características

Hadoop

Almacén de datos

Número de nodos informáticos

1000s

Máximo 256

Volumen de datos

Más de 10 PB

Máximo 10 PB

Tipo de datos

Relacional, semi-relacional, no estructurado (voz, imágenes y vídeo)

Solo relacional

Latencia

Mediano a alto

Baja

Ecosistema de aplicaciones

Innovador/IA

Tradicional/BI

API de desarrollo de aplicaciones

SQL y otras API de lenguaje de programación, como MapReduce

Base de datos SQL estándar

Escalabilidad

Ilimitado, con APIs de programación integrales

Limitado, apoyado por UDFs

Soporte de transacciones

Limitado

Datos integrales

Los almacenes de datos y la plataforma Hadoop trabajan juntos en diferentes escenarios. GaussDB(DWS) en la nube pública puede integrarse sin problemas con MRS basado en Hadoop en la nube pública para proporcionar el intercambio de datos SQL sobre Hadoop entre plataformas y servicios. GaussDB(DWS) sirve como un almacén de datos para la gestión de datos masivos mientras disfruta de la apertura, conveniencia e innovación de la plataforma Hadoop. También puede disfrutar de las aplicaciones de capa superior de los almacenes de datos convencionales, especialmente las aplicaciones de BI, utilizando GaussDB(DWS).