Funciones
GaussDB(DWS) le permite usar este servicio a través de varios métodos, como la consola de gestión de GaussDB(DWS), el cliente de GaussDB(DWS) y REST APIs. Esta sección describe las funciones principales de GaussDB(DWS).
Gestión de clústeres
Un clúster de almacén de datos contiene nodos del mismo variante en la misma subred. Estos nodos proporcionan conjuntamente servicios. GaussDB(DWS) proporciona una consola de gestión profesional, eficiente y centralizada, que le permite solicitar rápidamente clústeres, administrar fácilmente almacenes de datos y centrarse en datos y servicios.
Las funciones principales de la gestión de clústeres se describen a continuación:
- Creación de un clúster
Para utilizar los servicios de almacén de datos en la nube, primero cree un clúster de GaussDB(DWS). Puede seleccionar especificaciones de producto y nodo para crear rápidamente un clúster. También puede comprar un paquete de descuento para crear un clúster.
- Gestión de instantáneas
Una instantánea es una copia de seguridad completa que registra datos de configuración y datos de servicio en un punto de tiempo de un clúster de GaussDB(DWS). Una instantánea se puede utilizar para restaurar un clúster en un momento determinado. Puede crear instantáneas manualmente para un clúster o habilitar la creación automática de instantáneas (periódicas). Las instantáneas automatizadas tienen un período de retención limitado. Puede copiar instantáneas automáticas para una retención a largo plazo.
Cuando restaura un clúster a partir de una instantánea, el sistema crea un nuevo clúster con el mismo variante y cantidad de nodos que el original, e importa los datos de la instantánea.
Puede eliminar instantáneas que ya no sean necesarias para liberar el espacio de almacenamiento.
- Gestión de nodos
Puede consultar los nodos en un clúster, incluidos el estado, las especificaciones y el uso de cada nodo. Para prepararse para un gran escalamiento horizontal, puede agregar nodos en lotes. Por ejemplo, si se necesitan 180 nodos BMS más para un escalamiento horizontal, agréguelos en tres lotes (60 en cada lote). Si algunos nodos no se pueden agregar, agréguelos de nuevo. Una vez que todos los 180 nodos se hayan agregado correctamente, utilice los nodos para el escalamiento horizontal del clúster. La adición de nodos no afecta a los servicios de clúster.
- Escalamiento horizontal de un clúster
A medida que aumenta el volumen de servicio, es posible que la escala actual de un clúster no cumpla con los requisitos de servicio. En este caso, puede escalar el clúster agregando nodos de cómputo a él. Los servicios no se interrumpen durante el proceso de escalamiento. Puede habilitar el escalamiento horizontal en línea y la redistribución automática si es necesario.
- Gestión de redistribución
De forma predeterminada, la redistribución se inicia automáticamente después de la escalamiento horizontal del clúster. Para una mayor fiabilidad, deshabilite la función de redistribución automática e inicie manualmente una tarea de redistribución después de que el escalamiento horizontal se realice correctamente. La redistribución de datos puede acelerar la respuesta del servicio. Actualmente, se admite la redistribución sin conexión, la redistribución en línea y la programación sin conexión. El modo predeterminado es la redistribución sin conexión.
- Escalamiento del espacio de almacenamiento
En el escalamiento convencional, los recursos de computación y de almacenamiento están acoplados. Si una empresa escala discos, tiene que agregar CPUs y memoria innecesarias al mismo tiempo. El escalamiento tarda mucho tiempo e interrumpe los servicios. La expansión de la capacidad del disco puede aumentar rápidamente el almacenamiento sin interrupción del servicio. Puede aumentar el espacio en disco sin tener que detener los servicios.
- Gestión de cargas de trabajo
Cuando varios usuarios de bases de datos consultan trabajos al mismo tiempo, algunas consultas complejas pueden ocupar recursos de clúster durante mucho tiempo, lo que afecta al rendimiento de otras consultas. Por ejemplo, un grupo de usuarios de base de datos envía continuamente consultas complejas y que consumen mucho tiempo, mientras que otro grupo de usuarios envía con frecuencia consultas cortas. En este caso, las consultas cortas pueden tener que esperar en la cola para que se completen las consultas que consumen mucho tiempo. Para mejorar la eficiencia, puede utilizar la función de administración de cargas de trabajo de GaussDB(DWS) para manejar estos problemas. La gestión de cargas de trabajo de GaussDB(DWS) utiliza colas de cargas de trabajo como portadoras de recursos. Puede crear diferentes colas de carga de trabajo para diferentes tipos de servicio y configurar diferentes proporciones de recursos para estas colas. A continuación, agregue usuarios de base de datos a las colas correspondientes para restringir sus usos de recursos.
- Clúster lógico
Un clúster físico se puede dividir en clústeres lógicos que utilizan el mecanismo de grupo de nodos. Las tablas de una base de datos se pueden asignar a diferentes nodos físicos por clúster lógico. Un clúster lógico puede contener tablas de varias bases de datos.
- Reiniciar un clúster
El reinicio de un clúster puede provocar la pérdida de datos en los servicios en ejecución. Si tiene que reiniciar un clúster, asegúrese de que no hay servicio en ejecución y que se han guardado todos los datos.
- Eliminación de un clúster
Puede eliminar un clúster cuando no lo necesite. Eliminar un clúster es arriesgado y puede causar pérdida de datos. Por lo tanto, realice esta operación con precaución.
GaussDB(DWS) le permite gestionar clústeres e instantáneas de cualquiera de las siguientes maneras:
- Consola de gestión
Utilice la consola de gestión para acceder a los clústeres de GaussDB(DWS). Cuando haya registrado una cuenta, inicie sesión en la consola de gestión y elija Data Warehouse Service.
Para obtener más información acerca de la gestión de clústeres, consulte Gestión de clústeres.
- REST APIs
Utilice REST APIs proporcionadas por GaussDB(DWS) para gestionar clústeres. Además, si necesita integrar GaussDB(DWS) en un sistema de terceros para desarrollo secundario, use APIs para acceder al servicio.
Para obtener más información, consulte la Referencia de la API de Data Warehouse Service (DWS).
Almacenes de datos de nivel empresarial y compatibilidad con estándar de SQL
Después de crear un clúster de almacén de datos, puede utilizar el cliente de SQL para conectarse al clúster y realizar operaciones como crear una base de datos, gestionar la base de datos, importar y exportar datos y consultar datos.
GaussDB(DWS) proporciona bases de datos de alto rendimiento a nivel de petabyte (PB) con las siguientes características:
- Marco de computación MPP, almacenamiento híbrido de columna y fila y ejecución vectorizada, lo que permite responder al análisis de correlación de datos de nivel de mil millones dentro de segundos
- Optimización de computación en memoria basada en Hash Join de Bloom Filter, lo que mejora el rendimiento de 2 a 10 veces
- Comunicación optimizada entre clústeres a gran escala basada en tecnologías de telecomunicaciones, lo que mejora la eficiencia de transmisión de datos entre nodos de computación
- Optimizadores inteligentes basados en costos, que ayudan a generar el plan óptimo basado en la escala del clúster y el volumen de datos para mejorar la eficiencia de la ejecución
GaussDB(DWS) tiene capacidades SQL integrales:
- Soporta estándares de SQL 92 y SQL 2003, procedimientos almacenados, conjuntos de caracteres GBK y UTF-8, y funciones estándares de SQL y funciones de análisis de OLAP.
- Compatible con el ecosistema de PostgreSQL y admite la interconexión con las herramientas de base de datos principales de ETL y BI proporcionadas por proveedores de terceros.
Para obtener más información acerca de la sintaxis de SQL y la guía de operación de la base de datos, consulte la Guía del desarrollador de Data Warehouse Service (DWS).
Diversos modos de importación de datos
GaussDB(DWS) admite la importación eficiente de datos desde múltiples fuentes de datos. The following lists typical data import modes. Para obtener más información, consulte "Importación de datos" en la Guía del desarrollador del Data Warehouse Service (DWS).
- Importación simultánea de datos desde OBS
- Uso de GDS para importar datos desde un servidor remoto
- Ejecución de la instrucción INSERT para insertar datos
- Ejecución de la instrucción COPY FROM STDIN para importar datos
- Uso de un comando meta gsql para importar datos
- Importación de datos de MRS a un clúster de almacén de datos
- Importación de datos de flujo de DIS a GaussDB(DWS)
- Uso de CDM para migrar datos a GaussDB(DWS)
- Uso del Database Schema Convertor (DSC) para migrar scripts de SQL
Además, GaussDB(DWS) admite la importación de datos utilizando herramientas principales de ETL de terceros.
APIs
Puede llamar a las APIs estándares, como JDBC y ODBC, para acceder a las bases de datos en clústeres de GaussDB(DWS).
Para obtener más información, consulte Uso de los controladores JDBC para conectarse a una base de datos y Uso de los controladores JDBC para conectarse a una base de datos.
Alta fiabilidad
- Soporta redundancia de instancia y datos, asegurando cero puntos únicos de fallo (SPOF) en todo el sistema.
- Soporta múltiples copias de seguridad de datos, y todos los datos se pueden hacer la copia de seguridad manualmente en OBS.
- Aísla automáticamente el nodo defectuoso, utiliza la copia de seguridad para restaurar los datos y reemplaza el nodo defectuoso cuando sea necesario.
- Las instantáneas automáticas funcionan con OBS para implementar la recuperación ante desastres (DR) entre AZ. Si el clúster de producción no proporciona servicios de lectura y escritura debido a desastres naturales en la región especificada o fallas internas del clúster, el clúster de DR se convierte en el clúster de producción para garantizar la continuidad del servicio.
- En el estado Unbalanced, el número de instancias primarias en algunos nodos aumenta. Como resultado, la presión de carga es alta. En este caso, puede realizar un switchback primario/de reserva para el clúster durante las horas no pico para mejorar el rendimiento.
- Si la dirección IP interna o EIP de un CN se utiliza para conectarse a un clúster, el fallo de este CN conducirá a un fallo de conexión del clúster. Para evitar fallos de un solo CN, GaussDB(DWS) utiliza el Equilibrio de carga elástica (ELB). Un ELB distribuye el tráfico de acceso a múltiples ECS para el control de tráfico basado en políticas de reenvío. Mejora la capacidad de tolerancia a fallos de los programas de aplicación.
- Después de crear un clúster, el número de CN necesarios varía según los requisitos de servicio. GaussDB(DWS) le permite agregar o eliminar CNs según sea necesario.
Gestión de la seguridad
- Aísla a los inquilinos y controla los permisos de acceso para proteger la privacidad y la seguridad de los datos de los sistemas y usuarios en función del aislamiento de la red y las reglas de grupo de seguridad, así como las medidas de refuerzo de la seguridad.
- Admite conexiones de red de SSL, gestión de permisos de usuario y gestión de contraseñas, lo que garantiza la seguridad de los datos en la capa de red, gestión, aplicación y sistema.
Para obtener más información, consulte Configuración de la conexión de SSL y Configuración de la separación de permisos.
Monitoreo y Auditoría
- Monitoreo de clústeres
GaussDB(DWS) se integra con Cloud Eye, lo que le permite monitorear nodos de cómputo y bases de datos en el clúster en tiempo real. Para obtener más información, consulte Monitoreo de clúster.
- Monitoreo de base de datos
El DMS es proporcionado por GaussDB(DWS) para asegurar el funcionamiento rápido y estable de las bases de datos. Recopila, monitorea y analiza los datos de métricas de disco, red y OS utilizados por la base de datos de servicio, así como los datos clave de métricas de rendimiento de la ejecución del clúster. También diagnostica hosts de base de datos, instancias y sentencias de SQL de servicio en función de las métricas recopiladas para exponer fallas clave y problemas de rendimiento en una base de datos de manera oportuna, y guía a los clientes para optimizar y resolver los problemas. Para obtener más información, consulte Monitoreo de base de datos.
- Gestión de alarmas
La gestión de alarmas incluye la visualización y configuración de reglas de alarma y la suscripción a la información de alarma. Las reglas de alarma muestran estadísticas de alarmas y detalles de la semana pasada para que los usuarios vean las alarmas del inquilino. Además de proporcionar un conjunto de reglas de alarma de GaussDB(DWS) predeterminadas, esta característica le permite modificar los umbrales de alarma basados en sus propios servicios. Para obtener más información, consulte Alarmas.
- Notificación de evento
GaussDB(DWS) se interconecta con Simple Message Notification (SMN) para que pueda suscribirse a eventos y consultar eventos que se activan. Para obtener más información, consulte Notificaciones de eventos.
- Registros de auditoría
- GaussDB(DWS) se integra con Cloud Trace Service (CTS), lo que le permite auditar las operaciones realizadas en la consola de gestión y las operaciones de invocación de API. Para obtener más información, consulte Consulta de registros de auditoría de operaciones clave en la gestión de consola.
- GaussDB(DWS) registra todas las operaciones SQL, incluidos los intentos de conexión, los intentos de consulta y los cambios en la base de datos. Para obtener más información, consulte Configuración de registros de auditoría de base de datos.
Múltiples herramientas de base de datos
GaussDB(DWS) proporciona las siguientes herramientas autodesarrolladas. Puede descargar los paquetes de herramientas en la consola de gestión de GaussDB(DWS). Para obtener más información sobre las herramientas, consulte la Guía de herramienta de Data Warehouse Service(DWS).
- gsql
gsql es una herramienta de cliente de SQL de línea de comandos que se ejecuta en el sistema operativo Linux. Ayuda a conectar, operar y mantener la base de datos en un clúster de almacén de datos.
- Data Studio
Data Studio es una herramienta de cliente SQL de Interfaz gráfica de usuario (GUI) que se ejecuta en el sistema operativo Windows. Se utiliza para conectarse a la base de datos en un clúster de almacén de datos, gestionar la base de datos y objetos de base de datos, editar, ejecutar y depurar scripts de SQL, y ver los planes de ejecución.
- GDS
GDS es una herramienta de servicio de datos proporcionada por GaussDB(DWS). Funciona con el mecanismo de tabla extranjera para implementar la importación y exportación de datos de alta velocidad.
El paquete de herramientas GDS debe instalarse en el servidor donde se encuentra el archivo fuente de datos. Este servidor se denomina servidor de datos o servidor GDS.
- Herramienta de migración de sintaxis de SQL DSC
El DSC es una herramienta de línea de comandos que se ejecuta en el sistema operativo Linux o Windows OS. Se dedica a proporcionar a los clientes servicios de migración de scripts de SQL de aplicaciones de forma simple, rápido y confiable. Analiza los scripts de SQL de las aplicaciones de base de datos de origen utilizando la lógica de migración de sintaxis integrada, y los migra para que sean aplicables a las bases de datos GaussDB(DWS).
El DSC puede migrar scripts de SQL de bases de datos de Teradata, Oracle, Netezza, MySQL y DB2.