Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

Configuración de una conexión de datos de Hive

Esta sección describe cómo cambiar los metadatos de Hive de un clúster activo a los metadatos almacenados en una base de datos local o base de datos de RDS después de comprar un clúster. Esta operación permite que varios clústeres MRS compartan los mismos metadatos y los metadatos no se eliminarán cuando se eliminen los clústeres. De esta manera, la migración de metadatos de Hive no es necesaria durante la migración del clúster.

  • Cuando los metadatos de Hive se cambian entre diferentes clústeres, MRS sincroniza solo los permisos en la base de datos de metadatos del componente Hive. El modelo de permiso en MRS se mantiene en MRS Manager. Por lo tanto, cuando los metadatos de Hive se cambian entre clústeres, los permisos de los usuarios o grupos de usuarios no se pueden sincronizar automáticamente con MRS Manager de otro clúster.
  • Para los clústeres cuya versión es anterior a MRS 3.x, si la conexión de datos seleccionada es RDS MySQL database, asegúrese de que el usuario de la base de datos es root. Si el usuario no es root, cree un usuario y conceda permisos al usuario haciendo referencia a Preparaciones.
  • Para los clústeres de MRS 3.x o posteriores, cuando Type está establecido en RDS MySQL database, Username no debe ser root. En este caso, cree un usuario y conceda permisos al usuario haciendo referencia a Preparaciones.

Configuración de una conexión de datos de Hive

Esta función no es compatible con MRS 3.0.5.

  1. Inicie sesión en la consola de MRS. En el panel de navegación de la izquierda, elija Clusters >Active Clusters.
  2. Haga clic en el nombre de un clúster para ir a la página de detalles del clúster.
  3. En la página de la pestaña Dashboard, haga clic en Manage junto a Data Connection.
  4. En el cuadro de diálogo Data Connection, se muestran las conexiones de datos asociadas con el clúster. Puede hacer clic en Edit o Delete para editar o eliminar las conexiones de datos.
  5. Si no hay ninguna conexión de datos asociada en el cuadro de diálogo Data Connection, haga clic en Configure Data Connection para agregar una conexión.

    Solo se puede configurar una conexión de datos para un tipo de módulo. Por ejemplo, después de configurar una conexión de datos para los metadatos de Hive, no se puede configurar ninguna otra conexión de datos para ella. Si no hay ningún tipo de módulo disponible, el botón Configure Data Connection no estará disponible.

    Tabla 1 Configuración de una conexión de datos de Hive

    Parámetro

    Descripción

    Component

    Hive

    Module Type

    Metadatos de Hive

    Data Connection Type

    • Base de datos de RDS PostgreSQL (compatible con clústeres de MRS 1.9.x)
    • Base de datos de RDS MySQL
    • Base de datos local

    Instance

    Este parámetro solo es válido cuando Data Connection Type está establecido en RDS PostgreSQL database o RDS MySQL database. Seleccione el nombre de la conexión entre el clúster MRS y la base de datos de RDS. Esta instancia debe ser creada antes de ser referenciada aquí. Puede hacer clic en Create Data Connection para crear una conexión de datos. Para obtener más información, consulte Creación de una conexión de datos de RDS.

  6. Haga clic en Test para probar la conectividad de la conexión de datos.
  7. Una vez que la conexión de datos se haya realizado correctamente, haga clic en OK.

    • Después de configurar los metadatos de Hive, reinicie Hive. Hive creará las tablas de base de datos necesarias en la base de datos especificada. (Si ya existen tablas, no se crearán.)
    • Antes de reiniciar el servicio Hive, asegúrese de que el paquete de controlador se ha instalado en todos los nodos donde se encuentran las instancias de Metastore.
      • Postgres: Utilice el paquete de controlador Postgres de código abierto para reemplazar el existente del clúster. Sube el paquete de controladores PostgreSQL postgresql-42.2.5.jar al directorio ${BIGDATA_HOME}/third_lib/Hive en todos los nodos de MetaStore. Para descargar el paquete de controladores de código abierto, visite https://repo1.maven.org/maven2/org/postgresql/postgresql/42.2.5/.
      • MySQL: Vaya al sitio web oficial de MySQL (https://www.mysql.com/). Elija DOWNLOADS y haga clic en MySQL Community (GPL) Downloads. En la página mostrada, haga clic en Connector/J para descargar el paquete de controlador de la versión correspondiente y cargar el paquete de controlador en el directorio /opt/Bigdata/FusionInsight_HD_*/install/FusionInsight-Hive-*/hive-*/lib/ en todos los nodos de RDSMetastore.