Función de código abierto mejorada
Función mejorada de código abierto: HDFS Colocation
HDFS Colocation es la función de control de ubicación de datos proporcionada por HDFS. La API de HDFS Colocation almacena datos asociados o datos en los que se realizan operaciones asociadas en el mismo nodo de almacenamiento.
Hive es compatible con HDFS Colocation. Cuando se crean tablas Hive, después de establecer la información del localizador para los archivos de tabla, los archivos de datos de las tablas relacionadas se almacenan en el mismo nodo de almacenamiento. Esto asegura una computación de datos conveniente y eficiente entre las tablas asociadas.
Función de código abierto mejorada: Cifrado de columnas
Hive admite encriptación de una o más columnas. Las columnas que se van a cifrar y el algoritmo de encriptación se pueden especificar cuando se crea una tabla Hive. Cuando se insertan datos en la tabla utilizando la sentencia INSERT, las columnas relacionadas se cifran. El cifrado de columna Hive no admite vistas y el escenario Hive sobre HBase.
El mecanismo de cifrado de columnas de Hive admite dos algoritmos de cifrado que se pueden seleccionar para cumplir con los requisitos del sitio durante la creación de tablas:
- AES (la clase de encriptación es de org.apache.hadoop.hive.serde2.AESRewriter)
- SMS4 (la clase de encriptación es de org.apache.hadoop.hive.serde2.SMS4Rewriter)
Función de código abierto mejorada: eliminación de HBase
Debido a las limitaciones de los sistemas de almacenamiento subyacentes, Hive no admite la capacidad de eliminar una sola pieza de datos de tabla. En Hive on HBase, Hive en la solución de MRS admite la capacidad de eliminar una sola pieza de datos de tabla HBase. Utilizando una sintaxis específica, Hive puede eliminar uno o más fragmentos de datos de una tabla HBase.
Función de código abierto mejorada: delimitador de filas
En la mayoría de los casos, un carácter de retorno de carro se utiliza como delimitador de fila en las tablas de Hive almacenadas en archivos de texto, es decir, el carácter de retorno de carro se utiliza como el terminador de una fila durante las consultas.
Sin embargo, algunos archivos de datos están delimitados por caracteres especiales y no por un carácter de retorno de carro.
MRS Hive permite especificar diferentes caracteres o combinaciones de caracteres como delimitadores de filas para los datos de Hive en archivos de texto.
Función de código abierto mejorada: conmutación de REST API basada en HTTPS/HTTP
WebHCat proporciona REST APIs externas para Hive. De forma predeterminada, la versión de comunidad de código abierto utiliza el protocolo HTTP.
MRS Hive admite el protocolo HTTPS que es más seguro y permite la conmutación entre el protocolo HTTP y el protocolo HTTPS.
Función de código abierto mejorada: función de Transform
La función Transform no está permitida por Hive de la versión de código abierto. MRS Hive admite la configuración de la función Transform. La función está deshabilitada por defecto, que es la misma que la versión de la comunidad de código abierto.
Los usuarios pueden modificar las configuraciones de la función de Transform para habilitar la función. Sin embargo, existen riesgos de seguridad cuando se habilita la función Transform.
Función de código abierto mejorada: creación de funciones temporales sin permiso ADMIN
Debe tener permiso ADMIN al crear funciones temporales en Hive de la versión de comunidad de código abierto. MRS Hive admite la configuración de la función para crear funciones temporales con permiso ADMIN. La función está deshabilitada por defecto, que es la misma que la versión de la comunidad de código abierto.
Puede modificar las configuraciones de esta función. Una vez habilitada la función, puede crear funciones temporales sin permiso ADMIN.
Función de código abierto mejorada: Autorización de base de datos
En la versión de la comunidad de código abierto de Hive, solo el propietario de la base de datos puede crear tablas en la base de datos. MRS Hive puede otorgarle los permisos CREATE y SELECT en tablas en una base de datos. Después de que se le conceda el permiso para consultar datos en la base de datos, el sistema asocia automáticamente el permiso de consulta en todas las tablas de la base de datos.
Función de código abierto mejorada: Autorización de columna
La versión de la comunidad de código abierto de Hive solo admite el control de permisos a nivel de tabla. MRS Hive admite el control de permisos a nivel de columna. Se le pueden conceder permisos de columna, como SELECT, INSERT y UPDATE.