Presto
Presto es un motor de consultas SQL de código abierto para ejecutar consultas analíticas interactivas contra fuentes de datos de todos los tamaños. Se aplica al análisis de datos estructurados/semiestructurados masivos, agregación/informe de datos multidimensionales masivos, ETL, consultas de ad-hoc y más escenarios.
Presto permite consultar datos donde viven, incluidos HDFS, Hive, HBase, Cassandra, bases de datos relacionales o incluso almacenes de datos propietarios. Una consulta de Presto puede combinar diferentes orígenes de datos para realizar análisis de datos en todos los orígenes de datos.
Presto se ejecuta en un clúster en modo distribuido y contiene un coordinador y varios procesos de trabajo. Las solicitudes de consulta se envían desde los clientes (por ejemplo, CLI) al coordinador. El coordinador analiza las sentencias SQL, genera planes de ejecución y los distribuye a varios procesos de trabajo para su ejecución.
Para obtener más información sobre Presto, visite https://prestodb.github.io/ o https://prestosql.io/.
Múltiples Instancias de Presto
MRS admite la instalación de varias instancias de Presto para un clúster a gran escala de forma predeterminada. Es decir, varias instancias de Worker, tales como Worker1, Worker2 y Worker3, se instalan en un nodo de Core/Task. Varias instancias de Worker interactúan con el Coordinador para ejecutar tareas informáticas, lo que mejora en gran medida la utilización de recursos de nodo y la eficiencia informática.
Presto de instancias múltiples solo se aplica a la arquitectura de Arm. Actualmente, un único nodo admite un máximo de cuatro instancias.
Para obtener más información sobre la implementación de Presto, consulte https://prestodb.io/docs/current/installation/deployment.html o https://trino.io/docs/current/installation/deployment.html.