产品优势
纯SQL操作,上手零门槛
- DLI提供标准SQL接口,用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。
- 有效降低数据分析师、业务人员使用门槛,提升数据分析效率。
存算分离,资源高效灵活
- DLI解耦计算和存储负载,存算分离架构,存储资源和计算资源按需灵活配置,提高了资源利用率,降低了成本。
- 弹性资源池功能支持Flink、Spark等多引擎共享资源,进一步优化资源分配效率。
Serverless架构,全场景适配
DLI完全兼容Apache Spark、Apache Flink生态和接口,是集实时分析、离线分析、交互式分析为一体的Serverless大数据计算分析服务。
- 线下Spark/Flink应用无缝迁移上云,迁移工作量显著减少,业务平滑过渡。
- 采用批流融合高扩展性框架,为TB~EB级数据提供了更实时高效的多样性算力,可支撑更丰富的大数据处理需求。
- 产品内核及架构深度优化,综合性能是传统MapReduce模型的百倍以上,SLA保障99.95%可用性。
企业级多租户,安全可控
支持计算资源按租户隔离,数据权限控制到队列、作业,帮助企业实现部门间的数据共享和权限管理。
跨源分析,数据无需搬迁
- 兼容多种数据格式,支持云上多种数据源(OBS、RDS、DWS、CSS、MongoDB、Redis等)、ECS自建数据库及线下数据库等多源数据。
- 无需数据搬迁即可实现跨数据源统一分析,构建企业数据统一视图,加速业务创新。
与传统自建Hadoop集群对比优势
与传统自建Hadoop集群相比,Serverless架构的DLI还具有以下优势:
优势 | 维度 | 数据湖探索 DLI | 自建Hadoop系统 |
|---|---|---|---|
低成本 | 资金成本 | 按照实际扫描数据量或者CU时收费,可变成本,成本可节约50%。 | 长期占用资源,资源浪费严重,成本高。 |
弹性扩缩容能力 | 基于容器化Kubernetes,具有弹性伸缩能力。 | 资源配置固定。 | |
免运维 | 运维成本 | 即开即用,Serverless架构,无需专业运维团队。 | 需专业技术人员完成搭建、配置、维护,运维难度高。 |
高可用 | 跨AZ容灾设计,保障服务稳定运行。 | 可用性依赖自建保障。 | |
高易用 | 学习成本 | 学习成本低,包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。 | 学习成本高,需要了解上百个调优参数。 |
支持数据源 |
|
| |
生态兼容 | DLV、永洪BI、帆软。 | 大数据生态工具。 | |
自定义镜像 | 支持自定义镜像,满足多样化业务场景需求。 | 无 | |
工作流调度 | 集成DataArts Studio-DLF调度,流程化管理高效 | 自建大数据生态的调度工具,如Airflow。 | |
企业级多租户 | 基于表的权限管理,可以精细化到列权限。 | 基于文件的权限管理。 | |
高性能 | 性能 | 基于软硬件一体化的深度垂直优化,处理速度快。 | 大数据开源版本性能,无额优化。 |

