数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等,挖掘和探索数据价值

 
进入控制台立即购买帮助文档DLI开发者社区1对1咨询                
               

           

    dli服务 更多内容
  • 更新模板

    更新模板 功能介绍 该API用于对 DLI 服务中已有的模板进行更新。 调试 您可以在 API Explorer 中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/streaming/job-templates/{template_id} 参数说明 表1 URI参数说明

    来自:帮助中心

    查看更多 →

  • ALTER EXTERNAL SCHEMA

    g。 OPTIONS 用于指定外表数据的各类参数,参数类型如下所示。该参数仅8.3.0及以上版本支持。 dli_project_id DLI服务对应的项目编号,可在管理控制台上获取项目ID,该参数仅支持server类型为DLI时设置。 METAADDRESS 表示hivemetastore通讯接口。该参数仅9

    来自:帮助中心

    查看更多 →

  • 配置DLI作业桶

    配置DLI作业桶 使用DLI服务前需配置DLI作业桶,该桶用于存储DLI作业运行过程中产生的临时数据,例如:作业日志、作业结果。 本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。 操作前准备 配置前,请先购买OBS桶或并行文件系统。 大数据场景推

    来自:帮助中心

    查看更多 →

  • 管理计算资源

    管理计算资源 计算资源DLI服务,添加的计算资源需根据实情情况进行合理分配。开通DLI集群大小就是根据业务需求对集群进行扩容缩容,计算资源最多设置5个。计算资源支持的操作包括: 创建计算资源 编辑计算资源 删除计算资源 创建计算资源 登录RES管理控制台,在“全局配置”页面的计算资源区域,单击“创建”添加计算资源。

    来自:帮助中心

    查看更多 →

  • 新建跨源连接,显示已激活,但使用时提示communication link failure错误怎么办?

    检查网段及端口是否配置。 如果不存在,则进行添加。 图5 添加出方向规则 增强型跨源 检查DLI队列对应网段是否开放,若没有,则在vpc中添加出方向网段。 在DLI服务找到跨源连接绑定队列对应的网段 图6 查找跨源连接绑定队列对应的网段 在虚拟私有 云安全 组中查看DLI队列对应的网段是否已配置。 图7 查

    来自:帮助中心

    查看更多 →

  • 应用场景

    应用场景 DLI服务适用于海量 日志分析 、异构数据源联邦分析、大数据ETL处理。 海量日志分析 游戏运营数据分析 游戏公司不同部门日常通过游戏数据分析平台,分析每日新增日志获取所需指标,通过数据来辅助决策。例如:运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等,了解

    来自:帮助中心

    查看更多 →

  • ALTER SERVER

    port组对推荐设置两组,分别对应HDFS NameNode主备节点的address。 当server类型为DLI时,address为DLI服务上数据所存储的OBS address。 hdfscfgpath HDFS集群的配置文件。 若HDFS走安全模式时,hdfscfgpath是必选项,否则为可选项。

    来自:帮助中心

    查看更多 →

  • 创建集群(废弃)

    是 Integer 与集群绑定的计算单元个数, 同时是计费的单元。可选择16CU,64CU和256CU三种规格,如果需要更大配额,请联系DLI服务管理员。 cidr_in_vpc 否 String vpc的网段。 cidr_in_mgntsubnet 否 String 管理子网的网段。

    来自:帮助中心

    查看更多 →

  • DLI

    Lake Insight,简称DLI)服务的数据集。 前提条件 连接的数据源已创建,如何创建请参见DLI数据源。 在DLI构建数据 登录DLI服务控制台。 参考创建并提交Spark SQL作业中操作,创建队列、数据库和表。 例如,创建了数据库tpch,且数据库中预置了所需的表。 图1

    来自:帮助中心

    查看更多 →

  • 错误码

    DLI队列删除失败({0}) 请联系管理员检查DLI服务功能是否正常。 500 RES.3006 DLI Error 发起DLI任务失败,任务名称是{0} 请联系管理员检查DLI服务功能是否正常 500 RES.3007 DLI Error DLI服务端系统错误 请联系管理员检查DLI服务功能是否正常。 500

    来自:帮助中心

    查看更多 →

  • 开始使用

    查看DLI。在控制台单击“服务列表”,选择“ 数据湖探索 DLI”,单击进入DLI服务页面。单击“资源管理 > 队列管理”,查询创建的DLI队列。 图4 DLI队列 配置DLI服务授权。单击“全局变量>服务授权”,选定以下两项委托授权,单击“更新委托权限”。 图5 DLI服务授权 体验Demo样例。获取Demo数据样例文件,上传至3

    来自:帮助中心

    查看更多 →

  • 怎样排查DLI计费异常?

    怎样排查DLI计费异常? 如果您在使用DLI服务的过程中,感觉计费有异常,可按照以下步骤进行排查: 包周期资源与预付费资源,本节操作重点介绍怎样排查按需资源使用中的扣费异常。 SQL作业 登录DLI管理控制台。 进入“作业管理”>“SQL作业”页面。 查看需要确认的作业详情,确认在扣费时间段内是否有以下操作:

    来自:帮助中心

    查看更多 →

  • 身份认证与访问控制

    操作权限:具有所有云服务的管理和使用权限。创建后,可通过ACL赋权给其他子用户使用。 作用范围:项目级服务。 系统角色 DLI Service Administrator DLI服务管理员。 操作权限:具有 数据湖 探索服务队列、数据的管理和使用权限。创建后,可通过ACL赋权给其他子用户使用。 作用范围:项目级服务。 系统角色

    来自:帮助中心

    查看更多 →

  • ALTER SERVER

    port组对推荐设置两组,分别对应HDFS NameNode主备节点的address。 当server类型为DLI时,address为DLI服务上数据所存储的OBS address。 hdfscfgpath HDFS集群的配置文件。 若HDFS走安全模式时,hdfscfgpath是必选项,否则为可选项。

    来自:帮助中心

    查看更多 →

  • ALTER SERVER

    port组对推荐设置两组,分别对应HDFS NameNode主备节点的address。 当server类型为DLI时,address为DLI服务上数据所存储的OBS address。 hdfscfgpath HDFS集群的配置文件。 若HDFS走安全模式时,hdfscfgpath是必选项,否则为可选项。

    来自:帮助中心

    查看更多 →

  • 使用自定义镜像增强作业运行环境

    使用Dockerfile将作业运行需要的依赖(文件、jar包或者软件)打包到镜像中,生成 自定义镜像 。 将镜像发布到SWR( 容器镜像服务 )中。 在DLI服务作业编辑页面选择自己生成的镜像,运行作业。 查看作业执行情况。 获取DLI基础镜像 表1 获取DLI基础镜像 镜像类型 架构 URL general镜像

    来自:帮助中心

    查看更多 →

  • 套餐包计费

    适用于可预估队列使用量的场景、或测试项目等资源消耗不高的场景。 弹性资源池CU时套餐包的额度按订购周期重置。 存储量套餐包 按照存储在DLI服务中的数据存储量(单位为“GB”)收取存储费用。 适用于在DLI 存储表数据的场景,例如时延敏感类的业务将表存储在DLI,使用存储量套餐包可以节省存储费用。

    来自:帮助中心

    查看更多 →

  • 如何在DLI中运行复杂PySpark程序?

    到执行机器上,对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源,那如何来保证用户可以更好的运行他的程序呢? DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库(具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖

    来自:帮助中心

    查看更多 →

  • API概览

    和导出查询结果。 SQL模板相关API 包括保存SQL模板、创建作业模板等模板相关API。 Flink作业相关API 包括OBS授权给DLI服务、新建SQL作业、更新SQL作业、新建Flink自定义作业、更新Flink自定义作业、批量运行作业、查询作业列表、查询作业详情、查询作业

    来自:帮助中心

    查看更多 →

  • 已购买套餐包,为什么仍然产生按需计费?

    适用于可预估队列使用量的场景、或测试项目等资源消耗不高的场景。 弹性资源池CU时套餐包的额度按订购周期重置。 存储量套餐包 按照存储在DLI服务中的数据存储量(单位为“GB”)收取存储费用。 适用于在DLI 存储表数据的场景,例如时延敏感类的业务将表存储在DLI,使用存储量套餐包可以节省存储费用。

    来自:帮助中心

    查看更多 →

  • CSS安全集群配置

    当前 CSS 服务提供的Elasticsearch 6.5.4或以上集群版本为用户增加了安全模式功能,开启安全模式后,将会为用户提供身份验证、授权以及加密等功能。DLI服务对接 CS S安全集群时,需要先进行以下准备工作。 选择CSS Elasticsearch 6.5.4或以上集群版本,创建CSS安全集群,并

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了