数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等,挖掘和探索数据价值

 
进入控制台立即购买帮助文档DLI开发者社区1对1咨询                
               

           

华为云618每日限时秒杀

华为云618每日限时秒杀

每日9点开抢,仅限1单,抢完即止!

每日9点开抢,仅限1单,抢完即止!

活动规则
我是老用户,看看新老同享
  • L实例-2C2G2M
  • L实例-2C2G3M
  • L实例-2C2G4M
活动规则
  • 活动对象:

    (1)新用户专享:华为云官网已完成注册和实名认证,且从未购买过华为云资源的用户(客户等级是V0)可购买

    (2)企业新客专享:仅从未购买过华为云资源(客户等级V0),且已完成企业实名认证用户可购买;

    (3)产品新客专享:华为云官网已完成注册和实名认证的用户,且从未购买过华为云当前云产品资源的用户可购买(未限制产品等级);

    (4)新老用户同享:华为云官网已完成注册和实名认证的用户可以购买;

    (具体用户范围以届时活动页面展示为准)

  • 活动时间:

    2024年5月31日-2024年6月30日(活动期间如有调整,以届时活动页面展示为准)

    每天9点限量开抢,售完即止

  • 续费同价说明:

    (1)参与条件:Flexus L实例2核2G4M 98元/年,Flexus L实例2核4G5M 188元/年为续费同价优惠产品,参与条件为:新用户专享,新购、续费同价,每个配置限新购1次,续费1次;

    (2)续费说明:下单购买后,系统将自动赠送一张续费代金券至费用中心-优惠折扣,预计续费代金券到账时间5分钟左右。Flexus L实例2核2G4M 98元/年 续费代金券面额为满700元减652.2元,Flexus L实例2核4G5M 188元/年续费代金券面额为满1030元减892.2元,续费该实例时勾选代金券,则可以实现续费同价优惠,续费代金券有效期为自购买日起1年内有效,请于代金券有效期内完成续费,代金券过期后不予补发;

    (3)退订说明:下单购买该实例后,系统将自动锁定订单,不允许退订;若客户需要退订新购订单,且续费代金券未使用的情况下,可以申请退订,退订时系统将回收未使用的续费代金券,退订费用请查看华为云官网规则说明若续费代金券已使用,则该实例的新购及续费订单均不可退订;

  • 购买说明:

    (1)新用户专享套餐同一用户限购一单,具体台数以活动页面为准;

    (2)同一用户规则:同一用户是指根据不同华为云账号在注册、登录、使用中的关联信息,华为云判断其实际为同一用户。包括但不限于下述情形:具备同一证件号(比如身份证号/护照ID/海外驾照ID/企业唯一识别号等)、域名持有者为同一主体(如同一个人、企业等主体)、同一手机号、同一设备、同一IP地址等;

    (3)套餐配置:

    ①云服务器每款默认配置1个公网IP,高IO或通用型SSD 40G系统盘(部分特价机型仅高IO 40G系统盘;Flexus应用服务器L实例系统盘为高IO,规格大小以下单页显示为准);数据盘有高IO和通用型SSD可选(Flexus应用服务器L实例数据盘为通用型SSD V2),西南-贵阳一和华北-北京一数据中心是静态BGP带宽,其他数据中心配置全动态独享BGP带宽;(以上配置仅供参考,具体配置以下单页面为准)

    ②本页面促销的国内云服务器购买完成后,如需切换镜像版本,可在控制台内进行切换操作;

    ②本页面促销的国内及境外云服务器的Windows镜像暂不支持包周期转按需操作;

    ③境外云服务器,重装系统不支持Linux与Windows互相切换

    ④新用户专区region(不含出海云服务器,最终结果以下单页面为准):

    不同区域的云服务产品之间内网互不相通。所购买的相关产品请位于同一区域内,且就近选择靠近您业务的区域,有助于降低业务运行产生异常的风险,减少网络时延,提高访问速度;

    (4)续费变更:

    促销价仅适用于购买活动页面套餐,续订变更套餐价格(含升配降配)以当期目录价为准,促销价在该场景下不适用,用户选择升配或降配包周期产品前,具体场景或解释说明,请您浏览阅读《变更资源费用说明

    (5)关联账号说明:

    关联模式为财务托管的企业认证账号(即财务托管子账号)不具备交易属性,不参与华为云官网活动等相关交易;关联模式为财务独立的企业认证账号可以参与华为云官网活动等相关交易。

  • 为保证活动的公平公正,华为云有权对实施下述行为的用户采取收回套餐使用资格或者活动优惠资格的措施,且华为云亦有权针对异常账号采取限制措施:

    1)华为云有合理理由相信用户存在恶意刷取活动资源的行为(“恶意”是指为获取资源而异常注册账号等破坏活动公平性的行为);

    2)华为云有合理理由相信用户存在利用资源从事违法违规的行为;

  • 华为云保留对活动规则进行调整的权利,包括但不限于活动规则、产品价格、产品类型、产品数量、产品配置等,请以购买时相关页面的最新展示内容为准。

  • 所有参加本活动的华为云注册用户,已认可并同意遵守《华为云用户协议》及通过援引的形式加入的附件,包括《可接受的使用政策》,《隐私政策声明

    spark 查看作业队列信息 更多内容
  • 队列异常时,DLI怎么保证Spark作业的可靠性?

    队列异常时,DLI怎么保证Spark作业的可靠性? 应用侧调用DLI提交作业,需要有重试机制来保证Spark作业的可靠性。如果队列发生异常时,在后续队列恢复后,通过应用侧重试来保证作业的正常提交。 父主题: 使用咨询

    来自:帮助中心

    查看更多 →

  • 弹性资源池添加队列

    类型 SQL队列:用于运行SQL作业。 通用队列:用于运行Spark作业 、Flink 作业。 执行引擎 如果队列类型选择为“SQL队列”,则可以选择队列引擎是:spark或者trino 企业项目 选择队列的企业项目。弹性资源池支持添加不同企业项目的队列资源。 企业项目是一种云资

    来自:帮助中心

    查看更多 →

  • 查看作业配置信息和日志

    查看作业配置信息和日志 本章节介绍如何查看作业的配置信息和运行日志信息。 背景信息 支持查看所有作业的配置信息。 只有运行中的作业才能查看运行日志信息。 由于Spark SQL和Distcp作业在后台无日志,运行中的Spark SQL和Distcp作业不能查看运行日志信息。 操作步骤

    来自:帮助中心

    查看更多 →

  • 在Hue WebUI使用作业浏览器

    Browser”显示的数字表示集群中所有作业的总数。 “Job Browser”将显示作业以下信息: 表1 MRS作业属性介绍 属性名 描述 “Logs” 表示作业的日志信息。如果作业有输出日志,则显示。 “ID” 表示作业的编号,由系统自动生成。 “Name” 表示作业的名称。 “Application

    来自:帮助中心

    查看更多 →

  • Java SDK概述

    SDK使用说明。 Flink作业相关 介绍新建Flink作业查询作业详情、查询作业列表等Java SDK使用说明。 Spark作业相关 介绍提交Spark作业查询所有Spark作业、删除Spark作业等Java SDK使用说明。 Flink作业模板相关 介绍新建Flink作业模板、更新Fl

    来自:帮助中心

    查看更多 →

  • 查询批处理作业列表

    String 批处理作业的名称。 job-id 否 String 根据作业ID查询作业。 cluster_name 否 String DLI队列名称,不填写则获取当前Project下所有批处理作业(不推荐使用)。 queue_name 否 String DLI队列名称,根据队列查询批作业(推荐使用)。

    来自:帮助中心

    查看更多 →

  • SQL作业运行慢如何定位

    可能原因2:数据倾斜 判断当前作业运行慢是否是数据倾斜导致: 登录DLI控制台,单击“作业管理 > SQL作业”。 在SQL作业页面,在对应作业所在行,单击按钮,查看作业详情信息,获取作业ID。 图9 获取作业ID 在对应作业的“操作”列,单击“Spark UI”,进入到Spark UI页面。 在“Spark

    来自:帮助中心

    查看更多 →

  • 查看弹性资源池扩缩容历史

    查看弹性资源池扩缩容历史 操作场景 当弹性资源池添加队列、删除队列,或添加的队列扩缩容时,可能会引起弹性资源CUs扩缩容变化。控制台提供的“扩缩容历史”功能,可以查看弹性资源池的CUs变化历史。 弹性资源池缩容可能会触发Spark作业和SQL作业内部自动重试,当作业重试超过限制会导致作业执行失败,需用户重新执行作业。

    来自:帮助中心

    查看更多 →

  • 查看标注作业

    查看标注作业 查看创建的作业 查看参与标注的作业 父主题: 人工标注

    来自:帮助中心

    查看更多 →

  • 使用Spark-submit提交Spark Jar作业

    权限介绍和授权操作请参考《数据湖探索用户指南》。 创建队列。在“资源管理 > 队列管理”下,单击右上角“购买队列”,进入购买队列页面选择“通用队列”,即Spark作业的计算资源。 如果创建队列的用户不是管理员用户,在创建队列后,需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。

    来自:帮助中心

    查看更多 →

  • 配置默认项

    作业不能被其他工作空间依赖:该空间的作业不能被其他空间作业依赖。 作业能被其他工作空间依赖:该空间的作业能被其他空间作业依赖,不需要为该用户配置所依赖空间的权限。 作业能被其他空间作业依赖(需要该空间作业列表的查询权限):该空间的作业能被其他空间作业依赖,需要为该用户配置所依赖空间的权限。如果没有为该用户配置

    来自:帮助中心

    查看更多 →

  • 设置作业优先级

    优先满足高优先级作业的计算资源,即如果高优先级作业计算资源不足,则会减少低优先级作业的计算资源 通用队列上运行的Flink作业优先级默认为5。 通用队列上运行的Spark作业的优先级默认为3。 SQL队列上运行的作业优先级默认为3。 作业优先级的调整需要停止作业进行编辑,并提交运行才能生效。

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    《创建批处理作业》。 创建Spark作业完成后,在控制台单击右上角“执行”提交作业,页面显示“批处理作业提交成功”说明Spark作业提交成功,可以在Spark作业管理页面查看提交的作业的状态和日志。 创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。 如果选择spark版本为2

    来自:帮助中心

    查看更多 →

  • 队列管理概述

    Administrator权限。 队列管理页面显示用户创建所有的队列和服务预置的default队列,您可以查看队列容量、计费方式等信息队列列表默认按创建时间排列,创建时间最近的队列显示在最前端。 表2 队列管理参数 参数 参数说明 名称 队列的名称。 类型 队列的类型。 SQL队列 通用队列 Spark队列(兼容老版本)

    来自:帮助中心

    查看更多 →

  • 创建函数

    复导致创建失败。这时可以考虑使用OR REPLACE,或者替换所有作业中的函数F1为F2。 需要重启Spark SQL队列后新创建的自定义函数F2生效 需要重启Spark SQL队列,影响当前运行的作业。 重启队列后,影响F1原有功能,F1的功能变为和F2一样。 场景二 在原有程

    来自:帮助中心

    查看更多 →

  • 创建函数

    复导致创建失败。这时可以考虑使用OR REPLACE,或者替换所有作业中的函数F1为F2。 需要重启Spark SQL队列后新创建的自定义函数F2生效 需要重启Spark SQL队列,影响当前运行的作业。 重启队列后,影响F1原有功能,F1的功能变为和F2一样。 场景二 在原有程

    来自:帮助中心

    查看更多 →

  • Spark作业模板相关API

    Spark作业模板相关API 创建作业模板 查询作业模板列表 修改作业模板 获取作业模板

    来自:帮助中心

    查看更多 →

  • Spark作业访问MySQL数据库的方案

    Spark作业访问MySQL数据库的方案 通过DLI Spark作业访问MySQL数据库中的数据有如下两种方案: 方案1:在DLI中创建队列队列计费模式为包年/包月队列或按需专属,创建增强型跨源连接,再通过跨源表读取MySQL数据库中的数据,该方案需要用户自行编写java代码或scala代码。

    来自:帮助中心

    查看更多 →

  • 查询单个作业信息

    Float 作业执行进度。 job_type String 作业类型。 MapReduce SparkSubmit:SparkPython类型的作业查询作业类型请选择SparkSubmit。 HiveScript HiveSql DistCp,导入、导出数据。 SparkScript

    来自:帮助中心

    查看更多 →

  • 查询批处理作业详情

    否 String 批处理作业所属用户。 proxyUser 否 String 批处理作业所属代理用户(资源租户)。 state 否 String 批处理作业的状态,请参见创建批处理作业中的表7。 kind 否 String 批处理作业类型,只支持spark类型参数。 log 否 Array

    来自:帮助中心

    查看更多 →

  • 修订记录

    新增怎样升级DLI作业的引擎版本。 2024-04-29 移动计费类常见问题至计费说明手册中。 2024-04-07 修改通用队列操作OBS表如何设置AK/SK。 2024-03-30 新增执行SQL作业时产生数据倾斜怎么办?。 2024-01-30 新增怎样查看弹性资源池和作业的资源使用情况?。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了