数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等,挖掘和探索数据价值

 
进入控制台立即购买帮助文档DLI开发者社区1对1咨询                
               

           

华为云618每日限时秒杀

华为云618每日限时秒杀

每日9点开抢,仅限1单,抢完即止!

每日9点开抢,仅限1单,抢完即止!

活动规则
我是老用户,看看新老同享
  • L实例-2C2G2M
  • L实例-2C2G3M
  • L实例-2C2G4M
活动规则
  • 活动对象:

    (1)新用户专享:华为云官网已完成注册和实名认证,且从未购买过华为云资源的用户(客户等级是V0)可购买

    (2)企业新客专享:仅从未购买过华为云资源(客户等级V0),且已完成企业实名认证用户可购买;

    (3)产品新客专享:华为云官网已完成注册和实名认证的用户,且从未购买过华为云当前云产品资源的用户可购买(未限制产品等级);

    (4)新老用户同享:华为云官网已完成注册和实名认证的用户可以购买;

    (具体用户范围以届时活动页面展示为准)

  • 活动时间:

    2024年5月31日-2024年6月30日(活动期间如有调整,以届时活动页面展示为准)

    每天9点限量开抢,售完即止

  • 续费同价说明:

    (1)参与条件:Flexus L实例2核2G4M 98元/年,Flexus L实例2核4G5M 188元/年为续费同价优惠产品,参与条件为:新用户专享,新购、续费同价,每个配置限新购1次,续费1次;

    (2)续费说明:下单购买后,系统将自动赠送一张续费代金券至费用中心-优惠折扣,预计续费代金券到账时间5分钟左右。Flexus L实例2核2G4M 98元/年 续费代金券面额为满700元减652.2元,Flexus L实例2核4G5M 188元/年续费代金券面额为满1030元减892.2元,续费该实例时勾选代金券,则可以实现续费同价优惠,续费代金券有效期为自购买日起1年内有效,请于代金券有效期内完成续费,代金券过期后不予补发;

    (3)退订说明:下单购买该实例后,系统将自动锁定订单,不允许退订;若客户需要退订新购订单,且续费代金券未使用的情况下,可以申请退订,退订时系统将回收未使用的续费代金券,退订费用请查看华为云官网规则说明若续费代金券已使用,则该实例的新购及续费订单均不可退订;

  • 购买说明:

    (1)新用户专享套餐同一用户限购一单,具体台数以活动页面为准;

    (2)同一用户规则:同一用户是指根据不同华为云账号在注册、登录、使用中的关联信息,华为云判断其实际为同一用户。包括但不限于下述情形:具备同一证件号(比如身份证号/护照ID/海外驾照ID/企业唯一识别号等)、域名持有者为同一主体(如同一个人、企业等主体)、同一手机号、同一设备、同一IP地址等;

    (3)套餐配置:

    ①云服务器每款默认配置1个公网IP,高IO或通用型SSD 40G系统盘(部分特价机型仅高IO 40G系统盘;Flexus应用服务器L实例系统盘为高IO,规格大小以下单页显示为准);数据盘有高IO和通用型SSD可选(Flexus应用服务器L实例数据盘为通用型SSD V2),西南-贵阳一和华北-北京一数据中心是静态BGP带宽,其他数据中心配置全动态独享BGP带宽;(以上配置仅供参考,具体配置以下单页面为准)

    ②本页面促销的国内云服务器购买完成后,如需切换镜像版本,可在控制台内进行切换操作;

    ②本页面促销的国内及境外云服务器的Windows镜像暂不支持包周期转按需操作;

    ③境外云服务器,重装系统不支持Linux与Windows互相切换

    ④新用户专区region(不含出海云服务器,最终结果以下单页面为准):

    不同区域的云服务产品之间内网互不相通。所购买的相关产品请位于同一区域内,且就近选择靠近您业务的区域,有助于降低业务运行产生异常的风险,减少网络时延,提高访问速度;

    (4)续费变更:

    促销价仅适用于购买活动页面套餐,续订变更套餐价格(含升配降配)以当期目录价为准,促销价在该场景下不适用,用户选择升配或降配包周期产品前,具体场景或解释说明,请您浏览阅读《变更资源费用说明

    (5)关联账号说明:

    关联模式为财务托管的企业认证账号(即财务托管子账号)不具备交易属性,不参与华为云官网活动等相关交易;关联模式为财务独立的企业认证账号可以参与华为云官网活动等相关交易。

  • 为保证活动的公平公正,华为云有权对实施下述行为的用户采取收回套餐使用资格或者活动优惠资格的措施,且华为云亦有权针对异常账号采取限制措施:

    1)华为云有合理理由相信用户存在恶意刷取活动资源的行为(“恶意”是指为获取资源而异常注册账号等破坏活动公平性的行为);

    2)华为云有合理理由相信用户存在利用资源从事违法违规的行为;

  • 华为云保留对活动规则进行调整的权利,包括但不限于活动规则、产品价格、产品类型、产品数量、产品配置等,请以购买时相关页面的最新展示内容为准。

  • 所有参加本活动的华为云注册用户,已认可并同意遵守《华为云用户协议》及通过援引的形式加入的附件,包括《可接受的使用政策》,《隐私政策声明

    数据湖探索dli 更多内容
  • 通过DLI Flink作业将Kafka数据实时写入DWS

    OBS、分布式消息服务 Kafka、数据湖探索 DLI数据仓库服务 GaussDB(DWS),基本流程如下: 准备工作 步骤一:创建Kafka实例 步骤二:创建绑定ELB的DWS集群和目标表 步骤三:创建DLI队列 步骤四:分别创建Kafka和DWS的增强型跨源连接 步骤五:准备DWS对接Fl

    来自:帮助中心

    查看更多 →

  • java样例代码

    auth.user”以及“es.net.http.auth.pass”为创建集群时设置的账号和密码。 插入数据 1 sparkSession.sql("insert into css_table values(18, 'John'),(28, 'Bob')"); 查询数据 1 sparkSession

    来自:帮助中心

    查看更多 →

  • 迁移Hive数据至DLI

    CDM配置MRS Hive数据源 单击“保存”完成MRS Hive数据源配置。 配置目的端DLI数据源连接。 登录CDM控制台,选择“集群管理”,选择已创建的CDM集群,在操作列选择“作业管理”。 在作业管理界面,选择“连接管理”,单击“新建连接”,连接器类型选择“数据湖探索(DLI)”,单击“下一步”。

    来自:帮助中心

    查看更多 →

  • DLI SQL

    禁用该功能。 是否记录脏数据 是 单击选择节点是否记录脏数据。 是:记录脏数据 否:不记录脏数据 说明: 脏数据即Bad Records,由于数据类型不兼容、数据为空或者格式不兼容而导致无法加载到DLI中的记录归类为Bad Records。 选择记录脏数据后,Bad Record

    来自:帮助中心

    查看更多 →

  • DLI Spark

    datasource.css DLI内部相关模块: sys.res.dli-v2 sys.res.dli sys.datasource.dli-inner-table 访问元数据 是 是否通过Spark作业访问元数据。具体请参考使用Spark作业访问DLI数据。 表2 高级参数 参数

    来自:帮助中心

    查看更多 →

  • Spark作业使用咨询

    资源包仅提供托管服务,不提供下载功能。 如何使用API通过公网访问DLIDLI域名公网访问请使用域名访问:dli.{regionid}.myhuaweicloud.com 数据湖探索的终端节点请参考终端节点。 数据湖探索API请参考:数据湖探索API。 DLI自定义的Spark3

    来自:帮助中心

    查看更多 →

  • DLI如何访问OBS桶中的数据

    DLI如何访问OBS桶中的数据 创建OBS表。 具体语法请参考《数据湖探索SQL语法参考》。 添加分区。 具体语法请参考《数据湖探索SQL语法参考》。 往分区导入OBS桶中的数据。 具体语法请参考《数据湖探索SQL语法参考》。 查询数据。 具体语法请参考《数据湖探索SQL语法参考》。

    来自:帮助中心

    查看更多 →

  • java样例代码

    情讲解可参考表1。 插入数据 1 sparkSession.sql("insert into opentsdb_new_test values('Penglai', 'abc', '2021-06-30 18:00:00', 30.0)"); 查询数据 1 sparkSession

    来自:帮助中心

    查看更多 →

  • 怎样排查DLI计费异常?

    计费详情可参考《数据湖探索价格详情》。 如果在扣费时间段内没有执行过作业,则请继续排查是否是因为存储了大量数据而产生的计费。具体操作请参考数据存储。 数据存储 进入“数据管理”>“库表管理”页面。 查看所建的数据库中是否有存储在DLI中的数据: 单击所要查看的数据库名,进入对应的“表管理”页面;

    来自:帮助中心

    查看更多 →

  • 快速使用SQL语句查询数据

    数据湖探索快速入门 快速使用SQL语句查询数据 数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark、Apache Flink、Trino生态,提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任

    来自:帮助中心

    查看更多 →

  • 身份认证与访问控制

    租户管理员。 操作权限:具有所有云服务的管理和使用权限。创建后,可通过ACL赋权给其他子用户使用。 作用范围:项目级服务。 系统角色 DLI Service Administrator DLI服务管理员。 操作权限:具有数据湖探索服务队列、数据的管理和使用权限。创建后,可通过ACL赋权给其他子用户使用。

    来自:帮助中心

    查看更多 →

  • 开始使用

    SQL编辑器数据库中表创建成功。 图4 在default数据库中建表 在数据湖探索 DLI的default数据库中执行的建表语句: CREATE TABLE IF NOT EXISTS default.t_user_store_info ( uuid STRING COMMENT

    来自:帮助中心

    查看更多 →

  • DLI细粒度授权

    员,您希望他们拥有DLI的使用权限,但是不希望他们拥有删除DLI等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用DLI,但是不允许删除DLI的权限策略,控制他们对DLI资源的使用范围。 对于新建的用户,需要先登录一次DLI,记录元数据,后续才可正常使用。

    来自:帮助中心

    查看更多 →

  • 终端节点

    ,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 数据湖探索的终端节点如下表所示,请您根据业务需要选择对应区域的终端节点。 表1 数据湖探索的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四 cn-north-4 dli.cn-north-4

    来自:帮助中心

    查看更多 →

  • 监控安全风险

    监控安全风险 云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务,提供基于云监控服务的资源监控能力,帮助

    来自:帮助中心

    查看更多 →

  • DataArts Studio支持的数据源

    业PB级海量大数据分析提供有竞争力的解决方案。 数据湖探索(DLI) 华为云DLI是完全兼容Apache Spark和Apache Flink生态,实现批流一体的Serverless大数据计算分析服务DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流

    来自:帮助中心

    查看更多 →

  • 发现敏感数据

    前提条件 已完成敏感数据规则组定义,请参考定义识别规则分组。 已在管理中心创建数据仓库服务(DWS)、数据湖探索(DLI)、MapReduce服务(MRS Hive)类型的数据连接,请参考新建数据连接。 DLI敏感数据发现时,需要提前准备DLI通用队列。 如需将识别的敏感数据自动同步到数据地图组件,则必须由DAYU

    来自:帮助中心

    查看更多 →

  • DLI控制台总览

    DLI控制台总览 数据探索服务控制台总览页为您提供数据湖探索服务使用流程及队列资源使用情况总览。 使用流程简介 数据湖探索服务使用流程简介: 创建队列 队列是DLI的计算资源:SQL队列和通用队列。SQL队列支持提交Spark SQL作业,通用队列支持Spark程序、Flink opensource

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    有四种保存类型: ErrorIfExis:如果已经存在数据,则抛出异常。 Overwrite:如果已经存在数据,则覆盖原数据。 Append:如果已经存在数据,则追加保存。 Ignore:如果已经存在数据,则不做操作。这类似于SQL中的“如果不存在则创建表”。 读取RDS上的数据 1 2 3

    来自:帮助中心

    查看更多 →

  • 云服务事件源

    AS 漏洞扫描服务 VSS 图引擎服务 GES 数据湖探索 DLI 云容器实例 CCI 需求管理 CodeArts Req 文档数据服务 DDS 数据复制服务 DRS AI平台ModelArts 分布式数据库中间件 DDM 消息通知服务 SMN 应用管理与运维平台 ServiceStage

    来自:帮助中心

    查看更多 →

  • 案例:搭建实时报警平台

    方案设计 操作流程如下: 实时数据导入:通过数据接入服务(DIS)将数据中心的告警数据实时导入到数据湖探索(DLI)。 数据清洗和预处理:DLI对告警数据进行数据清洗和预处理。 发送告警消息:当告警级别超过指定值时向用户发送短信。 数据导出和存储:清洗过的数据进入DIS通道,DIS根据导入时间将告警数据按日期存放到OBS。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了