数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据挖掘与数据仓库的案例 更多内容
  • 华为云数据仓库高级工程师培训

    数据仓库 行业发展趋势解决方案,协助企业管理者构建具有竞争力数据仓库解决方案,助力数字化转型。 培训对象 信息技术主管 数据库管理员 数据库开发者 培训目标 完成该培训后,您将熟悉云化分布式数据仓库架构、数据库设计管理、数据迁移、数据库运维调优,数据库安全管理和高可

    来自:帮助中心

    查看更多 →

  • 数据仓库专家服务

    为云服务。 客户必须提供业务系统相关信息(包括但不限于技术栈、应用架构、部署架构、数据量和性能等)。 在华为云提供实施服务过程中,如客户提供资料中含有第三方软件,客户须负责第三方厂商交涉,协助华为云解决问题。 授权华为团队迁移相关操作权限。 华为责任 华为需明确此次迁移项目负责人。

    来自:帮助中心

    查看更多 →

  • 有没有Kafka Stream的案例?

    有没有Kafka Stream案例? Kafka Stream案例请参见Kafka Stream官网。 父主题: 实例问题

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    案例:选择合适分布列 分布列用于将数据分布到不同节点上,划分均衡可以避免数据倾斜。 在进行关联查询时,尽量选择查询中关联条件作为分布键。当关联条件作为分布键时,相关数据都分布在DN本地,将减少DN之间数据流动代价,提升查询速度。 优化前 将a作为t1和t2分布列,表定义如下:

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    则执行计划将存在“Streaming”,导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适分布列案例(一) 如果将a作为t1分布列,将b作为t2分布列: 1 2 CREATE TABLE t1 (a int, b int) DISTRIBUTE BY HASH (a);

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    Hive是一个开源,建立在Hadoop上数据仓库框架,提供类似SQLHQL语言操作结构化数据,其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务,从而完成对Hadoop集群中存储海量数据进行查询和分析。 Hive主要特点如下: 通过HQL语言非常容易完成数据提取、转换和加载(ETL)。

    来自:帮助中心

    查看更多 →

  • 数据库、数据仓库、数据湖、湖仓一体分别是什么?

    数据隐藏价值,人们越来越多需要使用联机分析处理OLAP(On-Line Analytical Processing)进行数据分析,探究一些深层次关系和信息。但是不同数据库之间很难做到数据共享,数据之间集成分析也存在非常大挑战。 为解决企业数据集成分析问题,数据仓

    来自:帮助中心

    查看更多 →

  • 使用AI案例

    emo”和“评论”等信息。 部分案例可能发布者未提供“关联资产”、“输出样例”或“体验Demo”。 在详情页面单击“订阅”。 案例被订阅后,详情页“订阅”按钮显示为“已订阅”,订阅成功资产也会展示在“我Gallery > 我案例 > 我订阅”。 订阅成功后,单击“Run

    来自:帮助中心

    查看更多 →

  • 案例:NOT IN转NOT EXISTS

    执行下列SQL语句,查询NOT IN执行计划: 1 EXPLAIN VERBOSE SELECT * FROM t1 WHERE t1.c NOT IN (SELECT t2.c FROM t2); 返回结果如图: 从返回结果可知执行计划走NestLoop,因为NULL值跟任意值OR运算结果都是NULL,WHERE条件表达式:

    来自:帮助中心

    查看更多 →

  • 容灾互斥案例

    除容灾,请参见删除容灾。 在生产、灾备集群所在行“操作”列,选择“更多>扩容”,确认节点规格后执行扩容操作。 创建容灾,请参见创建容灾。 启动容灾,请参见启动容灾。 扩容后生产集群和灾备集群需逻辑同构,即:扩容后生产、灾备集群DN数量保持一致。 父主题: 集群容灾

    来自:帮助中心

    查看更多 →

  • 案例:改写SQL消除子查询(案例2)

    ls_policyno_cusr1 = t2.ls_policyno_cusr1 ); 对应执行计划如下: 优化说明 很明显,执行计划中存在SubPlan,并且SubPlan中运算相当重,即此SubPlan是一个明确性能瓶颈点。 根据SQL语意等价改写SQL消除SubPlan如下: 1 2 3

    来自:帮助中心

    查看更多 →

  • 案例:改写SQL消除子查询(案例1)

    ca_address_sk group by a.ca_address_sk; 为了保证改写等效性,在customer_address_001. ca_address_sk加了not null约束。 父主题: 实际调优案例

    来自:帮助中心

    查看更多 →

  • 案例:改写SQL消除子查询(案例2)

    ls_policyno_cusr1 = t2.ls_policyno_cusr1 ); 对应执行计划如下: 优化说明 很明显,执行计划中存在SubPlan,并且SubPlan中运算相当重,即此SubPlan是一个明确性能瓶颈点。 根据SQL语意等价改写SQL消除SubPlan如下: 1 2 3

    来自:帮助中心

    查看更多 →

  • 创建数据仓库 GaussDB(DWS)

    创建数据仓库 GaussDB (DWS) 参见“创建集群”章节创建GaussDB(DWS)数据仓库。创建成功后,记录集群内网IP。 为确保E CS GaussDB(DWS)网络互通,GaussDB(DWS)数据仓库需要与ECS在同一个区域,同一个虚拟私有云和子网下。 表1 DWS规格

    来自:帮助中心

    查看更多 →

  • 数据仓库错误码

    数据仓库错误码 SQL标准错误码说明 第三方库错误码说明 GAUSS-00001 -- GAUSS-00100 GAUSS-00101 -- GAUSS-00200 GAUSS-00201 -- GAUSS-00300 GAUSS-00301 -- GAUSS-00400 GAUSS-00401

    来自:帮助中心

    查看更多 →

  • 高频故障案例

    高频故障案例 弹性云服务器 访问中国大陆外网站时加载缓慢怎么办? ping不通或丢包时如何进行链路测试? 访问ECS实例上运行网站卡顿,如何定位问题? 网站无法访问怎么办? 云服务器 端口不通怎样排查? 云 服务器 带宽占用高怎么办? Windows云服务器卡顿怎么办? Linux云服务器卡顿怎么办?

    来自:帮助中心

    查看更多 →

  • 案例:设置cost

    件分别计算2个选择率值相乘来得到hashjoin条件选择率,导致行数估算不准确,查询性能较差。所以需要将cost_parambit1为1时,选择最小选择率作为总选择率估算行数比较准确,查询性能较好,优化后计划如下图所示: 父主题: 实际调优案例

    来自:帮助中心

    查看更多 →

  • 更多案例实践

    更多案例实践 关于数据集成更多使用进阶指导和案例,请参见最佳实践。 父主题: 使用教程

    来自:帮助中心

    查看更多 →

  • 案例:改写SQL消除子查询(案例1)

    此SQL性能较差,查看发现执行计划中存在SubPlan,引用SubPlan结果算子可能需要反复调用获取这个SubPlan值,即SubPlan以下结果要重复执行很多次。具体如下: 优化说明 此优化核心就是消除子查询。那么从SQL语义出发,可以等价改写SQL为: 1 2 3 4

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    域展示)等场景下。 为保证Hive服务高可用性、用户数据安全及访问服务可控制,在开源社区Hive-3.1.0版本基础上,Hive新增如下特性: 基于Kerberos技术安全认证机制。 数据文件加密机制。 完善权限管理。 开源社区Hive特性,请参见https://cwiki

    来自:帮助中心

    查看更多 →

  • DWS源表

    Service,简称DWS)是一种基于基础架构和平台在线数据处理数据库,为用户提供海量数据挖掘和分析服务。DWS更多信息,请参见《数据仓库服务管理指南》。 前提条件 请务必确保您账户下已在数据仓库服务(DWS)里创建了DWS集群。 如何创建DWS集群,请参考《数据仓库服务管理指南》中“创建集群”章节。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了