hadoop如何设计数据仓库_支持的数据源（2.9.2.200）-华为云

支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（ DLI ）， MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
支持的数据源（2.10.0.300）

loudTable），SAP HANA MRS Hudi 数据仓库：数据仓库服务（DWS） Hadoop：MRS HBase Apache HBase 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
成长地图

了解更多常见问题、案例和解决方案热门案例数据库、数据仓库、数据湖、湖仓一体分别是什么？为什么要使用云数据仓库服务 GaussDB (DWS)？无法连接数据仓库集群时怎么处理？如何选择公有云DWS或者公有云RDS？数据在数据仓库服务中是否安全？如何清理与回收存储空间？更多数据库连接

来自：帮助中心

查看更多 →
配置Hadoop数据传输加密

，需要使用安全加密通道，配置如下参数。安全Hadoop RPC相关信息请参考： MRS 3.2.0之前版本：https://hadoop.apache.org/docs/r3.1.1/hadoop-project-dist/hadoop-common/SecureMode.htm

来自：帮助中心

查看更多 →
配置Hadoop数据传输加密

缺省值为“3des”，表示采用3DES算法进行加密。此处的值还可以设置为“rc4”，避免出现安全隐患，不推荐设置为该值。 3des HDFS hadoop.rpc.protection 设置Hadoop中各模块的RPC通道是否加密。包括：客户端访问HDFS的RPC通道。 HDFS中各模块间的RPC通道，如Da

来自：帮助中心

查看更多 →
维度建模

数据源分析：主要分析数据仓库的数据如何满足集市的需要，即确定需要数据仓库的那些表数据，如果数据仓库没有，则需要数据仓库进行数据补充数据仓库表与目标表字段进行映射，确定加工规则验证数据并调整加工规则实施步骤根据设计好的目标表，创建DM层物理表基于两张汇总表进行逻辑开发和字段映射验证数据并

来自：帮助中心

查看更多 →
流程设计

流程设计宏观层面：重点是组织架构与流程架构匹配，组织设置必须支撑流程价值实现，组织职责必须清晰具体，不能有重叠、空白、过多、过少；微观层面：看流程角色职责是否通过岗位职责的设置有效落实，岗位职责与其匹配的流程角色职责相符。单击左侧导航栏“流程设计”并进入流程设计页面。图1

来自：帮助中心

查看更多 →
设计原则

设计原则以下是常用的性能优化指导原则：中心化原则：识别支配性工作量负载功能，并使其处理过程最小化，把注意力集中在对性能影响最大的部分进行提升。本地化原则：选择靠近的活动、功能和结果的资源；避免通过间接的方式去达到目的，导致通信量或者处理量大辐增加，性能大辐下降。共享资源：

来自：帮助中心

查看更多 →
设计优化

设计优化 PERF05-01 设计优化父主题： PERF05 性能优化

来自：帮助中心

查看更多 →
设计原则

故障对系统造成的影响，并持续稳定地运行，建议遵循以下设计原则。高可用设计单点故障会导致整个系统崩溃、主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患，因此系统的高可用设计非常关键。高可用设计的主要手段是冗余，甚至是多级冗余的组合，包括异地容灾方式保证灾难情况下无单点：

来自：帮助中心

查看更多 →
设计原则

设计原则国际标准化组织（ISO）对计算机系统安全的定义为：确保信息资产（包括硬件、软件、网络、数据等）受到保护，以确保其机密性、完整性和可用性。计算机系统安全的目标是保护信息系统免受未经授权的访问、使用、披露、破坏、修改、中断或不可用的威胁，同时确保信息系统能够持续地提供服务。

来自：帮助中心

查看更多 →
设计架构

设计架构在架构设计阶段伙伴架构师完成集成架构设计和资源清单配置。创建技术架构集成架构设计详细操作步骤参见集成架构设计。伙伴架构师用户登录解决方案工作台，进入工作空间--》选择需要设计的方案--》点击“更多”下拉框--》点击“设计”，即可跳转到架构“设计中心”的页面。图1

来自：帮助中心

查看更多 →
VN设计

VN设计通过对不同的业务划分为不同的VN，实现生产业务、办公业务、多媒体业务的同类型业务正常互通，不同类型业务隔离不互通。同时为生产、办公、多媒体、等不同业务分配不同比例带宽，保障网络拥塞时各业务流量都能得到调度。父主题：用户业务设计

来自：帮助中心

查看更多 →
设计中心

设计中心解决方案工作台提供设计引擎，用户可在线进行解决方案技术架构设计（含集成架构、部署架构）、信息架构设计。技术架构设计信息架构设计父主题：标准空间

来自：帮助中心

查看更多 →
约束设计

约束设计 DEFAULT和NULL约束如果能够从业务层面补全字段值，那么，不建议使用DEFAULT约束，避免数据加载时产生不符合预期的结果。给明确不存在NULL值的字段加上NOT NULL约束，优化器会在特定场景下对其进行自动优化。给可以显式命名的约束显式命名。除了NOT

来自：帮助中心

查看更多 →
约束设计

约束设计 DEFAULT和NULL约束【建议】如果能够从业务层面补全字段值，那么，就不建议使用DEFAULT约束，避免数据加载时产生不符合预期的结果。【建议】给明确不存在NULL值的字段加上NOT NULL约束，优化器会在特定场景下对其进行自动优化。【建议】给可以显式命名的约束显式命名。除了NOT

来自：帮助中心

查看更多 →
表设计

表设计总体上讲，良好的表设计需要遵循以下原则：减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。尽量减少随机I/O。通过聚簇可以实现热数据的连续存储，将随机I/O转换为连续I/O，从而减少扫描的I/O代价。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
约束设计

约束设计 DEFAULT和NULL约束如果能够从业务层面补全字段值，那么，不建议使用DEFAULT约束，避免数据加载时产生不符合预期的结果。给明确不存在NULL值的字段加上NOT NULL约束。优化器会在特定场景下对其进行自动优化。给可以显式命名的约束显式命名。除了NOT

来自：帮助中心

查看更多 →
表设计

表设计 GaussDB是分布式架构。数据分布在各个DN上。总体上讲，良好的表设计需要遵循以下原则：将表数据均匀分布在各个DN上。数据均匀分布，可以防止数据在部分DN上集中分布，从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列，可以避免数据倾斜。将表的扫描压力均匀分

来自：帮助中心

查看更多 →
表设计

表设计总体上讲，良好的表设计需要遵循以下原则：减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。尽量减少随机I/O。通过聚簇可以实现热数据的连续存储，将随机I/O转换为连续I/O，从而减少扫描的I/O代价。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
上云与实施服务可以提供哪些服务？

上云与实施服务可以提供哪些服务？数据仓库平台设计与实施服务数据仓库规划设计与实施服务-基础版（128vCPU以内）数据仓库规划设计与实施服务-增量包（128vCPU以上）数据仓库迁移支持服务数据仓库迁移支持服务-基础包（同构）（10TB以内）数据仓库迁移支持服务-增量包（同构）（每TB）

来自：帮助中心

查看更多 →