存算分离_配置HetuEngine通过Guardian访问OBS-华为云

配置HetuEngine通过Guardian访问OBS

Location，默认存储在OBS上。 Ranger权限配置集群已启用Kerberos认证（安全模式）的HetuEngine在存算分离场景和非存算分离场景下不区分Ranger赋权方式，详细操作请参见添加HetuEngine的Ranger访问权限策略。父主题： MRS 集群服务对接OBS示例

来自：帮助中心

查看更多 →
配置底层存储系统

配置Huawei OBS作为Alluxio的底层文件系统方法一：给集群配置有OBS OperateAccess权限的委托，具体请参见配置存算分离集群（委托方式）。请参考修改集群服务配置参数，进入Alluxio的“全部配置”页面。在左侧边栏中选择“Alluxio > 底层存储系统”，修改参数“alluxio

来自：帮助中心

查看更多 →
磁盘缓存主动预热调优

磁盘缓存主动预热调优该功能仅9.1.0.200及以上版本支持。背景介绍当前存算分离架构为了降低存储成本会将用户数据存储到obs，这样会导致用户每次查询数据时都要发生网络IO去obs取数据，因此当前存算分离架构提供了磁盘缓存的能力，将用户预查询的数据缓存到本地磁盘，当实际查询数据流

来自：帮助中心

查看更多 →
PGXC_WLM_SESSION_STATISTICS

disk_cache_hit_ratio numeric(5,2) 磁盘缓存命中率。该字段仅对存算分离3.0表及外表生效。 disk_cache_disk_read_size bigint 读取磁盘缓存数据的总大小，单位MB。该字段仅对存算分离3.0表及外表生效。 disk_cache_disk_write_size

来自：帮助中心

查看更多 →
使用场景

业务。支持裸金属本地存储和结合OBS服务的存算分离方案。容器场景互联网弹性业务负载。相比虚拟机，裸金属容器提供更高的部署密度、更低的资源开销、更加敏捷的部署效率。基于云原生技术帮助客户实现降低云化成本目标。高性能计算/AI场景超算、基因测序、人工智能等高性能计算场景，处理

来自：帮助中心

查看更多 →
产品优势

ess大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1

来自：帮助中心

查看更多 →
视频帮助

云容器引擎简介云容器引擎 CCE 服务介绍 03:23 云容器引擎服务介绍特性讲解 MapReduce服务 MRS MRS集群存算分离方案介绍 05:07 MRS集群存算分离方案介绍 MapReduce服务 MRS MRS集群用户权限管理介绍 07:06 MRS集群用户权限管理介绍 MapReduce服务

来自：帮助中心

查看更多 →
使用MRS Hive表对接OBS文件系统

MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。约束与限制大数据存算分离场景，请务必使用OBS并行文件系统，使用普通对象桶会对集群性能产生较大影响。操作流程本章节

来自：帮助中心

查看更多 →
CSS服务中如何清理Elasticsearch索引数据？

可以写定时任务调用清理索引的请求，定期执行。 CSS 支持Opendistro Index State Management，可以参考案例通过索引生命周期实现索引存算分离设置定期清理数据。 Opendistro Index State Management的详细说明请参见：https://opendistro

来自：帮助中心

查看更多 →
配置MapReduce通过IAM委托访问OBS

配置MapReduce通过IAM委托访问OBS 参考配置MRS集群通过IAM委托对接OBS完成存算分离集群配置后，MapReduce服务还需参考本章节新增自定义配置。 MapReduce对接OBS 登录MRS管理控制台，单击集群名称进入集群详情页面。选择“组件管理 > Mapr

来自：帮助中心

查看更多 →
MemArtsCC与其他组件的关系

sCC有如下使用场景：减少OBS服务端压力 MemArtsCC会将热点数据存储在计算侧集群，可以起到降低OBS服务端带宽的作用。提升存算分离架构访问数据的性能利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Hadoop-OBS上层应用数据读取效率。 MemArtsCC与Spark的关系

来自：帮助中心

查看更多 →
什么是LakeFormation

什么是LakeFormation 湖仓构建（DataArts Lake Formation，简称LakeFormation）是企业级数据湖一站式构建服务。在存算分离架构基础上提供数据湖元数据统一管理的可视化界面及API，兼容Hive元数据模型以及Ranger权限模型，支持对接MapReduce服务（MRS）、数据仓库服务

来自：帮助中心

查看更多 →
Hive表支持级联授权功能

进行一次授权，系统就会自动细粒度关联数据存储源的权限，不需要感知表的存储路径，无需进行二次授权。同时也补齐了基于存算分离授权功能缺陷，可以在Ranger上实现对存算分离表的授权鉴权。Hive表的级联授权功能主要体现为：开启Ranger级联授权后，Ranger中创建策略对表授权时

来自：帮助中心

查看更多 →
函数和操作符

残留文件管理函数统计信息函数触发器函数 XML函数调用栈记录函数 Hudi系统函数漏斗函数和留存函数 EXTERNAL SCHEMA系统函数存算分离函数

来自：帮助中心

查看更多 →
使用限制

缩容集群存算一体（集群部署）不支持缩容至单机部署集群。正在缩容的集群禁用重启集群、扩容集群、创建快照、节点管理、智能运维、资源管理、参数修改、安全设置、日志服务、重置数据库管理员密码和删除集群的功能。弹性规格变更弹性规格变更仅支持E CS +EVS云盘的存算一体及存算分离集群，ECS本地盘的集群不支持。

来自：帮助中心

查看更多 →
由于MRS集群节点的NTP时间不同步导致集群访问OBS时鉴权失败

以root用户登录集群备Master节点，执行2。等待约2分钟，在主Master节点执行以下命令观察IP同步成功。 ntpq -np 例如执行后结果如下：父主题：存算分离类

来自：帮助中心

查看更多 →
方案概述

互式查询，实现分钟级甚至秒级的数据时效。方案架构华为云车联网数据应用解决方案，面向车联网运营和数据价值挖掘场景，构建车联网数据的采、存、算、管、用全流程能力，并沉淀行业资产，加速车联网应用开发，形成丰富的车联网数据应用生态，支持主机厂车联网平台从成本中心向价值中心的转型。解决方案整体架构

来自：帮助中心

查看更多 →
Guardian

Guardian Guardian基本原理 Guardian是一个在存算分离场景下为HDFS、Hive、Spark、HBase、Loader、HetuEngine等服务提供访问OBS的临时认证凭据的服务，只有对接OBS的场景下才需要安装Guardian组件。Guardian的典型特性包括：

来自：帮助中心

查看更多 →
与其他云服务的关系

、Spark、Flume和Loader等组件支持从OBS导入、导出数据。 MRS使用OBS的并行文件系统提供服务。配置存算分离集群（委托方式）配置存算分离集群（AKSK方式）弹性云服务器（Elastic Cloud Server） MRS服务使用弹性云服务器（ECS）作为集

来自：帮助中心

查看更多 →
产品优势

化数据提取的特征向量数据进行最近邻或近似近邻检索。详情请参见向量检索。存算分离云搜索服务提供冻结索引API，支持将存储在SSD的热数据转储到OBS中以降低数据的存储成本，实现存算分离。详情请参见存算分离。流量控制云搜索服务支持流量控制，提供节点级别的流量控制功能，可提供单

来自：帮助中心

查看更多 →
迁移HDFS数据至OBS

务（Object Storage Service，OBS）中。详细内容请参见对象存储迁移服务。父主题：大数据场景下使用OBS实现存算分离

来自：帮助中心

查看更多 →