华为云开发者中心为开发者提供所有云服务的API及API手册、各产品的SDK、可服务的节点区域和各服务的终端节点EndPoint和在使用华为云产品时需要用到的CLI工具、业务工具等的下载及使用说明。

 

    orc sdk 更多内容
  • Orc Format

    Orc Format 功能描述 Apache Orc Format允许读写ORC数据。更多具体使用可参考开源社区文档:Orc Format。 支持的Connector FileSystem 参数说明 表1 参数说明 参数 是否必选 默认值 类型 描述 format 是 无 String

    来自:帮助中心

    查看更多 →

  • 导出ORC数据概述

    支持数据文件格式:ORC。 导出文件命名规则 GaussDB (DWS)导出ORC数据的文件命名规则如下: 导出至 MRS (HDFS):从DN节点导出数据时,以segment的格式存储在HDFS中,文件命名规则为“mpp_数据库名_模式名_表名称_节点名称_n.orc”。这里的“n”是从0开始按照自然数0、1、2、3递增。

    来自:帮助中心

    查看更多 →

  • 导出ORC数据到OBS

    导出ORC数据到OBS 规划导出数据 创建外部 服务器 创建外表 执行导出 父主题: 导出数据到OBS

    来自:帮助中心

    查看更多 →

  • 导出ORC数据到MRS

    导出ORC数据到MRS 导出ORC数据概述 规划导出数据 创建外部服务器 创建外表 执行导出 父主题: 导出数据

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • 从OBS导入ORC、CARBONDATA数据

    从OBS导入ORC、CARBONDATA数据 OBS上的数据准备 创建外部服务器 创建外表 通过外表查询OBS上的数据 清除资源 支持的数据类型 父主题: 从OBS并行导入数据

    来自:帮助中心

    查看更多 →

  • 配置矢量化读取ORC数据

    的数据尽可能的压缩来降低存储空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中,SparkSQL支持矢量化读取ORC数据(这个特性在Hive的历史版本中已经得到支持)。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。 该特性可以通过下面的配置项开启:

    来自:帮助中心

    查看更多 →

  • 配置矢量化读取ORC数据

    的数据尽可能的压缩来降低存储空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中,SparkSQL支持矢量化读取ORC数据(这个特性在Hive的历史版本中已经得到支持)。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。 该特性可以通过下面的配置项开启:

    来自:帮助中心

    查看更多 →

  • SparkSQL读取ORC表报错

    SparkSQL读取ORC表报错 问题现象 Hive创建ORC存储格式的表,用SparkSQL读取该表时报错: 原因分析 该问题为一个开源社区问题:https://issues.apache.org/jira/browse/HIVE-11102,使用开源的hive 1.2.1版本包就有可能触发此问题。

    来自:帮助中心

    查看更多 →

  • 使用hive-table方式同步数据到orc表或者parquet表失败

    使用hive-table方式同步数据到orc表或者parquet表失败 问题 使用hive-table方式同步数据到orc表或者parquet表失败。 报错信息中有kite-sdk的包名。 回答 修改数据同步方式,将-hive-table改成-hcatalog-table。 父主题:

    来自:帮助中心

    查看更多 →

  • 从GaussDB(DWS)集群导出ORC数据到MRS集群

    info_orc路径下查看导出的ORC格式文件。 GaussDB(DWS)导出ORC数据的文件格式规则如下: 导出至MRS(HDFS):从DN节点导出数据时,以segment的格式存储在HDFS中,文件命名规则为“mpp_数据库名_模式名_表名称_节点名称_n.orc”。 对于来

    来自:帮助中心

    查看更多 →

  • 使用ZSTD_JNI压缩算法压缩Hive ORC表

    ZSTD_JNI压缩格式的建表方式如下: 使用此压缩算法时,只需在创建ORC表时指定表属性参数“orc.compress”为ZSTD_JNI即可,如: create table tab_1(...) stored as orc TBLPROPERTIES("orc.compress"="ZSTD_JNI");

    来自:帮助中心

    查看更多 →

  • CREATE TABLE

    COMMENT 'test' STORED AS ORC LOCATION '/user' TBLPROPERTIES (orc_compress = 'SNAPPY', orc_compress_size = 6710422, orc_bloom_filter_columns = 'orderstatus

    来自:帮助中心

    查看更多 →

  • SDK

    API使用APP认证时,请根据需要下载SDK包和文档,参考文档完成API的调用。 操作步骤 进入共享版控制台,单击。 单击“帮助中心”,进入到帮助中心页面。 单击“SDK使用指引”页签。 在待下载的语言中,单击“下载SDK”,下载SDK包。 如需查看文档,请单击“SDK文档”。 父主题: 共享版操作指导(仅存量用户使用)

    来自:帮助中心

    查看更多 →

  • SHOW TBLPROPERTIES TABLE|VIEW

    orc.compress.size '262144' orc.compression.codec 'GZIP'

    来自:帮助中心

    查看更多 →

  • SHOW TBLPROPERTIES TABLE|VIEW

    orc.compress.size '262144' orc.compression.codec 'GZIP'

    来自:帮助中心

    查看更多 →

  • 第三方库错误码说明

    ORC_ERROR ORC03 逻辑错误类型( LOG ICERROR) ORC_ERROR ORC04 范围错误类型(RANGEERROR) ORC_ERROR ORC05 写错误类型(WRITEERROR) ORC_FATAL ORC06 中断错误类型(ASSERTERROR) ORC_ERROR

    来自:帮助中心

    查看更多 →

  • SHOW CREATE TABLE

    'hdfs://hacluster/user', format = 'ORC', orc_compress = 'ZLIB', orc_compress_size = 262144,

    来自:帮助中心

    查看更多 →

  • OBS上的数据准备

    db/product_info_orc/”目录中。 如果数据文件已经在OBS上了,请执行获取源数据的OBS路径并设置读取权限中的步骤。 本小节以导入ORC格式为例,CARBONDATA数据的导入方法与ORC格式相似。 原始数据 假设您已将2个ORC数据文件存储在OBS上,其原始数据分别如下:

    来自:帮助中心

    查看更多 →

  • Spark SQL无法查询到ORC类型的Hive表的新插入数据

    SQL无法查询到最新插入的数据的问题。 回答 由于Spark存在一个机制,为了提高性能会缓存ORC的元数据信息。当通过Hive或其他方式更新了ORC表时,缓存的元数据信息未更新,导致Spark SQL查询不到新插入的数据。 对于存储类型为ORC的Hive分区表,在执行插入数据操作后,如果分区信息未改变,则缓存的元数据信息未更新,导致Spark

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了