中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    hive数据导入 更多内容
  • Hive同步数据报错HoodieHiveSyncException

    Hive同步数据报错HoodieHiveSyncException 问题 Hive同步数据时报错: com.uber.hoodie.hive.HoodieHiveSyncException: Could not convert field Type from <type1> to

    来自:帮助中心

    查看更多 →

  • 导入项目数据

    导入项目数据 功能介绍 导入项目数据 调试 您可以在 API Explorer 中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/eihealth-projects/

    来自:帮助中心

    查看更多 →

  • 导入网上数据

    导入网上数据 功能介绍 导入网上数据 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/eihealth-projects/

    来自:帮助中心

    查看更多 →

  • 使用模板导入数据

    使用模板导入数据 功能介绍 按照所使用的模板格式导入数据。使用该功能前,需要创建好可使用的数据导入模板。在模板中定义数据的映射规则,调用接口时需指定模板名称,在该模板中,需要指定对应的操作脚本。因数据导入可能耗时较长,该接口不会立即返回导入结果。导入完成后,可根据得到的定时任务id,查看该任务的执行情况。

    来自:帮助中心

    查看更多 →

  • 导入数据实例

    导入数据实例 操作场景 用户的数据实例数据较多时,手动在控制台添加会比较耗时。工业数字模型驱动引擎-数据建模引擎(xDM Foundation,简称xDM-F)提供了导入数据实例的功能,用户可以通过上传Excel文件,一次性批量导入数据实例。导入数据实例前,您可以先参见导出数据

    来自:帮助中心

    查看更多 →

  • 配置数据导入模板

    配置数据导入模板 使用说明 通过定义数据导入模板,定义后下载模板,录入数据,再导入数据并按照预定义的脚本处理数据。 场景描述 本节介绍的是在应用内配置数据导入模板,您还可以在管理中心进行配置,相关操作请参考通过配置数据导入模板进行数据导入。两者的区别是在应用中配置的数据导入模板,

    来自:帮助中心

    查看更多 →

  • 导入数据最佳实践

    导入数据最佳实践 从OBS并行导入数据导入数据拆分为多个文件 导入数据量的数据时,通常需要较长的时间及耗费较多的计算资源。 从OBS上导入数据时,如下方法可以提升导入性能:将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量为DN的整数倍更适合。 在导入前后验证数据文件

    来自:帮助中心

    查看更多 →

  • 执行导入数据

    执行导入数据 完成GDS的安装部署及外表创建后,本节介绍如何在 GaussDB (DWS)数据库中创建事实表并将数据导入事实表中。 对于记录数超过千万条的表,建议在执行全量数据导入前,先导入部分数据,以进行数据倾斜检查和调整分布列,避免导入大量数据后发现数据倾斜,调整成本高。 前提条件

    来自:帮助中心

    查看更多 →

  • 使用Loader从SFTP服务器导入数据到Hive

    使用Loader从S FTP服务器 导入数据Hive 操作场景 该任务指导用户使用Loader将数据从SFTP 服务器 导入Hive。 前提条件 创建或获取该任务中创建Loader作业的业务用户和密码。 确保用户已授权访问作业中指定的Hive表的权限。 获取SFTP服务器使用的用户和

    来自:帮助中心

    查看更多 →

  • 接入Hive数据源

    登录智能数据洞察控制台。 从新建数据源进入创建数据源页面,选择要创建数据源所在的项目,源库类型选择数据Hive。 接入网络类型选公网。 在配置连接对话框,填写以下配置。 图1 接入Hive数据源参数 表1 参数说明 参数名称 是否必填 说明 源库类型 是 接入的数据源类型,本示例为Hive。更多数据源类型连接请参考表1。

    来自:帮助中心

    查看更多 →

  • 调整Hive元数据超时

    WebUI”后的链接,进入HSConsole界面。 单击“数据源”,在Hive数据源所在行的“操作”列下单击“编辑”,在页面内新增如下自定义配置: 表1 元数据超时参数 参数名称 默认值 描述 hive.metastore-timeout 10s 共部署Hive数据源加载元数据缓存最大超时时间,单位为秒或分钟

    来自:帮助中心

    查看更多 →

  • 接入HIVE数据源

    接入HIVE数据源 概述 ROMA Connect支持把HIVE作为一个数据源,用于创建数据API。在使用HIVE数据源前,您需要先接入数据源。 数据集成中仅支持百万以内数据量。 前提条件 每个接入的数据源都要归属到某个集成应用下,在接入数据源前您需要有可用的集成应用,否则请提前创建集成应用。

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • 导入并配置Hive JDBC/HCatalog样例工程

    导入并配置Hive JDBC/HCatalog样例工程 操作场景 为了运行 MRS 产品Hive组件的JDBC接口样例代码,需要完成下面的操作。 本章节以在Windows环境下开发JDBC/HCatalog方式连接Hive服务的应用程序为例。 HCatalog样例仅支持在Linux节点上运行。

    来自:帮助中心

    查看更多 →

  • 迁移Hive数据至DLI

    上述示例是通过创建表和插入表数据构造迁移示例数据。如果是迁移已有的Hive数据库和表数据,则可以通过以下命令获取Hive数据库和表信息。 在Hive客户端执行如下命令获取数据库信息 show databases 切换到需要迁移的Hive数据库 use Hive数据库名 显示当前数据库下所有的表信息

    来自:帮助中心

    查看更多 →

  • 添加Hive数据源

    添加Hive数据Hive数据源介绍 HetuEngine服务在安装时已经将共部署(与HetuEngine在同一个Hadoop集群)的Hive数据源默认实现对接,数据源名称为“hive”,不可删除。部分默认配置不可修改,如数据源名称,数据源类型,服务端Principal,客户端

    来自:帮助中心

    查看更多 →

  • 接入Hive数据源

    填写数据源的描述信息。 数据湖分层 选择对应的数据湖分层:业务数据层/操作数据层/明细数据层/数据汇总层/数据集市层/应用数据层/贴源数据层。 JDBC字符串 Hive数据库的JDBC格式连接串,格式:jdbc:hive2://host:port/dbname。 host为数据库的连接地址。 port为数据库的连接端口号。

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • 导入并配置Hive JDBC/HCatalog样例工程

    导入并配置Hive JDBC/HCatalog样例工程 操作场景 为了运行MRS产品Hive组件的JDBC/HCatalog接口样例代码,需要完成下面的操作。 以在Windows环境下开发JDBC/HCatalog方式连接Hive服务的应用程序为例。 HCatalog样例仅支持在Linux节点上运行。

    来自:帮助中心

    查看更多 →

  • 使用CopyTable工具导入数据

    使用CopyTable工具导入数据 CopyTable是HBase提供的一个实用工具,可以将部分或全部表复制到同一个集群或另一个集群中。目标表必须预先存在。在CloudTable客户端工具中已经包含了CopyTable工具,用户部署客户端工具后,即可使用CopyTable工具导入数据到CloudTable集群。

    来自:帮助中心

    查看更多 →

  • 手动导入IoTDB数据

    1000,1100,1200 在导入数据前,需要注意: MRS 3.3.0之前版本,导入数据不能包含空格,否则此行数据导入失败并跳过导入,后续操作不受影响。 MRS 3.3.0及之后版本,导入数据不能包含空格,否则此次数据导入操作会失败,需要对导入数据类型进行自检。 包含,的字段需要使用反引号括起来,例如:hello

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了