中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    从大数据到数据科学 更多内容
  • 从OBS导入元数据(1.0.0)

    OBS导入元数据(1.0.0) 功能介绍 OBS导入元数据。 调试 您可以在 API Explorer 中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/grap

    来自:帮助中心

    查看更多 →

  • 典型场景:从HDFS/OBS导出数据到SFTP服务器

    典型场景:HDFS/OBS导出数据S FTP服务器 操作场景 该任务指导用户使用Loader将数据HDFS/OBS导出到SFTP 服务器 。 前提条件 创建或获取该任务中创建Loader作业的业务用户和密码。 确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。 获取S

    来自:帮助中心

    查看更多 →

  • 从MySQL CDC源表读取数据写入到DWS

    MySQL CDC源表读取数据写入DWS 本指导仅适用于Flink 1.12版本。 场景描述 CDC是变更数据捕获(Change Data Capture)技术的缩写,它可以将源数据库的增量变动记录,同步一个或多个数据目的中。CDC在数据同步过程中,还可以对数据进行一定的处理,例如分组(GROUP

    来自:帮助中心

    查看更多 →

  • 导出ORC数据到OBS

    导出ORC数据OBS 规划导出数据 创建外部服务器 创建外表 执行导出 父主题: 导出数据OBS

    来自:帮助中心

    查看更多 →

  • 导出ORC数据到MRS

    导出ORC数据 MRS 导出ORC数据概述 规划导出数据 创建外部服务器 创建外表 执行导出 父主题: 导出数据

    来自:帮助中心

    查看更多 →

  • 步骤4:从DIS获取数据

    步骤4:DIS获取数据 功能简介 DIS服务中下载数据。 样例代码 样例工程为DIS SDK桶中下载的“huaweicloud-sdk-dis-java-X.X.X.zip”压缩包中“\dis-sdk-demo\src\main\java\com\bigdata\dis\sd

    来自:帮助中心

    查看更多 →

  • 步骤4:从DIS获取数据

    步骤4:DIS获取数据 功能简介 DIS服务中下载数据。 样例代码 样例工程为DIS SDK桶中下载的“huaweicloud-sdk-dis-java-X.X.X.zip”压缩包中“\dis-sdk-demo\src\main\java\com\bigdata\dis\sd

    来自:帮助中心

    查看更多 →

  • 从OBS导入ORC、CARBONDATA数据

    OBS导入ORC、CARBONDATA数据 OBS上的数据准备 创建外部服务器 创建外表 通过外表查询OBS上的数据 清除资源 支持的数据类型 父主题: OBS并行导入数据

    来自:帮助中心

    查看更多 →

  • 从本地或OBS导入数据

    本地或OBS导入数据 在图引擎管理控制台,单击左侧导航栏的“元数据管理”。 在“元数据管理”页面,单击左上角“导入”。 在“导入”页面,您可以在“类型”中选择“本地”或“OBS”中导入元数据本地导入 “选择本地文件”:单击“上传”,选择本地的文件。 文件格式必须为xml格式。

    来自:帮助中心

    查看更多 →

  • 从OBS并行导入数据

    OBS并行导入数据 关于OBS并行导入 OBS导入 CS V、TXT数据 OBS导入ORC、CARBONDATA数据 父主题: 导入数据

    来自:帮助中心

    查看更多 →

  • 从OBS导入CSV、TXT数据

    OBS导入CSV、TXT数据 创建访问密钥(AK和SK) 上传数据OBS 创建OBS外表 执行导入数据 处理导入错误 OBS导入数据示例 父主题: OBS并行导入数据

    来自:帮助中心

    查看更多 →

  • 快速搭建数据大屏

    示。 图11 屏效果 单击右上角右“保存”,输入屏的名称,单击“确定”,屏保存成功。 步骤5:管理屏 切换屏发布状态 在控制台右侧“我的项目”单击项目名称,进入项目页面。 单击“数据分析 > 屏”,进入屏页面。 单击屏名称,进入屏编辑页面。 发布屏:单击页面右上角“保存并发布”,大屏发布成功。

    来自:帮助中心

    查看更多 →

  • 管理科学计算大模型训练任务

    管理科学计算模型训练任务 在训练任务列表中,任务创建者可以对创建好的任务进行编辑、启动、克隆(复制训练任务)、重试(重新训练任务)和删除操作。 登录ModelArts Studio模型开发平台,进入所需空间。 在左侧导航栏中选择“模型开发 > 模型训练”,进入模型训练页面,可进行如下操作:

    来自:帮助中心

    查看更多 →

  • 通过Sqoop从Hive导出数据到MySQL 8.0时报数据格式错误

    通过SqoopHive导出数据MySQL 8.0时报数据格式错误 本章节仅适用于MRS 3.1.0版本集群。 用户问题 MRS 3.1.0集群SqoopHive导出数据MySQL 8.0时报数据格式错误。 问题现象 原因分析 通过日志判断得知是格式异常。 处理步骤 确认分

    来自:帮助中心

    查看更多 →

  • 从DLI导入数据到OBS,数据量不一致怎么办?

    DLI 导入数据OBS,数据量不一致怎么办? 问题现象 使用DLI插入数据OBS临时表文件,数据量有差异。 根因分析 出现该问题可能原因如下: 作业执行过程中,读取数据量错误。 验证数据量的方式不正确。 通常在执行插入数据操作后,如需确认插入数据量是否正确,建议通过查询语句进行查询。

    来自:帮助中心

    查看更多 →

  • 使用Loader从SFTP服务器导入数据到Hive

    使用LoaderSFTP服务器导入数据Hive 操作场景 该任务指导用户使用Loader将数据SFTP服务器导入Hive。 前提条件 创建或获取该任务中创建Loader作业的业务用户和密码。 确保用户已授权访问作业中指定的Hive表的权限。 获取SFTP服务器使用的用户和

    来自:帮助中心

    查看更多 →

  • 使用Loader从Hive导出数据到SFTP服务器

    使用LoaderHive导出数据SFTP服务器 操作场景 该任务指导用户使用Loader将数据Hive导出到SFTP服务器。 前提条件 创建或获取该任务中创建Loader作业的业务用户和密码。 确保用户已授权访问作业中指定的Hive表的权限。 获取SFTP服务器使用的用户和

    来自:帮助中心

    查看更多 →

  • 使用数据工程构建NLP大模型数据集

    使用数据工程构建NLP模型数据集 NLP模型支持接入的数据集类型 盘古NLP模型仅支持接入文本类数据集,该数据集格式要求请参见文本类数据集格式要求。 构建NLP模型所需数据量 使用数据工程构建盘古NLP模型数据集进行模型训练时,所需数据量见表1。 表1 构建NLP模型所需数据量

    来自:帮助中心

    查看更多 →

  • 从PostgreSQL CDC源表读取数据写入到DWS

    PostgreSQL CDC源表读取数据写入DWS 本指导仅适用于Flink 1.12版本。 场景描述 CDC是变更数据捕获(Change Data Capture)技术的缩写,它可以将源数据库的增量变动记录,同步一个或多个数据目的中。CDC在数据同步过程中,还可以对数据进行一定的处理,例如分组(GROUP

    来自:帮助中心

    查看更多 →

  • 通过sqoop import命令从PgSQL导出数据到Hive时报错

    通过sqoop import命令PgSQL导出数据Hive时报错 背景 使用sqoop import命令抽取开源PgSQL数据库内容MRS HDFS或Hive中。 用户问题 使用sqoop命令可以查询PgSQL表,但是执行sqoop import命令导入导出时报错: The

    来自:帮助中心

    查看更多 →

  • 使用Loader从SFTP服务器导入数据到HBase

    使用LoaderSFTP服务器导入数据HBase 操作场景 该任务指导用户使用Loader将数据SFTP服务器导入HBase。 前提条件 创建或获取该任务中创建Loader作业的业务用户和密码。 确保用户已授权访问作业执行时操作的HBase表或phoenix表。 获取SF

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了