云社区是华为云官方技术交流社区。提供技术博客、技术问答、技术视频、技术论坛等产品和服务,汇聚海量精品云计算使用和开发经验。致力于帮助技术人快速成长与发展,营造开放的云计算技术生态圈。

 
 

    大数据开发论坛 更多内容
  • 开发数据预处理作业

    开发数据预处理作业 数据预处理通常被用于评估/训练作业场景。本文以使用训练数据训练预处理作业,然后再将预处理方法应用于评估/预测数据为例进行说明。 训练数据预处理作业 评估/预测数据预处理 前提条件 已提前准备好训练数据,和评估/预测数据数据预处理作业选择的结构化数据集(包括

    来自:帮助中心

    查看更多 →

  • 数据开发进阶实践

    数据开发进阶实践 周期调度依赖策略 离散小时调度与作业最近依赖调度逻辑 补数据场景使用介绍 作业调度支持每月最后一天 获取SQL节点的输出结果值 IF条件判断教程 获取Rest Client节点返回值教程 For Each节点使用介绍 数据开发调用数据质量算子并且作业运行的时候需要传入质量参数

    来自:帮助中心

    查看更多 →

  • 步骤2:数据开发处理

    步骤2:数据开发处理 本步骤通过BI报表原始数据,分析10用户关注最多的产品和10用户评价最差的商品,然后通过作业定期调度执行并将结果每日导出到表中,以支撑信息分析。 分析10用户关注最多的产品 在 DataArts Studio 控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。

    来自:帮助中心

    查看更多 →

  • 步骤3:数据开发处理

    您如果需要及时了解作业的执行结果是成功还是失败,可以通过数据开发的运维调度界面进行查看,如图11所示。 图11 查看作业执行情况 数据开发还支持配置通知管理,可以选择配置当作业运行异常/失败后,进行短信、邮件、控制台等多种方式提醒,此处不再展开描述。 至此,基于电影评分的数据集成与开发流程示例完成。此外,您还可

    来自:帮助中心

    查看更多 →

  • 大容量数据库背景介绍

    子问题的解的合并。对于容量数据场景,数据库提供对数据进行“分治处理”的方式即分区,将逻辑数据库或其组成元素划分为不同的独立部分,每一个分区维护逻辑上存在相类似属性的数据,这样就把庞大的数据整体进行了切分,有利于数据的管理、查找和维护。 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 大容量数据库背景介绍

    子问题的解的合并。对于容量数据场景,数据库提供对数据进行“分治处理”的方式即分区,将逻辑数据库或其组成元素划分为不同的独立部分,每一个分区维护逻辑上存在相类似属性的数据,这样就把庞大的数据整体进行了切分,有利于数据的管理、查找和维护。 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 使用数据工程构建NLP大模型数据集

    使用数据工程构建NLP模型数据集 NLP模型支持接入的数据集类型 盘古NLP模型仅支持接入文本类数据集,该数据集格式要求请参见文本类数据集格式要求。 构建NLP模型所需数据量 使用数据工程构建盘古NLP模型数据集进行模型训练时,所需数据量见表1。 表1 构建NLP模型所需数据量

    来自:帮助中心

    查看更多 →

  • 什么是开源镜像站

    什么是开源镜像站 开源镜像站由华为云CodeArts团队开发及维护,致力于打造让软件开发更简单的一站式DevOps工具云服务。开源镜像站目前提供多种类别的软件安装源和ISO下载服务,覆盖包含Maven、npm、PyPI在内的8语言镜像,Ubuntu、CentOS、Debian等4

    来自:帮助中心

    查看更多 →

  • 通过数据开发实现数据增量迁移

    通过数据开发实现数据增量迁移 DataArts Studio服务的DLF组件提供了一站式的大数据协同开发平台,借助DLF的在线脚本编辑、周期调度 CDM 的迁移作业,也可以实现增量数据迁移。 这里以DWS导入到OBS为例,介绍DLF配合CDM实现增量迁移的流程: 获取CDM作业的JSON

    来自:帮助中心

    查看更多 →

  • 通过数据开发实现数据增量迁移

    通过数据开发实现数据增量迁移 DataArts Studio服务的DLF组件提供了一站式的大数据协同开发平台,借助DLF的在线脚本编辑、周期调度CDM的迁移作业,也可以实现增量数据迁移。 这里以DWS导入到OBS为例,介绍DLF配合CDM实现增量迁移的流程: 获取CDM作业的JSON

    来自:帮助中心

    查看更多 →

  • 使用RDS for MySQL搭建Discuz!论坛

    开始安装后,检查安装环境并单击“下一步”。 设置运行环境,并单击“下一步”。 安装数据库,填写数据库信息,单击“下一步”完成安装。 数据 服务器 地址即为“rds-01”的私有IP地址。 数据库密码是“rds-01”配置的数据库管理员root帐号对应的密码。 自定义管理员信息。 Discuz!安

    来自:帮助中心

    查看更多 →

  • 搭建Discuz论坛网站操作流程

    搭建Discuz论坛网站操作流程 图1 搭建Discuz论坛网站操作流程 父主题: 搭建Discuz论坛网站

    来自:帮助中心

    查看更多 →

  • 大屏

    屏 新建屏 更新屏 获取屏组件列表 获取屏指定组件数据 批量发布屏 批量删除屏 批量下线

    来自:帮助中心

    查看更多 →

  • 大模型微调需要的数据有要求吗?

    模型微调需要的数据有要求吗? AI原生应用引擎用于模型微调的数据集任务领域为“ 自然语言处理 ”、数据集格式为“对话文本”。 文件内容要求为标准json数组,例如: [{"instruction": "aaa", "input": "aaa", "output": "aaa"},{"instruction":

    来自:帮助中心

    查看更多 →

  • 使用数据工程构建科学计算大模型数据集

    使用数据工程构建科学计算模型数据集 科学计算模型支持接入的数据集类型 盘古科学计算模型仅支持接入气象类数据集,该数据集格式要求请参见气象类数据集格式要求。 构建科学计算模型训练数据要求 构建科学计算模型进行训练的数据要求见表1。 表1 科学计算模型训练数据要求 模型类别

    来自:帮助中心

    查看更多 →

  • 数据库开发支持服务

    数据开发支持服务 工作说明书 常见问题 计费说明 父主题: 优化与提升

    来自:帮助中心

    查看更多 →

  • 数据开发API(V2)

    数据开发API(V2) 作业开发API

    来自:帮助中心

    查看更多 →

  • 数据集成开发指导

    数据集成开发指导 开发说明 连接器RESTful接口规范 自定义数据开发示例(定时任务) 自定义数据开发示例(实时任务)

    来自:帮助中心

    查看更多 →

  • ClickHouse数据库开发

    ClickHouse数据开发 ClickHouse数据入库工具 ClickHouse数据入库规范 ClickHouse数据查询 ClickHouse数据库应用开发 父主题: ClickHouse应用开发规范

    来自:帮助中心

    查看更多 →

  • 数据开发操作列表

    updateDataWarehouse 删除数据连接 dataWarehouse deleteDataWarehouse 导出数据连接 dataWarehouse exportConnection 导入数据连接 dataWarehouse importConnection 创建数据库 dataWarehouse

    来自:帮助中心

    查看更多 →

  • 大屏Demo

    屏Demo 描述 屏Demo,开箱即用的屏样例,需要配合应用资产中“数据处理应用模板”一起使用。 开放能力 屏Demo为模板资产,订购后下载到本地,通过导入的方式上传到“业务屏”下使用。 屏Demo提供了指挥看板页面,如图1所示。 图1 指挥看板页面 如何使用资产

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了