中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据开发经验 更多内容
  • 专家经验库

    专家经验库 应用场景说明 配置权限 创建角色 授权用户专家经验库相关的角色 查看/标识/取消/下载样本

    来自:帮助中心

    查看更多 →

  • 维护经验管理

    维护经验管理 前提条件 已具备“设置告警维护经验”的操作权限。 背景信息 “告警设置 > 维护经验”中管理的维护经验与告警详情中的维护经验为同一个经验库。 最多可创建10000条维护经验。 操作步骤 在NetEco主菜单中选择“设备管理 > 告警管理 > 告警设置”。 在左侧导航树中选择“维护经验”。

    来自:帮助中心

    查看更多 →

  • 经验总结

    当每条记录需要查表,如果是Driver端用广播方式传递的数据数据结构优先采用set/map而不是Iterator,因为Set/Map的查询速率接近O(1),而Iterator是O(n)。 数据倾斜 当数据发生倾斜(某一部分数据量特别),虽然没有GC(Gabage Collectio

    来自:帮助中心

    查看更多 →

  • 开发大屏

    开发屏 编辑屏 预览屏 发布

    来自:帮助中心

    查看更多 →

  • 开发大屏

    开发开发页面 单击导入的项目(屏Demo),单击进入项目。 如图1所示,单击“指挥看板”,进入页面。 图1 进入页面 单击“编辑页面”,进入页面的编辑状态,如图2所示。 图2 编辑状态 在模板页面中,删除组件。 按照规划,删除不要的组件,选择组件,右击鼠标,在弹出的下拉菜单中选择“删除”。

    来自:帮助中心

    查看更多 →

  • 经验总结

    当每条记录需要查表,如果是Driver端用广播方式传递的数据数据结构优先采用set/map而不是Iterator,因为Set/Map的查询速率接近O(1),而Iterator是O(n)。 数据倾斜 当数据发生倾斜(某一部分数据量特别),虽然没有GC(Gabage Collectio

    来自:帮助中心

    查看更多 →

  • 经验总结

    当每条记录需要查表,如果是Driver端用广播方式传递的数据数据结构优先采用set/map而不是Iterator,因为Set/Map的查询速率接近O(1),而Iterator是O(n)。 数据倾斜 当数据发生倾斜(某一部分数据量特别),虽然没有GC(Garbage Collecti

    来自:帮助中心

    查看更多 →

  • 大屏开发全流程

    开发全流程 ISDP+开发中心提供了应用、屏、移动端、端侧设备四业务场景应用的开发,本节介绍屏应用场景开发的全流程。 场景介绍 开发流程 开发过程 父主题: 快速入门

    来自:帮助中心

    查看更多 →

  • 开发盘古NLP大模型

    开发盘古NLP模型 使用数据工程构建NLP模型数据集 训练NLP模型 压缩NLP模型 部署NLP模型 调用NLP模型

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 概述与连接管理 脚本开发 作业开发 实例管理、补数据监控及配置环境变量 父主题: 实施步骤

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 数据开发可以创建多少个作业,作业中的节点数是否有限制? DataArts Studio 支持自定义的Python脚本吗? 作业关联的 CDM 集群删除后,如何快速修复? 作业的计划时间和开始时间相差,是什么原因? 相互依赖的几个作业,调度过程中某个作业执行失败,是否会影响后续作业?这时该如何处理?

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 项目创建 数据开发项目需为开发环境和生产环境配置数据鉴权模式,选择计算资源组,同时可以指定运行账号及运行队列。 图1 项目创建 离线任务开发 离线数据开发支持 HiveSQL、ImpalaSQL、SparkSQL、Python、Shell、Jar、Spark 等任务类型。

    来自:帮助中心

    查看更多 →

  • 数据开发

    监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。 选择“数据治理 > 指标仓库”。 单击逻辑主体后的“新建”。 配置逻辑主体参数,参数说明如表1所示,配置完成后,单击“确定”。 表1 配置逻辑主体参数说明 参数类型 参数名称 参数说明 基本信息

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 数据开发概述 数据管理 脚本开发 作业开发 解决方案 运行历史 运维调度 配置管理 审批中心 下载中心 节点参考 EL表达式参考 简易变量集参考 使用教程

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 使用 GaussDB (DWS)冷热数据切换功能降低业务成本 使用GaussDB(DWS)分区自动管理功能降低电商和物联网行业数据分区维护成本 使用GaussDB(DWS)视图重建功能实现视图解耦以提升开发效率 HStore表使用优秀实践 GIN索引使用实践 实现数据列的加解密

    来自:帮助中心

    查看更多 →

  • 开发盘古大模型Agent应用

    开发盘古模型Agent应用 Agent开发平台概述 手工编排Agent应用 创建与管理工作流

    来自:帮助中心

    查看更多 →

  • 大模型开发基本流程介绍

    模型开发基本流程介绍 模型(Large Models)通常指的是具有海量参数和复杂结构的深度学习模型,广泛应用于 自然语言处理 (NLP)等领域。开发一个模型的流程可以分为以下几个主要步骤: 数据集准备:模型的性能往往依赖于大量的训练数据。因此,数据集准备是模型开发的第一步。

    来自:帮助中心

    查看更多 →

  • 大模型开发基本概念

    模型开发基本概念 模型相关概念 概念名 说明 模型是什么 模型是大规模预训练模型的简称,也称预训练模型或基础模型。所谓预训练模型,是指在一个原始任务上预先训练出一个初始模型,然后在下游任务中对该模型进行精调,以提高下游任务的准确性。大规模预训练模型则是指模型参数达到千亿、

    来自:帮助中心

    查看更多 →

  • 开发盘古科学计算大模型

    开发盘古科学计算模型 使用数据工程构建科学计算模型数据集 训练科学计算模型 部署科学计算模型 调用科学计算模型

    来自:帮助中心

    查看更多 →

  • 经验总结:SQL语句改写规则

    作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr,to_number)导致大数据量子查询选择度计算不准。 父主题: SQL调优指南

    来自:帮助中心

    查看更多 →

  • 数据开发操作

    选查看、编辑和删除分区数据信息。 查看视图数据 登录GaussDB(DWS)管理控制台。 在左侧导航栏中,选择“数据 > SQL编辑器”。 切换至“数据源”面板,右键视图名称,单击“查看数据”可筛选查看该数据库下视图数据信息。 图7 查看视图数据 导入数据 登录GaussDB(DWS)管理控制台。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了