中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    如何选择合适的大数据开发 更多内容
  • 选择数据类型

    尽量使用短字段数据类型 长度较短数据类型不仅可以减小数据文件大小,提升IO性能;同时也可以减小相关计算时内存消耗,提升计算性能。比如对于整型数据,如果可以用smallint就尽量不用int,如果可以用int就尽量不用bigint。 使用一致数据类型 表关联列尽量使用相同数据类

    来自:帮助中心

    查看更多 →

  • 如何选择OCR套餐包的区域

    如何选择OCR套餐包区域 不同地域之间资源包不互通,每个地域需分别购买,请根据您实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用服务与区域之后再购买相应区域套餐包。 父主题: 服务开通类

    来自:帮助中心

    查看更多 →

  • 如何选择Kafka实例的存储空间?

    会使用33GB磁盘作为日志和Zookeeper数据存储,因而实际可用存储会小于购买存储。 其中,副本数在创建Topic时可以选择,默认为3副本存储。如果开启了Kafka自动创建Topic功能,自动创建Topic默认为3副本,副本数可以通过“配置参数”页签中“default

    来自:帮助中心

    查看更多 →

  • 如何选择操作系统?

    如何选择操作系统? Windows 适用于Windows环境下开发平台或运营业务。 系统盘要求40GB及以上、内存1GB及以上。 可以安装IIS、SQL Server等。 Linux 适用于Linux环境下开发平台或运营业务。当前提供CentOS(推荐)和Ubuntu等类型操作系统。

    来自:帮助中心

    查看更多 →

  • 数据开发

    主流程设计 对于更加复杂情况,同样可以通过拖拉拽方式可视化编排方式,将项目内多个流程组织为主流程形式满足复杂任务依赖调度。 图5 主流程设计 任务调度 主流程、流程支持日、月、周、时、分等不同精度周期调度方式。当设置为自动调度模式时,主流程或流程在发布到生产环境并启动后,

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 概述与连接管理 脚本开发 作业开发 实例管理、补数据监控及配置环境变量 父主题: 实施步骤

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 数据开发可以创建多少个作业,作业中节点数是否有限制? DataArts Studio 支持自定义Python脚本吗? 作业关联 CDM 集群删除后,如何快速修复? 作业计划时间和开始时间相差,是什么原因? 相互依赖几个作业,调度过程中某个作业执行失败,是否会影响后续作业?这时该如何处理?

    来自:帮助中心

    查看更多 →

  • PERF03-02 选择合适规格的虚拟机和容器节点

    内存密集型业务(如大数据处理、图像/视频处理、游戏开发数据库等场景)主要消耗内存和存储维度容量。 存储密集型业务(如大型数据库、大数据分析、大规模文件存储、编译构建等场景)可能会比较消耗存储带宽。 根据业务特征选择合适虚拟机类型和规格。具体虚拟机类型规格请参考官方文档。 相关云服务和工具

    来自:帮助中心

    查看更多 →

  • 如何选择存储类型?

    如何选择存储类型? 在创建 裸金属服务器 页面配置磁盘类型时,主要提供以下存储类型,您可根据实际需求进行选择配置。当前创建时仅支持携一种类型磁盘下发裸金属 服务器 。 云硬盘(EVS):提供多种不同QoS云硬盘类型给裸金属服务器使用,满足不同性能要求业务场景。 专属分布式存储(DS

    来自:帮助中心

    查看更多 →

  • 主机评估失败,没有匹配合适的规格,如何处理?

    主机评估失败,没有匹配合适规格,如何处理? 问题分析 出现该问题,可能原因有: 目的端区域没有与源端匹配规格。 创建评估时,配置了自定义评估策略,没有匹配到符合策略主机规格。 解决方法 单击资源名称前按钮,在对应产品类型操作列,单击“修改”按钮,手动选择目的端规格配置。 父主题:

    来自:帮助中心

    查看更多 →

  • 如何选择备案填写信息中的“地域”

    如何选择备案填写信息中“地域” 对于个人备案,请根据您身份证所在地、或实际居住地选择备案提交地域。是否允许跨省备案,需以各地管局要求为准。 对于单位备案,请根据主体证件签发地(如营业执照工商注册地),选择备案提交地域。不能选择非企业主体证件签发地省份。 父主题: 系统填写

    来自:帮助中心

    查看更多 →

  • 数据开发

    表名 选择输出表表名,选择前需要创建MPPDB表。 列名 选择输出表所有列名。 查询结果列 汇聚结果列名。 Column Mappings 根据输出表(MPPDB)选择对应查询结果列。 单击已创建持久化视图或长期存储视图,在“视图”页面单击“Start Task”,启动第一

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 数据开发概述 数据管理 脚本开发 作业开发 解决方案 运行历史 运维调度 配置管理 审批中心 下载中心 节点参考 EL表达式参考 简易变量集参考 使用教程

    来自:帮助中心

    查看更多 →

  • 如何使用服务编排开发数据的增删改查

    如何使用服务编排开发数据增删改查 使用说明 如何使用服务编排开发业务基本逻辑中创建了呼吸机资源对象Respirator,本章节将介绍通过服务编排中内置对象操作图元来开发服务编排,实现Respirator对象数据增删改查功能。 创建对象数据 由于服务编排中内置记录创建图元

    来自:帮助中心

    查看更多 →

  • 语音交互服务的区域如何选择

    语音交互 服务区域如何选择 不同区域资源之间内网不互通。为保证网络连通性,降低网络时延、提高访问速度,请选择靠近您客户区域,当前语音服务支持北京和上海区域,后续会陆续上线其他区域,当前支持区域请参见地区与终端节点。 华北-北京四,为推荐区域,支持 一句话识别 、录音文件识别、 实时语音识别 语音合成 和热词等接口。

    来自:帮助中心

    查看更多 →

  • 数据集选择列

    数据选择列 概述 根据输入数据集,选择一些列生成新数据集。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数说明 select_columns_str

    来自:帮助中心

    查看更多 →

  • 数据可视化 DLV

    了解 了解华为云数据可视化服务产品架构、功能和应用场景,有助于您更准确地匹配实际业务,让数据开发变得更简单、更方便。 产品介绍 什么是 DLV DLV优势 DLV功能 DLV应用场景 03 入门 DLV入门指导,帮助您快速搭建数据屏,并且可以通过交互功能实现屏内组件间数据联动。

    来自:帮助中心

    查看更多 →

  • 多输入支持数据选择

    ModelStep输出 depend_steps=[job_step_1, job_step_2] # 依赖作业类型节点对象 )# job_step是wf.steps.JobStep 实例对象,train_url是wf.steps.JobOutputname字段值

    来自:帮助中心

    查看更多 →

  • 数据开发数据搬迁

    获取到导出zip文件。 图1 选择并导出脚本 在弹出“导出脚本”界面,选择需要导出脚本状态,单击“确定”。 图2 导出脚本 导出作业 单击脚本目录树上方,切换到作业界面。 单击作业目录中选择“显示复选框”。 勾选需要导出作业,单击 > 导出作业,可选择“只导出作业

    来自:帮助中心

    查看更多 →

  • 如何安装已开发好的应用

    应用导航”,单击该应用所在行的,可预览该应用。 如何在“我仓库”安装应用 “我仓库”只适用于安装本租户下用户发布资产包。“我仓库”即租户私仓,开发者将应用发布到“我仓库”后,AstroZero默认将该应用同步到该租户下沙箱环境或者运行环境“我仓库”中。当前租户下其他用户可以直接登录沙箱环境或者运行环境,通过“我的仓库”安装该应用。

    来自:帮助中心

    查看更多 →

  • Kafka实例的超高IO和高IO如何选择?

    Kafka实例超高IO和高IO如何选择? 高IO:平均时延1-3ms,最大带宽150MB/s(读+写)。 超高IO:平均时延1ms,最大带宽350MB/s(读+写)。 建议选择超高IO,云硬盘服务端压力大场景,都不能达到最大带宽,但是超高IO可达到带宽比高IO高很多。 父主题:

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了