中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    如何选择合适的大数据开发 更多内容
  • 选择合适的镜像

    选择合适镜像 Alpine容器镜像内置musl libc库与标准glibc存在以下差异: 3.3版本及更早版本Alpine不支持search参数,不支持搜索域,无法完成服务发现。 并发请求/etc/resolve.conf中配置多个DNS 服务器 ,导致NodeLocal DNSCache的优化失效。

    来自:帮助中心

    查看更多 →

  • 选择合适的数据库资源

    务中断影响、数据转移效率),这是具体实施业务上云过程中重点关切。 业务应用场景评估:如果是在云上新建业务系统,则要通过业务实际需要进行云数据选型,它评估与数据库是否建立在云上无关,而是根据实际业务系统特点来决定。如电商系统,考虑选型MySQL满足用户信息管理、买

    来自:帮助中心

    查看更多 →

  • 选择合适的计算资源

    选择合适计算资源 评估计算要求涉及评估工作负载特定计算需求,包括实例类型、可伸缩性和容器化等因素。不同计算服务具有不同功能和特征,可能会影响工作负载性能。选择最佳计算服务以确保工作负载高效运行。请考虑以下策略: 了解实例类型 不同实例类型针对不同工作负载进行优化,例

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    则执行计划将存在“Streaming”,导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适分布列案例(一) 如果将a作为t1分布列,将b作为t2分布列: 1 2 CREATE TABLE t1 (a int, b int) DISTRIBUTE BY HASH (a);

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    案例:选择合适分布列 分布列用于将数据分布到不同节点上,划分均衡可以避免数据倾斜。 在进行关联查询时,尽量选择查询中关联条件作为分布键。当关联条件作为分布键时,相关数据都分布在DN本地,将减少DN之间数据流动代价,提升查询速度。 优化前 将a作为t1和t2分布列,表定义如下:

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    案例:选择合适分布列 分布列用于将数据分布到不同节点上,划分均衡可以避免数据倾斜。 在进行关联查询时,尽量选择查询中关联条件作为分布键。当关联条件作为分布键时,相关数据都分布在DN本地,将减少DN之间数据流动代价,提升查询速度。 优化前 将a作为t1和t2分布列,表定义如下:

    来自:帮助中心

    查看更多 →

  • 选择合适的节点数据盘大小

    )。 如何选择合适数据盘 在选择合适数据盘大小时,需要结合以下考虑综合计算: 在拉取镜像过程中,会先从镜像仓库中下载镜像tar包然后解压,最后删除tar包保留镜像文件。在tar包解压过程中,tar包和解压出来镜像文件会同时存在,占用额外存储空间,需要在计算所需数据盘大小时额外注意。

    来自:帮助中心

    查看更多 →

  • 选择合适的存储云服务

    选择合适存储云服务 了解数据特征(如可共享、大小、访问模式、延迟、吞吐量和数据持久性),以便为您工作负载选择合适专用数据存储。 PERF03-05 选择合适类型存储云服务 父主题: PERF03 性能建模

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    则执行计划将存在“Streaming”,导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适分布列案例(一) 如果将a作为t1分布列,将b作为t2分布列: 1 2 CREATE TABLE t1 (a int, b int) DISTRIBUTE BY HASH (a);

    来自:帮助中心

    查看更多 →

  • 案例:选择合适的分布列

    则执行计划将存在“Streaming”,导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适分布列案例(一) 如果将a作为t1分布列,将b作为t2分布列: 1 2 CREATE TABLE t1 (a int, b int) DISTRIBUTE BY HASH (a);

    来自:帮助中心

    查看更多 →

  • 如何选购合适的API

    如何选购合适API 文字识别 服务(OCR)提供四种类型API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用 ModelArts Pro 服务提供“文字识别套件”零代码搭建出专属文字识别系统。 通用类 通用 表格识别 :提取表格内文字和所在行列位置信息。 通用文字识别 :提取图片内的文字及其对应位置信息。

    来自:帮助中心

    查看更多 →

  • PERF03-07 选择合适的Kafka

    PERF03-07 选择合适Kafka 风险等级 中 关键策略 根据生产流量、消费流量、老化时间、副本数等指标,计算业务所需规格,选择合适Kafka规格。 规格测算: 性能容量维度所需最小节点数 = max((存储带宽需求 / 单节点存储带宽),(网络带宽需求 / 单节点网络基准带宽))

    来自:帮助中心

    查看更多 →

  • PERF03-08 选择合适的RocketMQ

    PERF03-08 选择合适RocketMQ 风险等级 中 关键策略 RocketMQ服务提供了多个维度定义规格,如资源规格、代理个数、存储容量、单个代理TPS、单个代理Topic数上限、单个代理消费组数上限等,建议根据不同版本涉及具体规格情况选择合适RocketMQ服务。

    来自:帮助中心

    查看更多 →

  • 选择合适网络服务资源

    选择合适网络服务资源 选择合适网络服务资源是一个复杂过程,需要考虑许多因素。以下提供了一些主要因素: 评估合适网络云服务,主要考虑如下性能指标: 网络流量:评估工作负载预期网络流量,了解数据传输需求和网络请求频率。 带宽要求:确定工作负载带宽要求,考虑通过网络传输和接收的数据量。

    来自:帮助中心

    查看更多 →

  • PERF04-02 选择合适的测试方式

    PERF04-02 选择合适测试方式 风险等级 高 关键策略 性能测试常见方式如下,需要注意是,各种测试方式并不是正交,而是有耦合关系: 性能验收:性能验收测试运行环境必须是确定,验证系统在确定场景条件下是否达到了其宣称能力规格。 负载测试:是在被测系统上进行负

    来自:帮助中心

    查看更多 →

  • 选择合适的应用中间件云服务资源

    选择合适应用中间件云服务资源 华为云提供Kafka、RocketMQ、RabbitMQ三种不同版分布式消息服务,您可根据业务需求和不同版本优势来选择合适消息队列。 PERF03-06 选择合适消息队列 PERF03-07 选择合适Kafka PERF03-08 选择合适RocketMQ

    来自:帮助中心

    查看更多 →

  • PERF03-09 选择合适的RabbitMQ

    PERF03-09 选择合适RabbitMQ 风险等级 中 关键策略 版本选择:RabbitMQ服务版本随时间更迭,选择版本时需注意查看不同版本状态与区分,详情可参考官方公告。 规格选择:RabbitMQ服务提供了不同规格实例可供选择,建议按照业务需求对比,选择合适规格型号,具体实例规格请参考官方文档。

    来自:帮助中心

    查看更多 →

  • 在线开发Profile时,如何选择数据类型?

    在线开发Profile时,如何选择数据类型? 数据类型配置可以参考如下原则: int:当上报数据为整数或布尔值时,可以匹配为此类型。插件开发中可匹配int型或array类型。 decimal:当上报数据为小数时,可以匹配为此类型。插件开发中可匹配string或者int或者array类型。

    来自:帮助中心

    查看更多 →

  • PERF03-10 选择合适的关系型数据库

    MariaDB适用于各种规模应用程序。 关系型数据选择建议: 场景一:基于兼容性原则 考虑平滑上云,上云前系统中数据选型已经过业务实践检验,建议选取生态相同关系型数据库服务进行平替,避免出现数据库层与应用层不兼容或数据库切换对业务架构中其他组件产生负面影响。 场景二:基于场景评估

    来自:帮助中心

    查看更多 →

  • 选择数据

    所需训练数据集。 由于模型训练过程需要有标签数据,如果您上传是已标注数据,上传后可查看标签解析。如果您想手动修改标签,可单击数据集操作列“标注”,进入数据集概览页单击右上角“开始标注”,在“数据标注”页面手动标注数据。 如果您上传是未标注数据,您单击数据集操作列“标

    来自:帮助中心

    查看更多 →

  • 选择数据

    “数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”子目录。“数据集输出位置”建议选择一个空目录。 新建训练数据集后,勾选当前应用开发所需训练数据集。 由于模型训练过程需要有标签数据,针对已上传数据集: 手动添加或修改标签 单击数据集操作列“标注”,进入数据集概览

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了