更新时间:2024-03-11 GMT+08:00
分享

约束与限制

浏览器限制

您需要使用支持的浏览器版本登录DataArts Studio
表1 浏览器兼容性

浏览器版本

建议版本

建议操作系统

备注

Google Chrome

115,114,113

Windows 10

分辨率最佳可视范围为最小1366*768px,最大为1920*1080px。其中1920*1080px为最佳显示分辨率,界面自适应为最优显示。

使用限制

使用DataArts Studio前,您需要认真阅读并了解以下使用限制。
表2 DataArts Studio使用限制一览表

组件

约束限制

公共

  1. DataArts Studio必须基于华为云底座部署。资源隔离场景下,支持以全栈专属云模式部署,另外也支持以华为云Stack和HCS Online混合云模式部署。

    关于全栈专属云、华为云Stack和HCS Online的适用场景和差异等更多信息,欢迎通过咨询了解。

  2. DataArts Studio基于数据湖底座提供数据一站式集成、开发、治理等能力,本身不具备存储和计算的能力,需要配合数据湖底座使用。
  3. 每个企业项目下最多绑定一个DataArts Studio实例。当企业项目下已绑定实例时,再次购买实例会失败。
  4. DataArts Studio各组件对不同数据源的支持程度不一,您需要按照您的业务需求来选择数据湖底座。DataArts Studio平台当前支持的数据湖产品请参见DataArts Studio支持的数据源

管理中心

  1. 由于管理中心的限制,数据治理各组件(如数据架构、数据质量、数据目录等)暂不支持包含中文和“.”字符的库表名。
  2. DataArts Studio实例赠送的CDM集群,由于本身规格有限,推荐仅作为DataArts Studio管理中心数据连接的Agent代理使用。
  3. 建议为管理中心数据连接的Agent和CDM迁移作业规划相互独立的CDM集群,避免双方使用同一集群,导致业务高峰期时资源抢占引起业务不可用。
  4. CDM集群作为管理中心数据连接Agent时,单集群无法连接多个MRS安全集群。建议您按照业务情况规划多个Agent与MRS安全集群一一映射。
  5. CDM集群作为管理中心数据连接Agent时,单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时,通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运行上限为200,超出的任务将排队等待。建议您按照业务量情况规划多个Agent分担压力。

  6. 单工作空间允许创建的数据连接个数最多200个。
  7. 管理中心相关开放API并发限制为100qps。

数据集成

  1. CDM作业支持自动备份和恢复,将备份数据存储到OBS中,该功能需要您手动开启。详情请参见CDM作业自动备份/恢复章节。
  2. 数据集成CDM集群为单集群部署,集群故障可能会导致业务、数据损失。建议您使用数据开发作业CDM Job节点调用CDM作业,并选择两个CDM集群以提升可靠性。详情请参见CDM Job节点章节。

关于数据集成中的更多约束限制,请参考CDM约束与限制

数据开发

  1. 数据开发脚本、作业等资产支持备份管理,将备份数据存储到OBS中,该功能需要您手动开启。详情请参见备份管理章节。
  2. 单工作空间允许创建的作业个数最多1万个。
  3. RDS SQL、DWS SQL、HIVE SQL、SPARK SQL、DLI SQL脚本执行结果页面展示最多1千条,且数据量少于3MB。超过1千条数据可以使用转储功能,转储最多支持1万条。

数据架构

  1. 数据架构当前支持关系建模和维度建模(仅支持星形模型)这两种建模方式。
  2. 数据架构支持最大导入文件大小为4Mb;支持最大导入指标个数为3000个;支持一次最大导出500张表。
  3. 单工作空间中创建各类对象的配额如下:
    • 主题5000个。
    • 数据标准目录500条,个数20000个。
    • 原子指标、衍生指标、复合指标各5000条。
  4. 配置中心中各类对象的自定义项配额如下:
    • 主题自定义项10条。
    • 表自定义项30条。
    • 属性自定义项10条。
    • 业务指标自定义项50条。

数据质量

  1. 数据质量作业执行时长依赖数据引擎,如果底层数据引擎资源不足,可能会导致运行速度变慢。
  2. 单个数据质量作业最多可以配置50条规则,如有需要可拆分为多个质量作业。

数据目录

  1. 元数据采集任务通过执行引擎相关的DDL SQL获取,不建议单个任务采集超过1000张表。如有需要可拆分为多个采集任务,另外调度时间和频次也需要根据业务需要进行合理设置,避免对引擎造成较大的访问和连接压力,设置建议如下:
    • 若业务对元数据时效性要求为1天,则设置调度周期=max(1天,单次采集周期时间),其他情况同理。
    • 若业务压力集中在白天,则设置调度时间在夜间,其他情况同理,选择数据源压力最小的时间段。
  2. 数据血缘的产生依赖于数据开发中调度运行的作业,测试运行的作业不会产生血缘。

数据服务

  1. 数据服务共享版仅供开发测试使用,专享版性能优于共享版,推荐使用数据服务专享版。
  2. 数据服务集群与工作空间绑定,创建后暂不支持修改规格或升级版本。

数据安全

  1. 数据安全中配置的安全管理员,当且仅当在数据安全组件生效,对于周边组件和其他服务,此身份无效。
  2. 数据安全中功能级别的约束限制,请参考用户指南中对应功能的“约束与限制”章节。
分享:

    相关文档

    相关产品