网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
云手机服务器 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器(旧版)
VR云渲游平台 CVR
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘平台 IEF
CloudPond云服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
湖仓构建 LakeFormation
智能数据洞察 DataArts Insight
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
开天aPaaS
应用平台 AppStage
开天企业工作台 MSSE
开天集成工作台 MSSI
API中心 API Hub
云消息服务 KooMessage
交换数据空间 EDS
云地图服务 KooMap
云手机服务 KooPhone
组织成员账号 OrgID
云空间服务 KooDrive
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
区块链
区块链服务 BCS
数字资产链 DAC
华为云区块链引擎服务 HBS
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
价格
成本优化最佳实践
专属云商业逻辑
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
其他
管理控制台
消息中心
产品价格详情
系统权限
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
云服务信任体系能力说明
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
云存储网关 CSG
专属分布式存储服务 DSS
数据工坊 DWR
地图数据 MapDS
键值存储服务 KVS
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
云原生服务中心 OSC
应用服务网格 ASM
华为云UCS
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB
云数据库 GeminiDB
数据管理服务 DAS
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
语音交互服务 SIS
人证核身服务 IVS
视频智能分析服务 VIAS
城市智能体
自动驾驶云服务 Octopus
盘古大模型 PanguLargeModels
IoT物联网
设备接入 IoTDA
IoT物联网
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
企业应用
域名注册服务 Domains
云解析服务 DNS
企业门户 EWP
ICP备案
商标注册
华为云WeLink
华为云会议 Meeting
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMA Exchange
API全生命周期管理 ROMA API
政企自服务管理 ESM
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
数字内容生产线 MetaStudio
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
专属云
专属计算集群 DCC
开发者工具
SDK开发指南
API签名指南
DevStar
华为云命令行工具服务 KooCLI
Huawei Cloud Toolkit
CodeArts API
云化转型
云架构中心
云采用框架
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
我的凭证
华为云公共事业服务云平台
工业软件
工业数字模型驱动引擎
硬件开发工具链平台云服务
工业数据转换引擎云服务
本文导读

数据图书馆

更新时间:2025-01-13 GMT+08:00
分享

创建数据资产

新增数据

  1. 以账号登录unidaten系统。

    光标放置在系统左上角,在功能导航中单击选择“数据图书馆”,进入数据图书馆页面。

    在左侧目录中选择需要创建数据资产的分组

  2. 进入创建数据资产类型选择页面。
  3. 选择资产类型,进入创建资产页面。
  4. 选择数据源,“数据源名称”自动填充“JDBC连接串”等信息,“用户名”、“密码”和“客户端字符集”会自动填充该数据源的相应信息,单击 “确认”。

    图1 创建资产

  5. 进入数据资产配置页面,填写资产名称及其他配置信息,配置完成后,单击右上角“保存”。“分区条数”的配置是为了提升性能,当数据源中的数据过多时,可分批次提取数据。

    图2 资产配置

  6. 进入该数据资产详细信息页面,配置完成后,可在菜单栏选择数据结构、关联关系、血缘关系、分析图表、数据质量和权限设置进一步的配置数据资产信息。

    CloudTable资产和非CloudTable资产的页面结构有区别,CloudTable资产的菜单栏中所有tab页共用按钮,同时按钮的位置会存在差异;非CloudTable资产的菜单栏中每个tab页有单独的按钮。所以,请根据实际情况操作各资产菜单栏的按钮。

导入数据

通过“导入数据”方式创建数据资产时,导入的数据数量没有限制,但是只能显示10000条数据。未显示的数据能参与运算,比如在数据交换机中的运算。

  1. 以账号登录unidaten系统。

    光标放置在系统左上角,在功能导航中单击选择“数据图书馆”,进入数据图书馆页面。

  2. 在左侧目录中选择需要创建数据资产的分组,光标放置在右上角,单击“导入数据”,页面弹出对话框。
  3. 选择导入资产的途径,可选择“从文件导入”或“从数据库导入”,操作步骤同新增数据。

    图3 导入资产

  4. 进入文件上传页面,单击上传文件或拖拽目标文件至虚线框区域,上传成功后,页面下方出现“文件预览”窗口。

    图4 上传文件

  5. 单击右下角“导入”,进入数据图书馆主页面,可查看该文件对应的数据资产。
  6. 在左侧目录中选择需要创建数据资产的分组,光标放置在右上角,单击“导出数据”,页面弹出对话框,如下图所示。

    图5 导出数据

  7. 单击“下载”,将下载以目录命名的zip文件,文件中包含该目录下的CT类型文件。
  8. 单击“资产计数”,弹出计数中提示框,会计算出资产行数。

编辑数据资产

操作步骤

  1. 选择数据图书馆,进入数据图书馆页面,该页面可查看所有当前用户创建的数据资产和其他用户分享的数据资产。
  2. 在左侧选择资产所在目录或在搜索框中输入数据资产的名称关键字查找目标数据资产。
  3. 选择数据资产,进入对应的信息编辑页面,可查看和修改该数据资产的详细配置信息。

    • CloudTable数据资产,包括资产数据、数据结构、关联关系、血缘关系、分析图表、质量检测和权限设置功能。用户可以对表中数据进行编辑操作,操作与Excel表格操作类似。
      图6 资产数据1
    • 非CloudTable数据资产,包括资产数据、资产配置、数据结构、关联关系、血缘关系、分析图表、质量检测、数据权限和生命周期。用户只能查看表对应的视图内容,不可以直接修改视图内的数据。
      图7 资产数据2

  4. 单击“编辑”,可以直接修改字段的关联标准、类别、别名和描述的内容。单击“保存”,保存修改后的内容。

    当数据类型为MySQL时,数据结构中无法展示数据库表中类型为binary,geometry,geometrycollection,linestring,multilinestring,multipoint,multipolygon,point,polygon,tinyblob,varbinary的字段。

  5. DB2、SQLSERVER、GBase、Sqlite、MySQL、SysDB、Postgre、GreenPlum、Oracle、达梦数据资产支持同步功能,数据结构页面中存在“同步”按钮。

    图8 数据同步

  6. 单击“同步”按钮出现“数据同步”的窗口,在窗口中可选择需要同步的字段,如上图所示。
  7. 单击“确认”后,数据库表中相应的字段内容会覆盖当前字段的内容。

关联关系操作

资产的关联关系可配置资产与其他资产中数据的关联关系。同时系统通过智能分析,会推荐同一目录下,与当前资产中字段及类型相同的资产,或者某个字段数据交集比较多的资产。

通过该处的功能,仅用于保存当前资产与其他资产间配置的关联关系,若要使不同资产中字段的关联关系生效,需在数据交换机中配置对应的数据交换机流程,在流程中配置资产中字段与其他资产字段的连接,并在交换机运行成功后,才能建立完整的连接并输出相应的数据。

  • 添加智能推荐的资产
    1. 在菜单栏单击“关联关系”,进入该资产的关联关系页面。
      图9 关联关系1
    2. 若同一目录下,存在与当前资产有关联关系的资产,则在关联关系页面右侧的“智能推荐”下显示该资产的名称。例如下图中的资产“测试数据分析仪”。
      图10 智能推荐

      若同一目录下与当前资产有关联关系的资产过多,为了提升用户体验,系统最多推荐5个关联强度最高的资产。

    3. 单击智能推荐下关联关系资产的“应用”,画布中显示当前资产与所关联的资产。如下图中画布中显示的“测试数据分析仪”,并且当前资产与有关联关系的资产间通过绿色粗虚线连接。
      图11 应用
    4. 单击智能推荐下关联关系资产的“相关性”,展示与当前资产有关联关系的字段。系统限制每个资产推荐展示的字段个数最多为6个。
    5. 单击各字段下的“应用”,打开“设置关联”配置框。“设置关联”配置框中自动填充当前资产与其他资产中有关联关系的字段的名称。
      图12 设置关联
    6. 单击“设置关联”配置框中的“应用”,生成关联关系,当前资产与有关联关系的资产间的连线变成绿色粗实线。
      图13 生成关联关系
    7. 若需要修改智能推荐的关联字段,单击画布中的设置关联图标进行修改,单击“重置”可清除当前配置的关联关系。
  • 添加非智能推荐的资产
    1. 在菜单栏单击“关联关系”,进入该资产的关联关系页面。
    2. 选择当前资产需要关联的资产所在的资产库后,左侧菜单栏显示该资产库下的目录及资产信息。单击选择资产,画布中显示当前资产与需要关联的资产,当前资产与需要关联的资产通过灰色细虚线连接。
      图14 添加非智能推荐的资产
    3. 单击画布中的连线,弹出“设置关联”配置框,根据需求配置资产间需要关联的字段。
    4. 单击“设置关联”配置框中的“确定”,生成关联关系,当前资产与需要关联的资产间的连线变成灰色细实线。
    5. 若需要修改关联关系,单击画布中的连线进行修改,单击“删除”可清除当前配置的关联关系。

血缘关系操作

资产的血缘关系即该资产与其他资产之间的联系,可在资产的血缘关系菜单下进行查看。

资产之间的血缘关系是在数据交换机的基础上建立的。当资产中数据在数据交换机中与其他资产中的数据配置相关转换算法,在交换机执行后即可生成该资产的血缘关系,可在该资产的血缘关系菜单下进行查看。无论交换机执行成功或失败,均可产生血缘关系。

  1. 在菜单栏单击“血缘关系”,进入该资产的血缘关系页面。
  2. 在数据交换机中,配置该资产相关的转换算法,并设置调度,待数据交换机执行后,可在血缘关系中查看相关资产中数据之间的关系。例如,在数据交换机中配置高级转换中的连接算法。

    图15 血缘关系操作1

  3. 数据交换机执行后,再次进入该资产的血缘关系页面,可查看资产与其他资产之间的血缘关系。

    图16 血缘关系操作2

分析图表操作:数据资产的分析图表页展示所有使用该数据资产的数据分析仪。

  1. 在资产的菜单栏中选择“分析图表”,进入资产的分析图表页面。该页面可查看在数据分析仪中所创建的且使用了当前资产的所有图表。

    选择需要查看的图表,单击图表,进入该图表的操作页面。

  2. 单击右上角“去探索”,进入该数据资产对应的分析仪图表创建页面。该页面的相关操作请参考数据分析仪。

质量检测

质量检测不涉及用户配置,且只分析数值型字段数超过2的资产。

质量检测针对数据质量从数据属性、数据关联、数据分类特性三个维度进行分析,包括:统计数据分布、分析数据间关联程度、分析数据五大特性,并给出相应评分。

  • 数据质量分析:根据每个字段的量级生成柱状图。向用户展示字段中的最大值、最小值、中位数和均值,以及分析每个字段中均值以下数值占比。通过导入资产ID自动生成数据质量分析模块,无需设置任何参数。
  • 展示规则:以柱状图展示每个字段的四种属性值。
  • 展示风险:不同字段可能量级不同,造成较小量级可视化结果不明显,较大量级可视化结果过于突出。
  • 展示方式:将鼠标移动到字段的柱状图,悬浮框中的内容即是相应字段的描述。
    图17 数据属性分析
  • 数据关联分析:通过展示字段名、关联强度、以及关联系数,分析关联程度最大的两个字段以及关联数量最多的字段。当关联程度为“无”时,则不展示关联强度以及关联系数。

    通过导入资产ID自动生成数据关联分析模块,无需设置任何参数。

    • 关联强度:强相关为绿色连线;中相关为黄色连线;弱相关为浅蓝色连线。
    • 关联系数:关联系数的取值为[-1,1],负数代表负相关,正数表示正相关。
    • 展示规则:此模块仅支持对数值型字段的特征进行分析,对于非数值型字段的特征不会进行分析展示。
    • 展示方式:将鼠标移动到字段,字段会高亮显示。
      图18 数据关联分析
  • 数据分类分析:对数据的完整性、一致性、有效性、及时性和唯一性进行分析展示,并进行打分,满分为100,同时展示相关属性得分较低原因。
    • 通过导入资产ID自动生成数据分类分析模块,无需设置任何参数。
    • 完整性:检验字段中缺失值占比。
    • 一致性:检验字段中元素类型是否一致。
    • 及时性:检验文件最后修改时间与当前时间的时间差。
    • 唯一性:检验字段中重复元素占比。
    • 有效性:检验文件中的手机号、身份证号、邮箱是否有效。有效性检验的规则如下:1、如果在CT资产中录入身份证信息时,身份证号的内容必须是文本类型。其他类型的资产没有限制。2.检验有无检验目标的字段(检验标准为相应类型数据应超过50%),如果无对应字段,则默认得分为满分。 3.如果存在目标字段则计算该字段的有效性。 4.有效性总得分是三种字段的1-损失数/(有效列数*行数)。例如现有5列数据,数据集维度为100行*5列,有一列数据为邮箱,一列数据为手机号,其他三列为无关列。通过检验发现,手机号列有5个手机号为无效,邮箱列有10个手机号为无效,则有效性为:1-(5+10)/(2*100)
    • 展示规则:此模块会对所有数据型的字段进行分析,属性得分范围为[0,1],当折线统计图中属性得分越高,表明对应属性越完整。
      图19 数据分类分析

数据权限操作

  1. 在资产的菜单栏单击“数据权限”,进入该资产的权限设置页面。

    图20 数据权限操作1

  2. 单击左上角的添加图标,添加资产的数据权限,包括对行权限、列权限及权限规则的设置。

    图21 数据权限操作2

  3. 单击“保存”,保存对资产的权限设置。

生命周期操作:MySQL、Oracle或者SQLServer的数据资产支持配置生命周期。

  1. 在资产的菜单栏中选择“生命周期”,进入资产的生命周期页面。

    图22 生命周期

  2. 新增迁移。新增迁移指的是根据资产数据中的时间字段,将数据资产迁移到数据源指向的数据库。

    单击“新增”,选择“迁移”,创建该资产的迁移功能,如下图所示。

    图23 新增迁移

  3. 新增删除。

    单击“新增”,选择“删除”,创建该资产的删除功能。

    图24 新增删除

提示

您即将访问非华为云网站,请注意账号财产安全

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容