中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据四大特征或4V特征 更多内容
  • 特征选择

    特征选择 删除列 删除特征列的场景有很多,例如:两个特征呈线性变化关系,为减少模型训练的开销,删除其中一个特征列。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 特征选择 > 删除列”,界面新增“删除列”内容。 对应参数说明,如表1所示。 表1 参数说明 参数 参数说明

    来自:帮助中心

    查看更多 →

  • 筛选特征

    筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练

    来自:帮助中心

    查看更多 →

  • 特征操作

    信息熵是通过计算数据集的特征列与标签列之间的相关性筛选出有价值的特征列。相关性越大,信息熵越大;相关性越小,信息熵越小。将信息熵由到小排序,筛选出信息熵较大的有价值的特征列。 信息熵操作方法如下。 单击表头,选中一个特征列作为标签列。 选定列不同值数量不能超过100。 单击“特征操作”,从下拉框中选择“信息熵”。

    来自:帮助中心

    查看更多 →

  • 特征画像

    运行结果右侧的参数说明,如表1所示。 表1 特征画像参数说明 参数 说明 设备数 需要检测的KPI对象的数量,如设备端口的数目。 样本数 训练数据总的样本数。 采样率 采样频率,单位为秒。60的含义为每60秒采样一次。 开始时间 采样的时间跨度。 结束时间 周期 是否有周期的特性,给出评估的值。

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 特征工程

    在当前界面,可以看到如下两个特征工程: HardDisk-Detect_Good:好盘特征工程,用于对好盘训练数据测试数据,进行数据处理,并生成经过特征处理后的新数据。 HardDisk-Detect_Fail:坏盘特征工程,用于对坏盘训练数据测试数据,进行数据处理,并生成经过特征处理后的新数据。

    来自:帮助中心

    查看更多 →

  • 特征工程

    当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 通用格式数据源根路径 通用格式生成所在的根目录,即用户提交初始初始用户画像-物品画像-标准宽表生成基于行为数据的用户画像更新时所提供的结果保存路径。 行为起止日期 用户行

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    signature_type 是 String 特征类型。 最小长度:1 最大长度:150 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。 表4 MetadataAttributeRequest

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 修改数据源特征

    修改数据特征 功能介绍 修改数据源中的特征。 调试 您可以在 API Explorer 中调试该接口。 URI PUT /v2.0/{project_id}/workspaces/{workspace_id}/data-sources/{datasource_id}/data-struct

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    特征值类型,包含string、numerical、strArray、map。 说明: 当feature_type为BASIC_INFOCONTEXT时可选string,numerical和strArray。 feature_type为TAGS时只可选map。 是 示例 { "user_features":[

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程简介 用户可以通过特征工程对数据集进行数据处理、特征组合、特征转换等特征处理,最大限度的从原始数据中提取特征以供模型训练使用。此外,用户还可以将优质的特征工程发布成服务,以服务的形式对具备完全相同特征数据进行预处理。 特征工程相关的基本概念: 特征工程:对数据进行特征处理操作的工程。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    执行记录:查看全量数据应用的历史记录。并支持在“执行记录”中删除全量数据应用操作重新执行全量数据应用操作。 执行:将特征操作流应用在导入特征工程的全量数据上,并生成经过特征处理的新数据。 4 特征操作明细区域。 单击“特征操作流总览”,查看特征操作流详情,单击每个特征操作名称前面的

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    字符。 工程描述 特征工程描述信息。 最多不超过500个字符。 开发平台 特征工程处理数据集的计算平台JupyterLab。 规格 计算平台的资源配置信息。请根据实际情况选择。 实例 创建JupyterLab运行环境的实例。可以从下拉框中选择已创建的运行环境选择“新建一个新环境”。

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • APP特征信息无效

    APP特征信息无效 整改通知: 您填写的APP公钥MD5值为无效信息。 可能原因: 出现此情况,可能您填写的APP公钥MD5值为无效字段。 整改建议: 请参考变更备案,填写新的APP公钥MD5值,确保备案APP的特征信息与实际信息保持一致。 父主题: APP信息

    来自:帮助中心

    查看更多 →

  • 分析ModelArts数据集中的数据特征

    分析ModelArts数据集中的数据特征 基于图片目标框对图片的各项特征,如模糊度、亮度进行分析,并绘制可视化曲线,帮助处理数据集。 您还可以选择数据集的多个版本,查看其可视化曲线,进行对比分析。 背景信息 只有“图片”的数据集,且版本标注类型为“物体检测”和“图像分类”的数据集版本支持数据特征分析。

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    按时间或比例划分训练集测试集。 可选值为TIMERATE。 训练数据起始时间 (training_data_start_time) 否 Long 训练数据起始时间。 divide_by_time_or_rate为TIME时必填。取值不大于行为数据中的最大时间且不大于training_d

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了