中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据的特征是 更多内容
  • 分析ModelArts数据集中的数据特征

    Boxes 横坐标:目标框面积占比,即目标框面积占整个图片面积比例,越大表示物体在图片中占比越大。 纵坐标:框数量(统计所有图片中框)。 主要判断模型中使用anchor分布,如果目标框普遍较大,anchor就可以选择较大。 按边缘化程度统计框数量分布 Marginalization

    来自:帮助中心

    查看更多 →

  • 特征选择

    当前操作流 从下拉框中选择当前数据操作流名字。 操作流变量名 如果存在多个数据操作流,可重命名操作流对象变量名,以避免冲突。 单击图标,运行“删除列”代码框内容。 选择列 如果数据特征量大,而大多数特征对模型训练无效,可通过“选择列”保留仅对模型训练有意义特征。 操作步骤如下所示。

    来自:帮助中心

    查看更多 →

  • 特征操作

    在“特征操作流总览”区域会新增一个“卡方校验”节点。 信息熵 信息熵通过计算数据特征列与标签列之间相关性筛选出有价值特征列。相关性越大,信息熵越大;相关性越小,信息熵越小。将信息熵由到小排序,筛选出信息熵较大有价值特征列。 信息熵操作方法如下。 单击表头,选中一个特征列作为标签列。 选定列不同值数量不能超过100。

    来自:帮助中心

    查看更多 →

  • 特征画像

    果右侧参数说明,如表1所示。 表1 特征画像参数说明 参数 说明 设备数 需要检测KPI对象数量,如设备或端口数目。 样本数 训练数据样本数。 采样率 采样频率,单位为秒。60含义为每60秒采样一次。 开始时间 采样时间跨度。 结束时间 周期 是否有周期特性,给出评估的值。

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 修改数据源特征

    datasource_id String 数据源id。 project_id String 项目id,获取方式请参见获取项目ID。 workspace_id String 工作空间id。 表2 Query参数 参数 是否必选 参数类型 描述 X-Auth-Token String

    来自:帮助中心

    查看更多 →

  • 筛选特征

    特征;过低iv值没有区分性会造成训练资源浪费,过高iv值又过于突出可能会过度影响训练出来模型。 例如这里大数据厂商提供f4特征iv值0,说明这个特征对于标签识别没有区分度,可以不选用;而f0、f2特征iv值中等,适合作为模型训练特征。 根据计算得出iv值,企业

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据特征工程和算法工程关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 根据数据集的entitiesId获取数据集的特征信息

    根据数据entitiesId获取数据特征信息 功能介绍 管理侧根据数据集entitiesId获取数据特征信息。 URI URI格式 POST /softcomai/datalake/v1.0/originDataModels/{entitiesId}/entitysattr

    来自:帮助中心

    查看更多 →

  • 根据数据集的entitiesId获取数据集的特征信息

    根据数据entitiesId获取数据特征信息 功能介绍 管理侧根据数据集entitiesId获取数据特征信息。 URI URI格式 POST /softcomai/datalake/v1.0/originDataModels/{entitiesId}/entitysattr

    来自:帮助中心

    查看更多 →

  • 特征工程

    单击“创建”,界面新增“Harddisk”特征工程。 等待特征工程“环境信息”中特征工程状态从“创建中”变更为“运行中”,即开发环境创建完成。 单击特征工程“操作”列图标,进入JupyterLab环境“Launcher”界面。 在左侧代码目录中,可以看到系统自动为用户创建特征工程同名算法工程目录

    来自:帮助中心

    查看更多 →

  • 特征工程

    当上传数据特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 通用格式数据源根路径 通用格式生成所在根目录,即用户提交初始初始用户画像-物品画像-标准宽表生成或基于行为数据用户画像更新时所提供结果保存路径。 行为起止日期 用户

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    instance_id String 实例ID。 最小长度:1 最大长度:64 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 package_id String 模型包ID。 最小长度:1 最大长度:50 entity_urn String 实体urn。

    来自:帮助中心

    查看更多 →

  • 什么是盘古大模型

    助开发者充分利用盘古模型功能。企业可以根据自己需求选取合适模型相关服务和产品,方便地构建自己模型和应用。 数据工程工具链 数据模型训练基础,为模型提供了必要知识和信息。数据工程工具链作为盘古模型服务重要组成部分,具备数据获取、清洗、配比和管理等功能。 该

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局特征信息文件。当上传数据特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    用户单击“配置”,在弹出“配置参数”对话框中分别输入“参数名”、“默认值”和“当前值”,即可修改超参值。 执行记录:查看全量数据应用历史记录。并支持在“执行记录”中删除全量数据应用操作或重新执行全量数据应用操作。 执行:将特征操作流应用在导入特征工程全量数据上,并生成经过特征处理新数据。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    hm”下方“算法工程”,弹出“新建”对话框。 输入“名称”,示例:code-123,单击“确定”。 “code-123”算法工程创建完成,在界面左侧代码目录,可以看到新增“code-123”目录及其相关主文件、子目录等。 不同算法工程,均会有与算法工程同名目录,且同

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    error_code String 请求失败时错误码,请求成功时无此字段。 error_msg String 请求失败时错误信息,请求成功时无此字段。 表4 global_features参数说明 参数名称 参数类型 说明 user_features List 用户特征列表。 item_features

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    error_code String 请求失败时错误码,请求成功时无此字段。 error_msg String 请求失败时错误信息,请求成功时无此字段。 表4 global_features参数说明 参数名称 参数类型 说明 user_features List 用户特征列表。 item_features

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了