中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据的特征 更多内容
  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局特征信息文件。当上传数据特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    特征异常平滑 概述 特征异常平滑算子用于将数据异常数据平滑到一定区间,可选择采用箱线图、阈值、百分位和z-score方法确定平滑区间。 z-score方式:计算所需要平滑特征均值mean和标准差std,并引入置信因子cl 平滑区间上界: 平滑区间下界: min-max

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程处理数据计算平台。 创建人 发布服务用户名。 创建时间 发布服务时间。 活动时间 最新执行特征工程任务时间。 简介 特征工程服务简介。 查看特征工程服务详情,包括特征工程任务列表信息。 创建特征工程任务。 删除特征工程服务。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签重要性对特征进行筛选,特征重要性较高特征,提升训练精度和效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • 特征工程和算法工程的关系?

    特征工程和算法工程关系? 用户创建特征工程时候,进入特征工程,可以看到系统自动创建特征工程同名算法工程。支持在同一个特征工程中创建多个算法工程,操作如下所示: 在JupyterLab环境编辑界面,单击界面左上角“File > New Launcher”,界面右侧新增“

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    用户单击“配置”,在弹出“配置参数”对话框中分别输入“参数名”、“默认值”和“当前值”,即可修改超参值。 执行记录:查看全量数据应用历史记录。并支持在“执行记录”中删除全量数据应用操作或重新执行全量数据应用操作。 执行:将特征操作流应用在导入特征工程全量数据上,并生成经过特征处理新数据。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    hm”下方“算法工程”,弹出“新建”对话框。 输入“名称”,示例:code-123,单击“确定”。 “code-123”算法工程创建完成,在界面左侧代码目录,可以看到新增“code-123”目录及其相关主文件、子目录等。 不同算法工程,均会有与算法工程同名目录,且同

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 global_features Object 全局特征表4。 error_code String 请求失败时错误码,请求成功时无此字段。

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 global_features Object 全局特征表4。 error_code String 请求失败时错误码,请求成功时无此字段。

    来自:帮助中心

    查看更多 →

  • 大模型微调需要的数据有要求吗?

    模型微调需要数据有要求吗? AI原生应用引擎用于模型微调数据集任务领域为“ 自然语言处理 ”、数据集格式为“对话文本”。 文件内容要求为标准json数组,例如: [{"instruction": "aaa", "input": "aaa", "output": "aaa"},{"instruction":

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 特征重要性和特征在线性模型中weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    待提取用户特征 (user_features) 是 JSONArray 从全局特征文件提取输入用户特征,对不同类型特征进行相应处理,处理后数据用于排序模型训练。 特征必须来自用户属性配置表中定义特征。 [{ "feature_name": "age", "feature_type":

    来自:帮助中心

    查看更多 →

  • 新建数据大屏

    新建数据屏概述 新建屏全局参数配置 屏组件 预览屏 发布屏 复制屏分享协作 管理

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 搭建某商品销售数据的大屏

    本例查看购买商品的用户中不同等级用户分布情况。 图2 配置字段 您还可以通过样式选项对图表进行自定义配置。 步骤3:发布屏 完成大屏编辑后,单击右上角“保存并发布”。 编辑名称,单击确定,发布屏。 更多大屏功能请参考《智能数据洞察用户指南》操作指导。

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    提交特征工程作业 提交特征工程作业 查询全局特征配置 父主题: 作业相关API

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • APP特征信息及其获取方式

    数字签名,以确保应用程序完整性和真实性。 备案时,在鸿蒙平台中填写证书中公钥。 签名MD5值 签名 MD5 值是指应用程序在发布到应用商店之前,由开发者使用签名证书对应用程序进行数字签名后所得到 MD5 值。 APP 特征信息中 MD5 值,指的是 APP 证书数字指纹值。

    来自:帮助中心

    查看更多 →

  • 升级中心特征库无法升级

    要放通如下地址和端口 安全中心平台目前调度 服务器 &下载服务器信息 1、安全中心平台目前调度服务器信息。 域名 IP sec.huawei.com 45.249.212.170 2、安全中心平台目前下载服务器信息: 域名 IP 优先支持下载区域 备注 fds-canada-5

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了