特征离散化 更多内容
  • 创建数据集

    结构数据是指具有标准行、列数据属性的数据,例如sql、csv数据等。 配置结构数据集时,需要注意以下几点: 选择数据文件:仅本地连接器需要配置。 数据文件仅支持csv文件和数据目录两种形式。选择数据目录时,必须保证目录下至少包含一个csv文件,且所有csv文件的特征数保持

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据? 特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 数据特征分析

    数据特征分析 基于图片或目标框对图片的各项特征,如模糊度、亮度进行分析,并绘制可视曲线,帮助处理数据集。 您还可以选择数据集的多个版本,查看其可视曲线,进行对比分析。 背景信息 只有“图片”的数据集,且版本标注类型为“物体检测”和“图像分类”的数据集版本支持数据特征分析。 只

    来自:帮助中心

    查看更多 →

  • gbdt编码模型应用

    gbdt编码模型应用 概述 利用训练好的gbdt分类模型对输入的特征进行离散化处理。对每棵树的叶子节点进行编码,预测的时候遍历到叶子节点对应位置的编码为1,该树其余节点的编码为0。该节点主要用于读取gbdt编码模型训练阶段保存的模型,并对数据进行离散编码。 输入 参数 子参数 参数说明 inputs

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程简介 用户可以通过特征工程对数据集进行数据处理、特征组合、特征转换等特征处理,最大限度的从原始数据中提取特征以供模型训练使用。此外,用户还可以将优质的特征工程发布成服务,以服务的形式对具备完全相同特征的数据进行预处理。 特征工程相关的基本概念: 特征工程:对数据进行特征处理操作的工程。

    来自:帮助中心

    查看更多 →

  • FM算法

    0.01 param_lambda 使用英文逗号(,)分隔的三个浮点数,分别表示0次项、线性项及二次项的正则系数。 0.2,0.2,0.2 init_stdev 参数初始标准差。 0.01 mini_batch_fraction 训练过程中,最小分片大小。 1 tol 判断收敛的忍受度。

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    是否为k:v的稀疏特征, 如果指定该列,soften_cols参数只支持选择稀疏特征列kv_col中的列名。 False kv_col 否 如果为稀疏特征,指定稀疏特征列名。 "kv" item_spliter 否 稀疏特征的分隔符。 "," kv_spliter 否 稀疏特征key和value的分隔符。

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    所有输出数据(用户物品特征特征映射、域特征值数目统计结果、训练集、测试集)的存储都路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。

    来自:帮助中心

    查看更多 →

  • 数据分析

    数据分析 箱型图 分桶统计 相关性分析 决策树分类特征重要性 决策树回归特征重要性 梯度提升树分类特征重要性 梯度提升树回归特征重要性 孤立森林 百分位 百分位统计 直方图 折线图 饼形图 散点图 随机森林分类特征重要性 随机森林回归特征重要性 全表统计 单样本t检验 直方图(多字段)

    来自:帮助中心

    查看更多 →

  • 查询数据源任务结果

    String 特征名。 data_type String 特征类型。 表17 StrFeatureReport 参数 参数类型 描述 name String 特征名。 data_type String 特征类型。 str_count Map<String,Integer> 离散类型特征出现次数统计。

    来自:帮助中心

    查看更多 →

  • 功能特性

    取证分析:采集和存储终端信息,并通过数据挖掘、关联分析等方法,对威胁事件进行取证分析。 攻击可视:通过EDR( Endpoint Detection and Response,端点检测与响应)数字建模、溯源推理算法,实现攻击可视,精准还原威胁攻击链路。 父主题: 产品介绍

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    旧版体验式开发 基于Web页面特征工程体验开发,适用于初学者及无码特征工程。 开发平台 开发模式选择“旧版体验式开发”时展现,表示特征工程处理数据集的计算平台: Python:对于小数据量的数据集实例,选择使用Python。python 分为local python与modelarts

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    程。我们以在“特征工程管理”页面创建特征工程为例,操作步骤如下。 单击特征工程首页右上角的图标。 弹出“特征处理”对话框。如图1所示。 图1 创建特征工程 配置“特征处理”对话框参数,具体参见表1。 表1 特征工程参数配置说明 参数名称 参数说明 工程名称 特征工程的名称。 只能以字母(A~Z

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • 选择标签列

    即“attr_5”),该列目标结果是“离散值”。训练目标选择完成后,单击“训练”。 图1 预测分析数据标注界面 选择“标签列数据类型”。在“数据标注”页面中,“标签列数据类型”下选择合适的数据类型。 若标签列为枚举型数据,数据类型应选择“离散值”,预测分析将训练分类模型。 若标签

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 特征的重要性和特征在线性模型中的weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 关键特性

    取证分析:采集和存储终端信息,并通过数据挖掘、关联分析等方法,对威胁事件进行取证分析。 攻击可视:通过EDR(Endpoint Detection and Response,端点侦测与回归)数字建模、溯源推理算法,实现攻击可视,精准还原威胁攻击链路。 父主题: 方案概述

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了