AI开发平台ModelArts 

ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

 
 

    机器学习离散特征 更多内容
  • 特征操作接口

    "failure": [] } 状态码 状态码 描述 200 successful operation. 400 Bad Request. 500 Internal Server Error. 错误码 请参见错误码。 父主题: 特征管理

    来自:帮助中心

    查看更多 →

  • 特征异常检测

    特征异常检测 概述 特征异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency) 箱型图用于检测连续值类特征的数据,根据四分位数检测异常特征。 AVF用于检测枚举值类特征的数据,根据枚举特征的取值频率及阈值检测异常特征。 箱型图异常检测

    来自:帮助中心

    查看更多 →

  • 最新动态

    为后续特征选择、模型训练的数据集。 公测 创建纵向联邦学习作业 2021年3月 序号 功能名称 功能描述 阶段 相关文档 1 纵向联邦学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的情况,联合多个参与者的共同样本的不同数据特征进行联邦机器学习,联合建模。

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换的特征名 - scale_method 尺度变换的方法 "ln" item_spliter 离散特征的,iterm之间的分割符 "," kv_spliter 离散特征KV的分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 提交排序任务API

    分解机每个特征对其他域的隐向量都一致,而域感知因子分解机每个特征对其他每个域都会学习一个隐向量,能够达到更高的精度,但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。 深度网络因子分解机,结合了因子分解机和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而

    来自:帮助中心

    查看更多 →

  • GS

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • GS

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • ML Studio简介

    ,可帮助开发者快速构建具有实用价值的机器学习应用。 MLS为AI开发者提供可视化的操作界面来编排机器学习模型的训练、评估和预测的过程,无缝衔接数据分析和预测应用,为用户的数据挖掘分析业务提供易用、高效、高性能的工具。 了解概念 算子 在MLS中,算子是一种基本功能单元,以ipyn

    来自:帮助中心

    查看更多 →

  • GS

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • FM算法

    使用英文逗号(,)分隔的三个整数,分别表示0次项、线性项及二次项的长度。 1,1,8 num_epochs 迭代数。 100 learn_rate 学习率。 0.01 param_lambda 使用英文逗号(,)分隔的三个浮点数,分别表示0次项、线性项及二次项的正则化系数。 0.2,0.2

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据? 特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 数据特征分析

    由于发布后的数据集不会默认启动数据特征分析,针对数据集的各个版本,需手动启动特征分析任务。在数据特征页签下,单击“启动特征分析”。 在弹出的对话框中配置需要进行特征分析的数据集版本,然后单击“确定”启动分析。 “版本选择”,即选择当前数据集的已发布版本。 图1 启动数据特征分析任务 数据特征分析任务启动

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    是否为k:v的稀疏特征, 如果指定该列,soften_cols参数只支持选择稀疏特征列kv_col中的列名。 False kv_col 否 如果为稀疏特征,指定稀疏特征列名。 "kv" item_spliter 否 稀疏特征的分隔符。 "," kv_spliter 否 稀疏特征key和value的分隔符。

    来自:帮助中心

    查看更多 →

  • 从0到1利用ML Studio进行机器学习建模

    Studio操作界面章节。 Step1 创建一个空算链 单击Launcher界面的MLS Editor,选择名为PySpark-2.4.5的Kernel,创建一个空的算链。 创建算链后,左侧界面自动跳转到资产预览界面。 图1 算链创建成功 Step2 使用ML Studio建模 从左侧资产浏览界面

    来自:帮助中心

    查看更多 →

  • 查看算子

    如图1中红色框所示,预置算子列表目前分为数据特征、输入输出、模型工程三大类。带标志的是算子类别,比如数据特征类,该类包含数据特征的子类数据分析、特征工程、数据处理及其算子。详细的预置算子说明请参考预置算子说明章节。 单击算子类对象前图标,即可展开显示子类和算子。 双击数据特征类,展开其子类数据分析、特征工程、数据

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程:对数据进行特征处理操作的工程。 特征工程服务:将优质的特征工程发布成服务,用户可以直接调用该服务,对具备完全相同特征的数据进行特征处理。 特征工程任务:调用特征工程服务的过程。用户在调用特征工程服务的时候,需要基于特征工程服务新建任务。 特征工程管理页面 “特征工程”页面分为两个页签:特征处理工程和已发布服务。

    来自:帮助中心

    查看更多 →

  • AI开发基本概念

    AI开发基本概念 机器学习常见的分类有3种: 监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。常见的有回归和分类。 非监督学习:在未加标签的数据中,试图找到隐藏的结构。常见的有聚类。 强化学习:智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了