AI开发平台ModelArts 

ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

 
 

    机器学习特征离散化 更多内容
  • 基本概念

    在旧版体验式开发模式下,模型训练服务支持的特征操作有重命名、归一、数值、标准特征离散、One-hot编码、数据变换、删除列、选择特征、卡方检验、信息熵、新增特征、PCA。对应JupyterLab交互式开发模式,是界面右上角的图标中的“数据处理”菜单下面的数据处理算子。 模型包

    来自:帮助中心

    查看更多 →

  • 创建数据预处理作业

    整,如job、sex等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1, 0, 0]表示,1用向量[0

    来自:帮助中心

    查看更多 →

  • 产品术语

    数据集的实例,有具体的数据。 T 特征操作 特征操作主要是对数据集进行特征处理。 在旧版体验式开发模式下,模型训练服务支持的特征操作有重命名、归一、数值、标准特征离散、One-hot编码、数据变换、删除列、选择特征、卡方检验、信息熵、新增特征、PCA。对应JupyterLab交互式开发模

    来自:帮助中心

    查看更多 →

  • 排序策略-离线特征工程

    “等距离散”:根据业务需求限定数值“最小值”、“最大值”和“距离”。例如,根据order_price进行等距离散,设置价格最小值为1,最大值为100,离散距离为10。那么等距离散会按照价格将1-10元,11-20元等为一个区间进行离散。 “归一”:归一,根据业务需求限定数值“最小

    来自:帮助中心

    查看更多 →

  • 特征工程

    小值为4,最大值为12,区间名称为“少儿”,则按照用户自定义的区间进行离散。 “不离散”:(默认)不做归一,不对数据做处理。归一,根据业务需求限定数值“最小值”和“最大值”。例如,根据weight进行归一,设置weight最小值为50,最大值为200。如果给定的数值x在该区

    来自:帮助中心

    查看更多 →

  • Standard自动学习

    Standard自动学习 ModelArts通过机器学习的方式帮助不具备算法开发能力的业务开发者实现算法的开发,基于迁移学习、自动神经网络架构搜索实现模型自动生成,通过算法实现模型训练的参数自动选择和模型自动调优的自动学习功能,让零AI基础的业务开发者可快速完成模型的训练和部署。

    来自:帮助中心

    查看更多 →

  • 可信智能计算服务 TICS

    如何创建多方安全计算作业? 可信联邦学习作业 可信联邦学习作业是 可信智能计算 服务提供的在保障用户数据安全的前提下,利用多方数据实现的联合建模,曾经也被称为联邦机器学习。 横向联邦机器学习 横向联邦机器学习,适用于参与者的数据特征重叠较多,而样本ID重叠较少的情况,联合多个参与者的具有相同特征的多行样本进行联邦机器学习,联合建模。

    来自:帮助中心

    查看更多 →

  • 创建纵向联邦学习作业

    在左侧导航树上依次选择“作业管理 > 可信联邦学习”,打开可信联邦学习作业页面。 在“可信联邦学习”页面,单击“创建”。 图1 创建作业 在弹出的对话框中单击“纵向联邦”按钮,编辑“作业名称”等相关参数,完成后单击“确定”。 目前,纵向联邦学习支持“XGBoost”、“逻辑回归”、“F

    来自:帮助中心

    查看更多 →

  • 特征操作

    在“特征操作流总览”区域会新增一个“标准”节点。 特征离散 特征离散是将特征列连续的样本数据离散化为[0,离散数量-1]区间内的整型数据。 特征离散操作步骤如下。 单击表头,选中需要执行特征离散特征列。 选中的特征列必须为数值型。 单击“特征操作”,从下拉框中选择“特征离散”。 弹出“特征离散化”对话框。参数配置如下所示:

    来自:帮助中心

    查看更多 →

  • 数据转换

    冲突。 单击图标,运行“数值”代码框内容。 特征离散 特征离散是将特征列连续的样本数据离散化为[0,离散数量-1]区间内的整型数据。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 数据转换 > 特征离散”,界面新增“特征离散”内容。 对应参数说明,如表4所示。

    来自:帮助中心

    查看更多 →

  • 最新动态

    公测 联盟管理 计算节点管理 3 联盟和计算节点部署过程可视 清晰展示联盟、计算节点的部署、升级、回滚、删除步骤,在出现问题时便于分析排查。 公测 联盟操作可视 计算节点操作可视 2021年1月 序号 功能名称 功能描述 阶段 相关文档 1 计算节点支持生命周期管理 新增计算节

    来自:帮助中心

    查看更多 →

  • 概述

    文件管理 文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。参与方无需登录后台手动导入模型文件,通过该功能即可将模型文件上传到数据目录,并支持批量删除。在创建联邦学习作业时可以选到上传的脚本模型等文件,提高了易用性及可维护性。 使用场景:管理联邦学习作业所需的脚本、模型、权重文件。

    来自:帮助中心

    查看更多 →

  • 特征选择

    特征选择 删除列 删除特征列的场景有很多,例如:两个特征呈线性变化关系,为减少模型训练的开销,删除其中一个特征列。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 特征选择 > 删除列”,界面新增“删除列”内容。 对应参数说明,如表1所示。 表1 参数说明 参数 参数说明

    来自:帮助中心

    查看更多 →

  • 创建数据集

    结构数据是指具有标准行、列数据属性的数据,例如sql、csv数据等。 配置结构数据集时,需要注意以下几点: 选择数据文件:仅本地连接器需要配置。 数据文件仅支持csv文件和数据目录两种形式。选择数据目录时,必须保证目录下至少包含一个csv文件,且所有csv文件的特征数保持

    来自:帮助中心

    查看更多 →

  • 开发数据预处理作业

    预处理方法(转换函数)将特征数据转换成更加适合算法模型的特征数据。当前 TICS 支持的特征预处理方法如表1所示。对于一个字段,可以添加多种预处理方法,并且建议按照如下处理顺序进行编排: 连续型字段:缺失值处理>特征缩放、缺失值处理>标准、异常值处理>标准、缺失值处理>异常值处理>Log变换等

    来自:帮助中心

    查看更多 →

  • 特征画像

    特征画像 特征画像的作用,就是对数据进行分析,把其中一些基本特征提取出来,如:周期性、离散度、时序规律、最值、采样频率等,计算KPI曲线特点(包括周期性、趋势性、噪声、离散性、随机性等)。根据计算的曲线特点,判断KPI的大类别(毛刺型、阶梯型、周期型、离散型、稀疏型、多模态型等)

    来自:帮助中心

    查看更多 →

  • 提交排序任务API

    分解机每个特征对其他域的隐向量都一致,而域感知因子分解机每个特征对其他每个域都会学习一个隐向量,能够达到更高的精度,但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。 深度网络因子分解机,结合了因子分解机和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而

    来自:帮助中心

    查看更多 →

  • AI开发基本概念

    AI开发基本概念 机器学习常见的分类有3种: 监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。常见的有回归和分类。 非监督学习:在未加标签的数据中,试图找到隐藏的结构。常见的有聚类。 强化学习:智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。

    来自:帮助中心

    查看更多 →

  • 筛选特征

    根据计算得出的iv值,企业A调整了训练使用的特征,没有选用双方提供的特征全集,去掉了部分iv值较低的特征,减少了无用的计算消耗。 父主题: 使用TI CS 可信联邦学习进行联邦建模

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 数据管理概述

    连接器是可信智能计算服务提供的一项访问参与方数据资源的功能。参与方填写连接信息来创建对应类型的连接器,并通过这些连接器访问到各类型资源的结构信息。当前支持 MRS 服务(Hive)、本地数据集、RDS数据集、DWS数据集、Oracle数据集、Mysql数据集,后续会支持更多华为云服务及原生服务

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了