华为云11.11 AI&大数据分会场

高精度,多场景,快响应,AI&大数据助力企业降本增效

 
 

    机器学习特征选择概述 更多内容
  • 特征选择

    单击界面右上角的图标,选择“数据处理 > 特征选择 > 选择列”,界面新增“选择列”内容。 对应参数说明,如表2所示。 表2 参数说明 参数 参数说明 列筛选方式 特征列的筛选方式,有如下两种: 列·选择 正则匹配 列名 列筛选方式为“列选择”时展示,如果有多列特征数据需要保留,可单击“”同时选中多列特征名称。

    来自:帮助中心

    查看更多 →

  • 机器无法选择?

    机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题

    来自:帮助中心

    查看更多 →

  • 概述

    特征的多行样本进行可信联邦学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。 纵向联邦机器学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的情况,联合多个参与者的共同样本的不同数据特征进行可信联邦学习,联合建模。 概念术语

    来自:帮助中心

    查看更多 →

  • 查询特征选择执行结果

    "result_ext" : "" } 状态码 状态码 描述 200 查询执行结果成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理

    来自:帮助中心

    查看更多 →

  • Standard自动学习

    Standard自动学习 ModelArts通过机器学习的方式帮助不具备算法开发能力的业务开发者实现算法的开发,基于迁移学习、自动神经网络架构搜索实现模型自动生成,通过算法实现模型训练的参数自动化选择和模型自动调优的自动学习功能,让零AI基础的业务开发者可快速完成模型的训练和部署。

    来自:帮助中心

    查看更多 →

  • 最新动态

    为后续特征选择、模型训练的数据集。 公测 创建纵向联邦学习作业 2021年3月 序号 功能名称 功能描述 阶段 相关文档 1 纵向联邦学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的情况,联合多个参与者的共同样本的不同数据特征进行联邦机器学习,联合建模。

    来自:帮助中心

    查看更多 →

  • 基本概念

    可支持用户进行机器学习、深度学习、模型训练作业开发的框架,如Tensorflow、Spark MLlib、MXNet、PyTorch、华为自研AI框架MindSpore等。 数据集 某业务下具有相同数据格式的数据逻辑集合。 特征操作 特征操作主要是对数据集进行特征处理。 在旧版体

    来自:帮助中心

    查看更多 →

  • 数据管理概述

    、Mysql数据集,后续会支持更多华为云服务及原生服务的资源访问功能。连接信息中的敏感部分不会离开参与方侧。 数据管理包含创建数据和数据预处理,是 可信智能计算 服务的一项获取、配置及发布数据资源的功能。参与方进入数据管理>数据创建页面,选择对应连接器(连接器管理中已建立完备),将需

    来自:帮助中心

    查看更多 →

  • 可信智能计算服务 TICS

    如何创建多方安全计算作业? 可信联邦学习作业 可信联邦学习作业是可信智能计算服务提供的在保障用户数据安全的前提下,利用多方数据实现的联合建模,曾经也被称为联邦机器学习。 横向联邦机器学习 横向联邦机器学习,适用于参与者的数据特征重叠较多,而样本ID重叠较少的情况,联合多个参与者的具有相同特征的多行样本进行联邦机器学习,联合建模。

    来自:帮助中心

    查看更多 →

  • 筛选特征

    根据计算得出的iv值,企业A调整了训练使用的特征,没有选用双方提供的特征全集,去掉了部分iv值较低的特征,减少了无用的计算消耗。 父主题: 使用 TICS 可信联邦学习进行联邦建模

    来自:帮助中心

    查看更多 →

  • 创建数据预处理作业

    假设您有如下数据集(只展示部分数据),由于数据不够完整,如job、gender等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1, 0

    来自:帮助中心

    查看更多 →

  • 特征操作

    单击表头,选中需要执行的特征列。 单击“特征操作”,从下拉框中选择选择特征”。 弹出“选择特征”对话框。检查“已选择特征”是否为用户选择特征列。 单击“确定”。 在“特征操作流总览”区域会新增一个“选择特征”节点。 卡方检验 卡方检验通过计算数据集的特征列和标签列之间的偏离程度

    来自:帮助中心

    查看更多 →

  • 特征画像

    。这些类别,对应到后面的特征选择、算法推荐,会有不同的策略,有效提升模型的构建效率。 单击“选择数据”左下方的“特征画像”。 新增“特征画像”内容,如图1所示。 图1 特征画像 单击“特征画像”代码框左侧的图标,运行代码。 通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 提交排序任务API

    分解机每个特征对其他域的隐向量都一致,而域感知因子分解机每个特征对其他每个域都会学习一个隐向量,能够达到更高的精度,但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。 深度网络因子分解机,结合了因子分解机和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而

    来自:帮助中心

    查看更多 →

  • 各个模型深度学习训练加速框架的选择

    各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架: DeepSpeed和Accelerate都是针对深度学习训练加速的工具,但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架,主要针对大规模模型和大规模数据集的训练。D

    来自:帮助中心

    查看更多 →

  • GS

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • GS_OPT_MODEL

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • GS

    ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率,推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

    来自:帮助中心

    查看更多 →

  • 特征工程

    在菜单栏中,单击“特征工程”,进入“特征工程管理”界面。 单击“已发布服务”页签,查看特征工程服务,如图6所示。 图6 特征工程服务 单击特征工程服务行对应“操作”列的图标。 弹出“创建任务”对话框。参数配置说明,如下所示,其余参数保持默认值即可。 任务名称:特征工程服务任务名称。示例:Train_Fail。

    来自:帮助中心

    查看更多 →

  • 特征工程

    行为表。 全局特征信息文件 用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了