特征点机器学习 更多内容
  • 离散特征分析

    离散特征分析 概述 离散值特征分析通过每个离散特征的gini,entropy,gini gain,information gain,information gain ratio等和每个离散值对应的gini,entropy指标,方便对离散特征进行理解。 输入 参数 子参数 参数说明

    来自:帮助中心

    查看更多 →

  • 特征异常检测

    Value Frequency,针对非数值型的数据,即类别离散数据的算法。具体步骤如下: 将所有的数据都标为非异常; 计算所有每一个属性值的频数; 计算每一个的AVF score,即样本x的每一个属性值对应的频数之和除以属性总数,这里的属性指的都是category的属性。 AVF

    来自:帮助中心

    查看更多 →

  • AI开发基本概念

    AI开发基本概念 机器学习常见的分类有3种: 监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。常见的有回归和分类。 非监督学习:在未加标签的数据中,试图找到隐藏的结构。常见的有聚类。 强化学习:智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。

    来自:帮助中心

    查看更多 →

  • 修订记录

    新增“异步推理”章节。 更新“发布推理服务”章节。 2020-11-30 优化创建联邦学习工程章节,加入在模型训练服务创建联邦学习工程和联邦学习服务的关系描述。 2020-09-30 数据集详情界面优化,更新新建数据集和导入数据。 模型训练章节,针对AutoML自动机器学习,输出场景化资料。 模型管理界面优化,更新模型管理。

    来自:帮助中心

    查看更多 →

  • 创建纵向联邦学习作业

    用户登录进入计算节页面。 在左侧导航树上依次选择“作业管理 > 可信联邦学习”,打开可信联邦学习作业页面。 在“可信联邦学习”页面,单击“创建”。 图1 创建作业 在弹出的对话框中单击“纵向联邦”按钮,编辑“作业名称”等相关参数,完成后单击“确定”。 目前,纵向联邦学习支持“XGBo

    来自:帮助中心

    查看更多 →

  • GS

    续扩展。 model_name name 模型的实例名,每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名,每个模型只针对单个database。此参数决定训练时所使用的数据。

    来自:帮助中心

    查看更多 →

  • GS

    续扩展。 model_name name 模型的实例名,每个模型对应aiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名,每个模型只针对单个database。此参数决定训练时所使用的数据。

    来自:帮助中心

    查看更多 →

  • 从0到1利用ML Studio进行机器学习建模

    编辑界面,如图2所示,则创建算子成功。 图2 拖拽创建结 在画布中,鼠标移至算子结,从右侧输出端口,如图3所示,拖动连线至下一个算子结,鼠标尽量放置至如图4 连线结束位置所示红框位置。 图3 从输出端口移动至下一结 图4 连线结束位置 进行算子连线。 算子之间具有数据的流

    来自:帮助中心

    查看更多 →

  • 查看算子

    如图1中红色框所示,预置算子列表目前分为数据特征、输入输出、模型工程三大类。带标志的是算子类别,比如数据特征类,该类包含数据特征的子类数据分析、特征工程、数据处理及其算子。详细的预置算子说明请参考预置算子说明章节。 单击算子类对象前图标,即可展开显示子类和算子。 双击数据特征类,展开其子类数据分析、特征工程、数据

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据? 特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 数据特征分析

    Bounding Boxes 横坐标:边缘化程度,即目标框中心距离图片中心的距离占图片总距离的比值,值越大表示物体越靠近边缘。(图片总距离表示以图片中心为起画一条经过标注框中心的射线,该射线与图片边界交到图片中心的距离)。 纵坐标:框数量(统计所有图片中的框)。 一般呈

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换的特征名 - scale_method 尺度变换的方法 "ln" item_spliter 离散型特征的,iterm之间的分割符 "," kv_spliter 离散型特征KV的分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 排序策略

    行更新。 学习率:优化算法的参数,决定优化器在最优方向上前进步长的参数。默认0.001。 初始梯度累加和:梯度累加和用来调整学习步长。默认0.1。 ftrl:Follow The Regularized Leader 适用于处理超大规模数据的,含大量稀疏特征的在线学习的常见优化算法。

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程:对数据进行特征处理操作的工程。 特征工程服务:将优质的特征工程发布成服务,用户可以直接调用该服务,对具备完全相同特征的数据进行特征处理。 特征工程任务:调用特征工程服务的过程。用户在调用特征工程服务的时候,需要基于特征工程服务新建任务。 特征工程管理页面 “特征工程”页面分为两个页签:特征处理工程和已发布服务。

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签的重要性对特征进行筛选,特征重要性较高的特征,提升训练的精度和效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • 自动学习

    。 自动学习的关键技术主要是基于信息熵上限近似模型的树搜索最优特征变换和基于信息熵上限近似模型的贝叶斯优化自动调参。通过这些关键技术,可以从企业关系型(结构化)数据中,自动学习数据特征和规律,智能寻优特征&ML模型及参数,准确性甚至达到专家开发者的调优水平。自动深度学习的关键技术

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    上四分位数(Q3 / 75th Percentile):数据集的中位数和最大值之间的中间值(不是“最大值”); 四分位间距(IQR):第25至第75个百分的距离 上边缘:Q3 + 1.5 * IQR 下边缘:Q1 -1.5 * IQR 平滑区间上界:上边缘 平滑区间下界:下边缘 输入 参数 子参数

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了