中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据四大特征或4V特征 更多内容
  • 特征工程简介

    特征工程简介 用户可以通过特征工程对数据集进行数据处理、特征组合、特征转换等特征处理,最大限度的从原始数据中提取特征以供模型训练使用。此外,用户还可以将优质的特征工程发布成服务,以服务的形式对具备完全相同特征数据进行预处理。 特征工程相关的基本概念: 特征工程:对数据进行特征处理操作的工程。

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签的重要性对特征进行筛选,特征重要性较高的特征,提升训练的精度和效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 特征的重要性和特征在线性模型中的weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    执行记录:查看全量数据应用的历史记录。并支持在“执行记录”中删除全量数据应用操作重新执行全量数据应用操作。 执行:将特征操作流应用在导入特征工程的全量数据上,并生成经过特征处理的新数据。 4 特征操作明细区域。 单击“特征操作流总览”,查看特征操作流详情,单击每个特征操作名称前面的

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    字符。 工程描述 特征工程描述信息。 最多不超过500个字符。 开发平台 特征工程处理数据集的计算平台JupyterLab。 规格 计算平台的资源配置信息。请根据实际情况选择。 实例 创建JupyterLab运行环境的实例。可以从下拉框中选择已创建的运行环境选择“新建一个新环境”。

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    List 用户特征列表。 item_features List 物品特征列表。 表5 user_features 和 item_features参数说明 参数名称 参数类型 说明 feature_name String 特征名称。 feature_type String 特征类型。 feature_value_type

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    按时间或比例划分训练集测试集。 可选值为TIMERATE。 训练数据起始时间 (training_data_start_time) 否 Long 训练数据起始时间。 divide_by_time_or_rate为TIME时必填。取值不大于行为数据中的最大时间且不大于training_d

    来自:帮助中心

    查看更多 →

  • 升级中心特征库无法升级

    升级中心特征库无法升级 问题描述 特征库升级失败,提示连接升级 服务器 失败,请检查网络配置。 可能的原因 License授权问题,或者上游设备做了安全限制导致网络不通。 解决方法 本地授权版本,确认相应特征库已授权 云端授权版本,确定乾坤云上该设备已经绑定边界防护与响应套餐,并且套餐状态为已部署

    来自:帮助中心

    查看更多 →

  • APP特征信息及其获取方式

    APP特征信息及其获取方式 鸿蒙平台APP特征信息基本概念 特征信息 定义 APP包名 APP包名是HarmonyOS应用程序的唯一标识符,例如:com.huaweicloud.harmony 公钥 公钥是加密算法中的公钥,用于保护数据的安全性。在APP中,公钥通常用于验证应用程

    来自:帮助中心

    查看更多 →

  • 自定义IPS特征

    建议您优先选择“ANY”。 目的端口 “目的类型”选择“包含”“排除”时,设置目的端口。 支持设置单个多个端口,多个端口之间用半角逗号(,)隔开,如:80,100。 支持连续端口组,中间使用“-”隔开,如:80-443。 动作 防火墙检测到该特征流量时,采取的动作。 观察:仅对攻击事件进行检

    来自:帮助中心

    查看更多 →

  • 如何选中全量特征列?

    如何选中全量特征列? 使用Python和Spark开发平台创建的特征工程,在特征操作界面,单击表格左上方第一个带有倒三角标识的单元格即可。 使用JupyterLab开发平台创建的特征工程,在JupyterLab环境编辑区域分别运行“Import sdk”和“加载数据”代码框。运行

    来自:帮助中心

    查看更多 →

  • 查询特征选择执行结果

    查询特征选择执行结果 功能介绍 查询特征选择执行结果 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id}/features-selection-result

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    提交特征工程作业 提交特征工程作业 查询全局特征配置 父主题: 作业相关API

    来自:帮助中心

    查看更多 →

  • 排序策略-离线特征工程

    训练集测试集划分方式 数据划分方式按时间比例个数比例划分训练集测试集。 “时间比例”:将全部数据的时间跨度按照时间比例划分成两段数据,训练数据为前一段时间中的数据,测试数据为后一段时间的数据,取值TIME。 “个数比例”:个数比例是将全部数据按个数比例随机划分成训练集和测试集传入值。取值 RAM DOM。

    来自:帮助中心

    查看更多 →

  • 随机森林回归特征重要性

    随机森林回归特征重要性 概述 采用随机森林回归算法计算数据特征特征重要性 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和random_forest_regressor_model参数,表示直接

    来自:帮助中心

    查看更多 →

  • 特征工程和算法工程的关系?

    特征工程和算法工程的关系? 用户创建特征工程的时候,进入特征工程,可以看到系统自动创建的与特征工程同名的算法工程。支持在同一个特征工程中创建多个算法工程,操作如下所示: 在JupyterLab环境编辑界面,单击界面左上角的“File > New Launcher”,界面右侧新增“

    来自:帮助中心

    查看更多 →

  • 随机森林分类特征重要性

    随机森林分类特征重要性 概述 采用随机森林分类算法计算数据特征特征重要性 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和random_forest_classify_model参数,表示直接根

    来自:帮助中心

    查看更多 →

  • 学件简介

    功能模块 说明 数据接入模块 实现与各类数据源的接口、格式转换等。 数据管理模块 提供源数据、标注样本的存储、导入导出、查询等功能。 数据处理模块 主要实现数据的预处理,包括标签处理、缺失值填充、数据标准化等。 特征处理模块 主要实现对KPI的数据分布特征进行分析,自动选择特征及参数。并提供四大类,80+特征的自动提取。

    来自:帮助中心

    查看更多 →

  • 决策树回归特征重要性

    决策树回归特征重要性 概述 采用决策树回归算法计算数据特征特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和decision_tree_regressor_model参数,表示直接根

    来自:帮助中心

    查看更多 →

  • 设备导入License后,特征库无法升级

    设备导入License后,特征库无法升级 问题描述 设备导入License后,需要将AV和IPS特征库升级到最新版本,进入“系统 > 升级中心”,单击“立即升级”执行特征库升级,提示“升级服务器 域名 解析失败,请检查配置网络”,特征库升级失败。 可能的原因 设备不能连接公网,无法连接到升级中心。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了