中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    多选大数据的特征包括 更多内容
  • 根据数据集的entitiesId获取数据集的特征信息

    根据数据entitiesId获取数据特征信息 功能介绍 管理侧根据数据集entitiesId获取数据特征信息。 URI URI格式 POST /softcomai/datalake/v1.0/originDataModels/{entitiesId}/entitysattr

    来自:帮助中心

    查看更多 →

  • 根据数据集的entitiesId获取数据集的特征信息

    根据数据entitiesId获取数据特征信息 功能介绍 管理侧根据数据集entitiesId获取数据特征信息。 URI URI格式 POST /softcomai/datalake/v1.0/originDataModels/{entitiesId}/entitysattr

    来自:帮助中心

    查看更多 →

  • 获取通话状态,包括会议中的实时信息

    最长12字节 发送时视频丢包率 videoLossNumSend int [0, 12] 发送时视频丢包个数 videoLossPerRev String 最长12字节 接收时视频丢包率 videoLossNumRev int [0, 12] 接收时视频丢包个数 AuxVideoLossPerSend

    来自:帮助中心

    查看更多 →

  • 安全认证签名的内容是否包括Body体

    安全认证签名内容是否包括Body体 包括。除了几个必选请求头部参数,Body体也是签名要素之一。例如有一个使用POST方法上传文件API,那么在签名过程中,会取这个文件hash值,参与生成签名信息。 关于签名详细指导,可参考:签名认证算法详解。 父主题: API认证鉴权

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局特征信息文件。当上传数据特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    特征异常平滑 概述 特征异常平滑算子用于将数据异常数据平滑到一定区间,可选择采用箱线图、阈值、百分位和z-score方法确定平滑区间。 z-score方式:计算所需要平滑特征均值mean和标准差std,并引入置信因子cl 平滑区间上界: 平滑区间下界: min-max

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程处理数据计算平台。 创建人 发布服务用户名。 创建时间 发布服务时间。 活动时间 最新执行特征工程任务时间。 简介 特征工程服务简介。 查看特征工程服务详情,包括特征工程任务列表信息。 创建特征工程任务。 删除特征工程服务。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签重要性对特征进行筛选,特征重要性较高特征,提升训练精度和效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据特征工程和算法工程关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换特征名 - scale_method 尺度变换方法 "ln" item_spliter 离散型特征,iterm之间分割符 "," kv_spliter 离散型特征KV分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 事件订阅

    实体类型 订阅实体类型,支持多选。 模型架构 选择已发布模型架构。 选择通道 选择订阅事件将变更信息推送到第三方通道。 是否生效 订阅是否生效开关,默认生效。 事件描述 事件订阅描述信息,最大字符限制为200。 Topic 通道连接系统对应topic。 实体特征 对应实体类型的特征,支持多选。

    来自:帮助中心

    查看更多 →

  • 特征工程和算法工程的关系?

    特征工程和算法工程关系? 用户创建特征工程时候,进入特征工程,可以看到系统自动创建特征工程同名算法工程。支持在同一个特征工程中创建多个算法工程,操作如下所示: 在JupyterLab环境编辑界面,单击界面左上角“File > New Launcher”,界面右侧新增“

    来自:帮助中心

    查看更多 →

  • 大模型微调需要的数据有要求吗?

    模型微调需要数据有要求吗? 用于模型微调数据集必须同时满足用途为“模型训练”、任务领域为“自然语言处理”、任务子领域为“文本生成”、数据集格式为“对话文本”四个条件。 父主题: AI原生应用引擎

    来自:帮助中心

    查看更多 →

  • 模型训练服务简介

    支持多种部署模式 公有云部署:数据允许出局,面向用户包括:中小T、合作伙伴、华为内部研发。 合营云部署:数据不出局,面向用户为有合营云T。 华为云Stack部署:数据不出局,面向用户为无合营云T。 GDE部署:数据不出局,面向用户包括:中小T、合作伙伴。 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • KooCLI系统参数包括哪些?

    命令中直接使用 cli-output 响应数据输出格式[json|table|tsv] 命令中直接使用 cli-query 筛选响应数据JMESPath路径 命令中直接使用 cli-output-num table输出时,是否打印表格行号。取值为true或false,默认为true

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 特征重要性和特征在线性模型中weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    待提取用户特征 (user_features) 是 JSONArray 从全局特征文件提取输入用户特征,对不同类型特征进行相应处理,处理后数据用于排序模型训练。 特征必须来自用户属性配置表中定义特征。 [{ "feature_name": "age", "feature_type":

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了