数据科学特征选择方法入门

筛选特征

筛选特征样本对齐执行完成后单击下一步进入“特征选择”页面，这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。企业A可以选择特征及标签后“启动分箱和IV计算”，通过联邦的统计算法计算出所选特征的iv值，一般而言iv值较高的特征更有区分性，应该作为首选的训练

来自：帮助中心

查看更多 →
修改数据源特征

修改数据源特征功能介绍修改数据源中的特征。调试您可以在 API Explorer 中调试该接口。 URI PUT /v2.0/{project_id}/workspaces/{workspace_id}/data-sources/{datasource_id}/data-struct

来自：帮助中心

查看更多 →
分析ModelArts数据集中的数据特征

其说明。数据特征分析登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理>数据集”，进入“数据集”管理页面。选择对应的数据集，单击操作列的“更多 > 数据特征”，进入数据集概览页的数据特征页面。您也可以在单击数据集名称进入数据集概览页后，单击“数据特征”页签进入。

来自：帮助中心

查看更多 →
特征工程

特征工程如何选中全量特征列？算法工程处理的时候必须要先采样吗？特征处理操作完成后怎么应用于数据集全量数据？特征工程和算法工程的关系？ JupyterLab环境异常怎么处理？父主题：常见问题

来自：帮助中心

查看更多 →
特征工程

特征工程特征工程简介 Python和Spark开发平台 JupyterLab开发平台父主题：用户指南

来自：帮助中心

查看更多 →
特征管理

特征管理特征操作接口父主题：应用模型

来自：帮助中心

查看更多 →
特征工程

在当前界面，可以看到如下两个特征工程： HardDisk-Detect_Good：好盘特征工程，用于对好盘训练数据或测试数据，进行数据处理，并生成经过特征处理后的新数据。 HardDisk-Detect_Fail：坏盘特征工程，用于对坏盘训练数据或测试数据，进行数据处理，并生成经过特征处理后的新数据。

来自：帮助中心

查看更多 →
特征工程

用户在使用特征工程之前，需要提供一份全局的特征信息文件，后续的特征工程、在线模块都会用到该文件。文件数据信息请参见全局特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。保留已有宽表对结果保存路径中已有宽表数据的保留方式：否，不保留任何已有的数据。

来自：帮助中心

查看更多 →
特征操作接口

signature_type 是 String 特征类型。最小长度：1 最大长度：150 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。表4 MetadataAttributeRequest

来自：帮助中心

查看更多 →
使用数据工程构建科学计算大模型数据集

使用数据工程构建科学计算大模型数据集科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。构建科学计算大模型训练数据要求构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求模型类别

来自：帮助中心

查看更多 →
科学计算器

科学计算器科学计算器，可以计算正弦，正切，指数，加减乘除等。连接参数科学计算器连接器使用自定义认证，创建连接时连接参数说明如表1所示。表1 连接参数说明名称必填说明示例值/默认值连接名称是设置连接名称。科学计算器描述否对于连接的信息描述说明。 description

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：使用执行效率更高的数据类型通常情况下，整型数据运算（包括“=”、“＞”、“＜”、“≧”、“≦”、“≠”等常规的比较运算，以及GROUP BY）的效率比字符串和浮点数的效率高。使用短字段的数据类型长度较短的数据类型不仅可以减小

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括“=”、“＞”、“＜”、“≧”、“≦”、“≠”等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减小数据文件的大小，提升I

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括“=”、“＞”、“＜”、“>=”、“<=”、“!=”等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅

来自：帮助中心

查看更多 →
选择数据类型

选择数据类型高效数据类型，主要包括以下三方面：尽量使用执行效率比较高的数据类型一般来说整型数据运算(包括“=”、“＞”、“＜”、“≧”、“≦”、“≠”等常规的比较运算，以及group by)的效率比字符串、浮点数要高。尽量使用短字段的数据类型长度较短的数据类型不仅可以减

来自：帮助中心

查看更多 →