数据科学特征选择方法入门 更多内容
  • 筛选特征

    筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 分析ModelArts数据集中的数据特征

    其说明。 数据特征分析 登录ModelArts管理控制台,在左侧菜单栏中选择数据管理>数据集”,进入“数据集”管理页面。 选择对应的数据集,单击操作列的“更多 > 数据特征”,进入数据集概览页的数据特征页面。 您也可以在单击数据集名称进入数据集概览页后,单击“数据特征”页签进入。

    来自:帮助中心

    查看更多 →

  • 特征工程

    在当前界面,可以看到如下两个特征工程: HardDisk-Detect_Good:好盘特征工程,用于对好盘训练数据或测试数据,进行数据处理,并生成经过特征处理后的新数据。 HardDisk-Detect_Fail:坏盘特征工程,用于对坏盘训练数据或测试数据,进行数据处理,并生成经过特征处理后的新数据。

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    RESTATE signature_type 否 String 特征类型。 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。 表4 MetadataAttributeRequest

    来自:帮助中心

    查看更多 →

  • 特征工程

    用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表 对结果保存路径中已有宽表数据的保留方式: 否,不保留任何已有的数据。

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。 尽量使用短字段的数据类型 长度较短的数据类型不仅可以减小数据文件的大小,提升I

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括“=”、“>”、“<”、“≧”、“≦”、“≠”等常规的比较运算,以及group by)的效率比字符串、浮点数要高。 尽量使用短字段的数据类型 长度较短的数据类型不仅可以减

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。比如某客户场景中对列存表进行点查询,filter条件在一个numeric列上,执

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括“=”、“>”、“<”、“≧”、“≦”、“≠”等常规的比较运算,以及group by)的效率比字符串、浮点数要高。 尽量使用短字段的数据类型 长度较短的数据类型不仅可以减

    来自:帮助中心

    查看更多 →

  • 科学计算器

    科学计算器 科学计算器,可以计算正弦,正切,指数,加减乘除等。 连接参数 科学计算器连接器使用自定义认证,创建连接时连接参数说明如表1所示。 表1 连接参数说明 名称 必填 说明 示例值/默认值 连接名称 是 设置连接名称。 科学计算器 描述 否 对于连接的信息描述说明。 description

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括“=”、“>”、“<”、“≧”、“≦”、“≠”等常规的比较运算,以及group by)的效率比字符串、浮点数要高。 尽量使用短字段的数据类型 长度较短的数据类型不仅可以减

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。 尽量使用短字段的数据类型 长度较短的数据类型不仅可以减小数据文件的大小,提升I

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。比如某客户场景中对列存表进行点查询,filter条件在一个numeric列上,执

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 使用执行效率更高的数据类型 通常情况下,整型数据运算(包括“=”、“>”、“<”、“≧”、“≦”、“≠”等常规的比较运算,以及GROUP BY)的效率比字符串和浮点数的效率高。 使用短字段的数据类型 长度较短的数据类型不仅可以减小

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 如何选中全量特征列? 算法工程处理的时候必须要先采样吗? 特征处理操作完成后怎么应用于数据集全量数据特征工程和算法工程的关系? JupyterLab环境异常怎么处理? 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程简介 Python和Spark开发平台 JupyterLab开发平台 父主题: 用户指南

    来自:帮助中心

    查看更多 →

  • 特征管理

    特征管理 特征操作接口 父主题: 应用模型

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。比如某客户场景中对列存表进行点查询,filter条件在一个numeric列上,执

    来自:帮助中心

    查看更多 →

  • 选择数据类型

    选择数据类型 高效数据类型,主要包括以下三方面: 尽量使用执行效率比较高的数据类型 一般来说整型数据运算(包括=、>、<、≧、≦、≠等常规的比较运算,以及group by)的效率比字符串、浮点数要高。比如某客户场景中对列存表进行点查询,filter条件在一个numeric列上,执

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了