文本特征抽取 更多内容
  • 事件抽取

    事件抽取 功能介绍 事件抽取是指从自然语言文本抽取指定类型的事件以及相关实体信息,并形成结构化数据输出的文本处理技术。 目前只支持金融公告中会议召开、聘任、辞职、股票增持、股票减持5类事件以及相关要素的抽取。 本API免费调用,调用限制为2次/秒。 调试 您可以在 API Explorer 中调试该接口。

    来自:帮助中心

    查看更多 →

  • 特征选择

    特征选择 删除列 删除特征列的场景有很多,例如:两个特征呈线性变化关系,为减少模型训练的开销,删除其中一个特征列。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 特征选择 > 删除列”,界面新增“删除列”内容。 对应参数说明,如表1所示。 表1 参数说明 参数 参数说明

    来自:帮助中心

    查看更多 →

  • 数据特征

    数据特征 数据分析 数据处理 特征工程 父主题: 预置算子说明

    来自:帮助中心

    查看更多 →

  • 特征操作

    检查“已选择特征”是否为用户选择的特征列。 配置“变换特征数”,保留指定“变换特征数”的特征列。 单击“确定”,执行信息熵。 在“特征操作流总览”区域会新增一个“信息熵”节点。 新增特征 新增特征支持用户基于已有的特征列,按照样本数据行的维度,通过求和、求均值,构造出新的特征列。例如,两个特征列ID1(2

    来自:帮助中心

    查看更多 →

  • 特征画像

    。这些类别,对应到后面的特征选择、算法推荐,会有不同的策略,有效提升模型的构建效率。 单击“选择数据”左下方的“特征画像”。 新增“特征画像”内容,如图1所示。 图1 特征画像 单击“特征画像”代码框左侧的图标,运行代码。 通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

    来自:帮助中心

    查看更多 →

  • 呼叫特征

    呼叫特征 表1 呼叫特征说明 值 说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助 父主题: 附录

    来自:帮助中心

    查看更多 →

  • 筛选特征

    筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练

    来自:帮助中心

    查看更多 →

  • 特征转换

    特征转换 概述 将对应列的数据乘以相应的权重得到新的列,只支持数字列。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数说明 input_columns_str

    来自:帮助中心

    查看更多 →

  • 文本

    了溢出滚动后,此配置项才生效 文本样式 字体:设置文本的字体。 字号:设置文本的字号。 文本间距:设置文本文本间距 颜色:设置文本的字体颜色。 字体粗细:设置文本的字体粗细。 对齐方式:设置文本的对齐方式,可以设置为左侧、右侧、水平居中。 行高:输入数值或拖动,调整文字的每一行之间的间距。

    来自:帮助中心

    查看更多 →

  • 文本

    文本 词云 时间轴 通用表格 基础表格 趋势 搜索框 下拉选择框 日历组件 翻牌器 时间展示 时间翻牌器 里程碑 排行榜 天气 文本编辑 复选框 日期选择器 指标 标题 树状下拉框 多趋势 树状表格 高级表格 父主题: 组件介绍

    来自:帮助中心

    查看更多 →

  • 文本

    文本 词云 时间轴 通用表格 基础表格 趋势 搜索框 下拉选择框 日历组件 翻牌器 时间展示 时间翻牌器 里程碑 排行榜 天气 文本编辑 复选框 日期选择器 指标 标题 树状下拉框 多趋势 树状表格 高级表格 父主题: 组件介绍

    来自:帮助中心

    查看更多 →

  • 文本

    文本 TF-IDF 文本词向量 词频统计 文章相似度 字符串相似度 字符串相似度topN NGram Count PMI 关键词抽取 原子分词 文本TF-IDF 三元组转kv 文本分类 LDA 句子拆分 文本摘要 停用词过滤 语义相似距离 父主题: 模型工程

    来自:帮助中心

    查看更多 →

  • 文本

    文本 文本是一种样式组件,可以为这个区域设置一个标题等类似文字,用户不会提交数据。文本和单行文本输入、多行文本输入、富文本呈现的效果,如图1所示。 图1 各文本组件效果呈现图 图2 拖拽文本组件到设计区并设置属性 状态:设置字段的状态,如普通和隐藏。 普通:设置为普通后,页面上该字段可正常显示,且可进行配置。

    来自:帮助中心

    查看更多 →

  • 特征工程

    特征工程 特征工程中已经预置了两个特征处理工程,这里暂不使用,会提供端到端的操作流程,帮助用户快速熟悉特征工程界面操作。 如果需要了解特征工程操作详情,可查看模型训练服务《用户指南》中的“特征工程”章节内容。 无故障硬盘训练数据集特征处理 单击菜单栏中的“特征工程”,进入特征工程首页,如图1所示。

    来自:帮助中心

    查看更多 →

  • 特征工程

    行为表。 全局特征信息文件 用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表

    来自:帮助中心

    查看更多 →

  • 特征操作接口

    RESTATE signature_type 否 String 特征类型。 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。 表4 MetadataAttributeRequest

    来自:帮助中心

    查看更多 →

  • 离散特征分析

    离散特征分析 概述 离散值特征分析通过每个离散特征的gini,entropy,gini gain,information gain,information gain ratio等和每个离散值对应的gini,entropy指标,方便对离散特征进行理解。 输入 参数 子参数 参数说明

    来自:帮助中心

    查看更多 →

  • 特征异常检测

    特征异常检测 概述 特征异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency) 箱型图用于检测连续值类特征的数据,根据四分位数检测异常特征。 AVF用于检测枚举值类特征的数据,根据枚举特征的取值频率及阈值检测异常特征。 箱型图异常检测

    来自:帮助中心

    查看更多 →

  • 文本

    溢出滚动:勾选后,如果文本溢出,会自动滚动播放。 滚动时间:输入数值或单击,设置文本滚动的时间。只有当勾选了溢出滚动后,此配置项才生效。 文本样式 分割符:设置文本的分割符。 字体:设置文本的字体。 字号:设置文本的字号。 文本间距:设置文本文本间距 颜色:设置文本的字体颜色。 字体粗细:设置文本的字体粗细。

    来自:帮助中心

    查看更多 →

  • 文本

    自定义属性列表 > 展示溢出文本:允许文本超出组件的容器。 高级设置 在高级设置中,选择设置的文本内容,在出现的配置弹窗中,可进行是否加粗、是否倾斜、字号、字体、文本颜色、背景颜色、对齐方式等配置。 图3 编辑器中文本配置 另外,若需要在文本中设置变量,变量值来自文本组件数据桥接器中的配

    来自:帮助中心

    查看更多 →

  • 文本

    文本 标题 文本 词云 时间器 表格轮播 数字翻牌器 跑马灯 轮播列表柱状图 键值表格 矩形树图 父主题: 组件指南

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了