字符串的相似度算法 更多内容
  • 字符串相似度

    inputs为字典类型,dataDF是输入字符串集合,数据类型是pyspark中DataFrame类型对象 inputs paramDF paramDF是输入被映射字符串集合,数据类型是pyspark中DataFrame类型对象 输出 DataRame 参数说明 参数名 参数类型 是否必选 参数含义

    来自:帮助中心

    查看更多 →

  • 字符串相似度topN

    inputs为字典类型,dataDF是输入字符串集合,数据类型是pyspark中DataFrame类型对象 inputs paramDF paramDF是输入被映射字符串集合,数据类型是pyspark中DataFrame类型对象 输出 DataRame 参数说明 参数名 参数类型 是否必选 参数含义

    来自:帮助中心

    查看更多 →

  • 文章相似度

    文章相似 概述 支持cosine、levenshtein、jaccard和最长公共子序列四种方法计算文章相似。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 DataRame

    来自:帮助中心

    查看更多 →

  • 文本相似度(高级版)

    文本相似(高级版) 功能介绍 对文本语义相似计算。 具体Endpoint请参见终端节点。 本API免费调用,调用限制为2次/秒。 文本相似基础版和高级版基于不同算法实现,对相同文本,基础版和高级版结果有所差别。根据测试数据,高级版效果一般优于基础版。 调试 您可以在API

    来自:帮助中心

    查看更多 →

  • 文本相似度(基础版)

    文本相似(基础版) 功能介绍 对文本进行语义相似计算。 具体Endpoint请参见终端节点。 调用华为云NLP服务会产生费用,本API支持使用基础套餐包,购买时请在 自然语言处理 价格计算器中查看基础套餐包和领域套餐包支持API范围。 也可使用文本相似(高级版)接口,详情请见

    来自:帮助中心

    查看更多 →

  • 紧密中心度算法(closeness)

    紧密中心算法(closeness) 功能介绍 根据输入参数,执行紧密中心算法。 紧密中心算法(Closeness Centrality)计算一个节点到所有其他可达节点最短距离倒数,进行累积后归一化值。 URI POST /ges/v1.0/{project_id}/h

    来自:帮助中心

    查看更多 →

  • 标签传播算法(Label Propagation)

    标签传播算法(Label Propagation) 概述 标签传播算法(Label Propagation)是一种基于图半监督学习方法,其基本思路是用已标记节点标签信息去预测未标记节点标签信息。利用样本间关系建图,节点包括已标注和未标注数据,其边表示两个节点相似,节点的

    来自:帮助中心

    查看更多 →

  • 中介中心度算法(betweenness)

    中介中心算法(betweenness) 功能介绍 根据输入参数,执行中介中心算法。 中介中心算法(Betweenness Centrality)以经过某个节点最短路径数目来刻画节点重要性指标。 URI POST /ges/v1.0/{project_id}/hyg/{g

    来自:帮助中心

    查看更多 →

  • 中介中心度算法(betweenness)(2.2.4)

    * 空:边上权重、距离默认为“1”。 * 字符串:对应边上属性将作为权重,当某边没有对应属性时,权重将默认为1。 说明: 边上权重应大于0。 - seeds 否 节点ID String 当图较大时,运行精确betweenness较慢,可以设置seeds作为采样节点,进行近似运

    来自:帮助中心

    查看更多 →

  • 召回策略

    描述 策略具体描述。 最近邻域数 在UserCF算法中使用,生成相似矩阵中为每个用户保留若干个最相似用户。默认为100。 最小交叉 物品和物品之间被同一用户行为记录数量,计算相似时,过滤掉共同记录小于最小交叉item。 默认值:1。 物品活跃 物品过滤用户活跃度阈值。

    来自:帮助中心

    查看更多 →

  • 语义相似距离

    参数说明 默认值 id_col 是 用户id所在列名 "id" vector_col 是 向量列名列表,如col1,col2 "" topn 是 输出距离最近向量数目。取值范围[1,+∞) 20 distance_type 是 距离计算方式。取值[cosine] "cosine"

    来自:帮助中心

    查看更多 →

  • 紧密中心度算法(Closeness Centrality)

    紧密中心算法(Closeness Centrality) 概述 紧密中心算法(Closeness Centrality)计算一个节点到所有其他可达节点最短距离倒数,进行累积后归一化值。紧密中心可以用来衡量信息从该节点传输到其他节点时间长短。节点“Closeness

    来自:帮助中心

    查看更多 →

  • 中介中心度算法(Betweenness Centrality)

    Centrality算法参数说明 参数 是否必选 说明 类型 取值范围 默认值 directed 否 是否考虑边方向 Boolean true或者false true weight 否 边上权重 String 空或字符串 * 空:边上权重、距离默认为“1”。 * 字符串:对应边上属性将

    来自:帮助中心

    查看更多 →

  • 文本

    文本 TF-IDF 文本词向量 词频统计 文章相似 字符串相似 字符串相似topN NGram Count PMI 关键词抽取 原子分词 文本TF-IDF 三元组转kv 文本分类 LDA 句子拆分 文本摘要 停用词过滤 语义相似距离 父主题: 模型工程

    来自:帮助中心

    查看更多 →

  • 分子搜索

    。最终以SMILES为准。 选择算法:可以选择ECFP4 Tanimoto相似或者骨架搜索。ECFP4 Tanimoto相似是通过ECFP4指纹计算Tanimoto相似来搜索相似比较高小分子。骨架搜索是通过设置分子骨架搜索具有相同骨架分子。 选择数据库:最多可选择10个数据库。

    来自:帮助中心

    查看更多 →

  • 度数关联度算法(Degree Correlation)

    度数关联算法(Degree Correlation) 概述 度数关联算法(Degree Correlation)计算所有边上起点和终点度数之间Pearson关联系数,常用来表示图中高度数节点是否和高度数节点相连。 适用场景 度数关联算法(Degree Correlation)适用于衡量图的结构特性场景。

    来自:帮助中心

    查看更多 →

  • 应用场景

    自然语言处理适用于智能问答系统、文本分析、内容推荐、翻译等场景。 智能问答系统 通过中文分词、短文本相似、命名实体识别等相关技术计算两个问题对相似,可解决问答、对话、语料挖掘、知识库构建等问题。 文本分析 通过关键词提取、文本聚类、主题挖掘等算法模型,挖掘突发事件、公众话题导向,进行话题发现、趋势发现等。多维

    来自:帮助中心

    查看更多 →

  • 我的算法

    算法 操作步骤 登录行业视频管理服务后台。 选择“算法 > 我算法”。 在我算法页面,可以根据算法名称搜索算法,也可以单击“”,根据供应商和计费模式筛选查找算法。 父主题: 算法管理

    来自:帮助中心

    查看更多 →

  • 标签传播算法(label

    图,节点包括已标注和未标注数据,其边表示两个节点相似,节点标签按相似传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点相似越大,标签越容易传播。 URI POST /ges/v1.0/{project_id}/hyg/{graph_name}/algorithm

    来自:帮助中心

    查看更多 →

  • 自然语言处理基础版和领域版的区别

    自然语言处理基础 版和领域版区别 自然语言处理基础版接口和领域版接口基于不同算法实现,对相同文本,基础版和领域版结果有所差别。根据测试数据,领域版效果一般优于基础版。 自然语言处理基础版接口和领域版接口所支持计费模式也有所区别,详情请见计费说明。 表1 区分基础版和领域版接口 接口类型

    来自:帮助中心

    查看更多 →

  • 问答诊断

    、“闲聊结果”匹配结果。 图1 问答诊断 表1 问答诊断参数说明 参数名称 参数说明 分词结果 显示用户问分词结果,即分词后有效词语。 短语匹配 当用户问分词结果与知识库中语料问题或扩展问分词结果一致时,显示该问题具体信息。 说明: 只需与分词结果中词语一致,不区分词语顺序。请参见

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了