更新时间:2022-05-07 GMT+08:00
分享

工作流介绍

工作流介绍

  • 功能介绍

    支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。

  • 适用场景

    智能问答、舆情分析、内容推荐等场景。

  • 优势
    • 针对场景领域提供预训练模型,分类准确率高。
    • 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。
    • 可根据使用过程中的反馈持续优化模型。

工作流流程

“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>通用文本分类工作流”新建应用,详细操作请见新建应用。您可以开发文本分类应用,通过训练文本分类预测模型,实现文本分类功能。

图1 文本分类流程
表1 文本分类流程说明

流程

说明

详细指导

准备数据

在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。

准备数据

选择数据

在使用通用文本分类工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。

选择数据

标注数据(可选)

由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。

标注数据

训练模型

选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。

训练模型

评估模型

训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。

一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。

评估模型

部署服务

模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。

部署服务

相关文档