更新时间:2023-10-18 GMT+08:00
分享

工作流介绍

工作流介绍

  • 功能介绍

    支持自主上传多语种文本数据,构建高精度文本分类预测模型,此工作流支持文本分类的语种包括英语、法语、德语、西班牙语、葡萄牙语、阿拉伯语,支持单标签分类和多标签分类。

  • 适用场景

    智能问答、舆情分析、内容推荐等场景。

  • 优势
    • 针对场景领域提供预训练模型,分类准确率高。
    • 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。
    • 可根据使用过程中的反馈持续优化模型。

工作流流程

“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>多语种文本分类工作流”新建应用,详细操作请见新建应用。您可以开发多语种的文本分类应用,通过训练其他语种的文本分类预测模型,实现文本分类功能。

图1 多语种文本分类流程
表1 文本分类流程说明

流程

说明

详细指导

准备数据

在使用多语种文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。

准备数据

选择数据

在使用多语种工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。

选择数据

训练模型

选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。

训练模型

评估模型

训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。

一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。

评估模型

部署服务

模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。

部署服务

相关文档