新建Excel数据集
如果用户需要的数据表不在数据库中,或不想通过连接数据库的方式新建数据集,可通过“Excel数据集”导入数据。
前提条件
具备新建Excel数据集的菜单权限,具体请参考角色管理。
新建Excel数据集
- 进入问答AI服务页面。
- 选择 。
- 选中目标文件夹,单击
。
您也可以将鼠标移至目标文件夹,单击“+”,选择“Excel数据集”。
- 单击“上传数据”或者拖拽文件到上传区域。
上传数据表过多时,会增加解析耗时,请耐心等待。也可单次只上传一张表。
- 支持csv/xlsx格式,10M以上建议用csv格式,最大支持100M。
- 单次上传Excel文件不要超过5个,每个Excel文件中Sheet页不要超过5个。
- Sheet页第一行数据作为表头,不支持合并单元格表头。表头可以是英文,也可以是中文。建议使用英文,且英文命名尽量贴近字段原始含义。英文命名的准确性会影响问答AI服务的效果。
- Sheet页第二行开始作为数据,不支持合并单元格数据。
- 表中的数值不要使用千位分隔符,不支持解析千位分隔符。
- 数据解析时会丢弃不满足条件的数据。
字段信息设置
完善字段中文名、字段类型、字段说明、字段样例、同义词、是否在分析中隐藏,也可以多字段展示的先后顺序进行调整。
- 在文件夹中选择Excel数据集。
- 选择“字段信息设置”页签,单击“批量编辑字段”。
- 在弹窗中可以设置字段信息,支持如表1所示的操作。
表1 字段信息参数说明 参数
说明
在分析中隐藏
把不关心的字段在分析中隐藏掉,即勾选的字段无法在问答AI服务中进行分析。
操作
置顶:设置当前字段的序号为1。
置底:设置当前字段的序号为最后一个数值。
上移、下移:设置当前字段的序号向上或向下移动一个数值。
- 单击“确定”。
表信息设置
完善表名称、表中文名、表描述、业务域、业务标签、行业分类、提示词信息。
- 在文件夹中选择数据库表。
- 选择“表信息设置”页签,参考表2设置表信息。
表2 字段信息参数说明 参数
说明
表中文名
输入表的中文名称。
表描述
输入表的描述信息,例如,描述该表是在哪个业务部门使用。
业务域
输入表的业务域。
业务标签
添加表的业务标签。
行业分类
对表进行行业分类。
提示词
用来告诉大模型需要注意的内容,如一些示例或者行业特有计算口径等信息。
- 单击“确定”。