典型场景示例:使用智能分析助手搭建某商品销售数据的仪表板
应用场景
基于盘古大模型,DataArts Insight提供对话式数据智能分析,通过自然语言与数据交互进行数据分析、获取智能见解、构建仪表板等操作。智能分析助手不仅简化了数据分析的处理难度,也提升了自助图表分析的效率。
本文档以某类商品的销售数据为例,介绍使用智能分析助手开发仪表板的方法。
操作流程
数据说明
为保护用户的隐私和数据安全,所有数据均已进行了采样和脱敏。
本例使用某类商品销售数据为例,通过自助式分析商品销售情况,搭建仪表板。
本例共计三个数据表:
- 用户数据表:Idata_user_info
- 订单表:Idata_order_info
- 商品信息表:Idata_product_info
表名称 |
字段名称 |
字段类型 |
字段说明 |
---|---|---|---|
Idata_user_info |
user_id |
int |
用户ID |
age |
int |
年龄段 |
|
gender |
int |
性别 |
|
region |
string |
区域 |
|
education_status |
string |
教育程度 |
|
Idata_order_info |
sale_price |
int |
销售价格 |
profit |
int |
利润 |
|
pay_time |
int |
支付时间 |
|
create_time |
int |
订单创建时间 |
|
user_id |
int |
用户ID |
|
product_id |
int |
商品ID |
|
Idata_product_info |
product_id |
int |
商品ID |
product_name |
string |
商品名称 |
|
product_type |
string |
商品类型 |
|
product_color |
string |
商品颜色 |
|
product_price |
string |
商品价格 |
步骤1:新建项目
在DataArts Insight创建仪表板前,请新建项目空间,用于后续的数据管理。
步骤2:上传数据表
本例使用上传文件的方式将本地的测试数据上传至DataArts Insight项目空间。
由于数据表需上传到数据源下,本例预先创建RDS数据源用于上传文件。连接RDS数据源的操作步骤请参考接入MySQL数据源。
- 选择需要操作的项目,单击项目名称进入项目空间。
- 单击“数据管理 > 数据源”。选择待上传的数据表。本例选择已连接的RDS数据源。
- 单击数据源名称后的,单击“上传文件”。
- 本例共计三张数据表,详细的数据表信息请参考数据说明。
- 用户数据表:Idata_user_info。
- 订单表:Idata_order_info。
- 商品信息表:Idata_product_info。
步骤3:新建数据集
数据集作为数据源和可视化展示的中间环节,承接数据源的输入,并为可视化展示提供输入。本例基于导入的数据表创建数据集。
- 选择需要操作的项目,单击项目名称进入项目空间。
- 选择“数据管理 > 数据集 ”。
- 单击“新建数据集”,进入数据集编辑页面。
- 选择数据源后单击“”,上传文件。
- 双击数据表名称,并在操作面板中设置数据表的关联关系。
本例中分别设置Idata_user_info与Idata_order_info通过userid进行关联(左外连接);设置Idata_order_info与Idata_product_info通过productid关联(左外连接)。
图2 多表关联建模
- 单击“可视化配置”,设置字段名称的含义,便于后续的智能化分析中理解字段含义。
图3 可视化配置
- 依次单击“数据预览” 和“刷新预览”查看关联后的数据集数据的基本信息。
图4 数据预览
- 单击“保存”完成数据集的创建。
您可以按需设置字段名称、字段的聚合方式等信息,更多数据集字段设置的方法请参考多表关联建模。
步骤4:创建智能分析助手并训练数据
- 单击管理控制台左上角的,选择区域。
- 单击左下角的企业项目选择企业项目。
- 在控制台右侧选择对应的项目,进入项目页面。
- 单击“数据分析 > 智能分析助手”,进入智能分析助手页面。
- 单击“新建智能分析助手”,进入新建智能分析助手。
- 进入新建智能分析助手页面,输入名称,选择关联数据集。
- 单击“确定”完成智能分析助手创建。
- 选择新建的智能分析助手,单击“ 训练”,对智能分析助手进行训练。
步骤5:自助式问答生成报表
怎样获取智能见解?
在智能分析助手页面,根据问答自助生成图表。
单击“分析 > 智能见解生成”,模型自助分析您的业务数据并给出业务建议。
怎样查看已生成的图表的SQL语句?
在智能分析助手页面,根据问答自助生成图表,您可复用该图表的SQL语句分析数据。
怎样保存当前的图表至仪表板?
在智能分析助手页面,根据问答自助生成图表。且支持将该图表添加至仪表板。
根因分析
根因分析主要对度量或指标的波动进行分析,找出波动的原因,并及时采取措施改善业务。
- 使用限制:
- 图表横坐标必须是时间维度且时间维度值是有序的,时间维度取值不能少于2个,否则“根因分析”置灰。
- 图表的度量/指标聚合类型如果不是以下指标聚合类型和度量聚合类型,则“根因分析”置灰。
- 指标聚合类型
- 第一类:SUM(M)、COUNT(M)、SUM(M1)+SUM(M2)、SUM(M1)-SUM(M2)、SUM(M)x常数、SUM(M)÷常数。
- 第二类:SUM(M1)÷SUM(M2)、AVG(M)、AVG(M1)÷AVG(M2)。
- 度量聚合类型:SUM(M)、COUNT(M)。
- 指标聚合类型
- 分析维度最多选择5个。
- 原因分析步骤:
- 单击图表左下方“分析 > 根因分析”,弹出根因分析页面。
- 填写相关参数。
表2 根因分析参数说明 参数
说明
度量选择
数据表中度量和指标的聚合类型是以下聚合类型。
- 指标聚合类型
- 第一类:SUM(M)、COUNT(M)、SUM(M1)+SUM(M2)、SUM(M1)-SUM(M2)、SUM(M)x常数、SUM(M)÷常数。
- 第二类:SUM(M1)÷SUM(M2)、AVG(M)、AVG(M1)÷AVG(M2)。
- 度量聚合类型:SUM(M)、COUNT(M)。
算法类型
当前支持的算法类型“波动原因分析”。
分析维度
从数据集的所有维度(图表上的时间维度以及过滤条件所涉及维度除外)中选择一个或多个维度作为分析维度,当前限定最多选择5个分析维度。
对比范围
指图表上的两个时间维度值,用于指定指标波动的分析范围。
- 指标聚合类型
- 设置好参数后,单击“确定”,生成根因分析。
- 示例:某专卖店2020年到2022年的产品销售价格总和对比。
自动见解
自动见解支持从单张图表数据和单点/多点数据的分析粒度下生成的见解。自动见解从单张图表出发,基于图表数据或图表关联的数据集中的数据进行分析,寻找图表数据模式的特征,进一步探索深层次的问题和归因。同时能够帮助用户构建、浏览和分析数据,提供给用户一种交互式自由探索方式,能够有效帮助用户减少分析数据的代价。
- 使用限制:
- 图表最少有一个维度和度量。
- 不支持衍生指标。
- 图表中的维度大于3不做处理。
- 自动见解使用示例:
- 在数据集的可视化配置界面设置“product_name”字段优先级为“高”级,在自动见解结论中优先以高优先级字段分析。
- 单击页面右上角的“保存”按钮,保存修改信息。
- 进入智能问答界面问答:2021年销售产品类型占比。
图15 2021年销售产品类型占比
- 单击图表右上角的自动见解。
图16 自动见解问题见解
问题澄清
问题澄清是将存在歧义或者智能分析助手解析不了的问题进行一个澄清,对问题进行更明确的分析。
- 使用限制:输入问题存在歧义。
- 问题澄清使用示例:一份有关信用卡的数据。
- 在问答界面输入问题框输入问题:北京分行销售额。
图17 北京分行销售额
- 单击“问题澄清”,弹出问题澄清页面,页面展示可选结果。
图18 问题澄清
- 选择“一级行=北京”,单击“确定”,问答界面出现一级分行的数据。
图19 北京一级分行
- 在问答界面输入问题框输入问题:北京分行销售额。