数据集详情介绍
单击某个数据集的名称,可以查看数据集详情,页面展示如下。
- 页面上方:在图片中展示数据集的名称,该数据集的联系人和邮箱,以及浏览、订阅和下载量。
- 页面中下方:
数据信息
数据集的数据信息包含标签、描述信息、数据浏览器和关联数据集。
- 标签:在标签管理中,每个用户只能管理自己设定的标签。
- 新增标签:在“标签”右侧,单击,输入新增标签名称,单击“添加”。
- 删除标签:在“标签”右侧,单击,在需要删除的标签名称右侧单击“×”。
- 描述信息:了解数据集的来源、数据类型、样本量等信息。
在“描述信息”区域,单击“样本量”下面的,可以刷新该数据集的样本量。
对发布时分析失败的数据集,或者已经发布的数据集,可以手工方式进行样本量刷新。
刷新完成后样本量会呈现,如果样本量任务执行失败,则会再次显示。
- 数据浏览器
对于非结构化数据,单击某个文件,会展示出该文件的详细内容。
当数据集为结构化的数据时,才会显示数据字典、数据样例和数据分析。为已发布的数据集(一键式发布)追加文件:如果追加的文件结构与数据集中数据的结构完全一致,在下载的时候会对文件进行合并,否则追加的文件会存储到OBS对应的桶中,供用户下载使用。
- 关联数据集
- 只有具有“Data Operation Engineer”角色的用户,可以刷新本租户下数据集的样本量、刷新本租户下数据集的时域范围、刷新本租户下数据集的数据样例、启动本租户下数据集的数据分析任务以及为已发布的数据集追加文件。
- 如果已有成功执行的数据分析任务结果,再次启动执行后,成功前不会清理原任务结果。
- 重启服务会清理RUNNING中或者INIT状态下的数据分析任务,以解决坏死的数据分析任务(指在运行过程中遭遇宕机等异常形成的一直在运行中的任务)。