更新时间:2024-10-24 GMT+08:00
分享

在JupyterLab中使用TensorBoard可视化作业

ModelArts支持在开发环境中开启TensorBoard可视化工具。TensorBoard是TensorFlow的可视化工具包,提供机器学习实验所需的可视化功能和工具。

TensorBoard是一个可视化工具,能够有效地展示TensorFlow在运行过程中的计算图、各种指标随着时间的变化趋势以及训练中使用到的数据信息。TensorBoard相关概念请参考TensorBoard官网

TensorBoard可视化训练作业,当前仅支持基于TensorFlow、PyTorch版本镜像,CPU/GPU规格的资源类型。请根据实际局点支持的镜像和资源规格选择使用。

前提条件

为了保证训练结果中输出Summary文件,在编写训练脚本时,您需要在脚本中添加收集Summary相关代码。

TensorFlow引擎的训练脚本中添加Summary代码,具体方式请参见TensorFlow官方网站

注意事项

  • 运行中的可视化作业不单独计费,当停止Notebook实例时,计费停止。
  • Summary文件数据如果存放在OBS中,由OBS单独收费。任务完成后请及时停止Notebook实例,清理OBS数据,避免产生不必要的费用。

Step1 创建开发环境并在线打开

在ModelArts控制台,进入开发空间 > Notebook页面,创建TensorFlow或者PyTorch镜像的开发环境实例。创建成功后,单击开发环境实例操作栏右侧的打开,在线打开运行中的开发环境。

TensorBoard可视化训练作业,当前仅支持基于TensorFlow、PyTorch镜像,CPU/GPU规格的资源类型。请根据实际局点支持的镜像和资源规格选择使用。

Step2 上传Summary数据

在开发环境中使用TensorBoard可视化功能,需要用到Summary数据。

Summary数据可以直接传到开发环境的这个路径下/home/ma-user/work/,也可以放到OBS并行文件系统中。

  • Summary数据上传到Notebook路径/home/ma-user/work/下的方式,请参见上传本地文件至JupyterLab
  • Summary数据如果是通过OBS并行文件系统挂载到Notebook中,请将模型训练时产生的Summary文件先上传到OBS并行文件系统,并确保OBS并行文件系统与ModelArts在同一区域。在Notebook中启动TensorBoard时,Notebook会自动从挂载的OBS并行文件系统目录中读取Summary数据。

Step3 启动TensorBoard

在开发环境的JupyterLab中打开TensorBoard。

图1 JupyterLab中打开TensorBoard
  1. 在JupyterLab左侧导航创建名为“summary”的文件夹,将数据上传到“/home/ma-user/work/summary”路径。注:文件夹命名只能为summary否则无法使用。
  2. 进入“summary”文件夹,单击方式1,直接进入TensorBoard可视化界面。如图2所示。
    图2 TensorBoard界面(1)

Step4 查看训练看板中的可视化数据

训练看板是TensorBoard的可视化组件的重要组成部分,而训练看板的标签包含:标量可视化、图像可视化和计算图可视化等。

更多功能介绍请参见TensorBoard官网资料

关闭TensorBoard

关闭TensorBoard方式如下:

单击下图所示的,进入TensorBoard实例管理界面,该界面记录了所有启动的TensorBoard实例,单击对应实例后面的SHUT DOWN即可停止该实例。
图3 单击SHUT DOWN停该实例

相关文档