数据集
平台提供的SDK能力,用户可以通过如下两种方式获取解释:
- 通过新增代码框,输入“?参数名称”的形式,运行代码框,查看释义。
- 通过界面右上角“帮助中心”中的“SDK文档”,查看SDK文档中释义。
加载数据
用户在执行特征操作前,需要先选择数据。
可以任选下述一种方式选择数据:
- 在编辑界面,单击“Import sdk”下方的“加载数据”。
- 在JupyterLab环境编辑界面右上角,单击图标,选择“数据处理 > 数据集 > 加载数据”。
选择数据操作步骤如下。
- 单击“Import sdk”代码框左侧的图标,运行“Import sdk”内容。
“Import sdk”必须放在所有操作的最前面执行,否则执行“加载数据”会报错。
- 单击“Import sdk”左下方的“加载数据”。
代码框右侧的参数说明,如表1所示。同时支持单击当前算子右侧的图标,新增需要绑定的多个数据集实例。
- 单击图标,运行“加载数据”代码框内容。
数据集实例绑定成功。
生成数据实例
在JupyterLab环境编辑界面,完成所有特征操作后,需要将特征操作流应用于加载的全量数据,并生成经过特征处理后的新数据。
操作步骤如下所示。
修改元数据
单独抽取数据的时序配置信息为算子,即“修改元数据”。
操作步骤如下所示。
- 单击界面右上角的图标,选择“数据处理 > 数据集 > 修改元数据”。
在编辑界面,新增“ 修改元数据”内容,对应的参数说明如表3所示。
- 单击图标,运行“修改元数据”代码框内容。
创建数据操作流
如果对多份数据同时进行特征处理,必须为每份数据指定“操作流变量名”,防止数据处理时,处理的数据不对。如果仅处理一份数据,无需设置此参数。
操作步骤如下所示。
- 单击界面右上角的图标,选择“数据处理 > 数据集 > 创建数据操作流”。
在编辑界面,新增“ 创建数据操作流”内容,对应的参数说明如表4所示。
- 单击图标,运行“创建数据操作流”代码框内容。“操作流变量名”配置完成。