更新时间:2024-08-27 GMT+08:00
分享

管理数据库

LakeFormation的一个Catalog下可以创建多个数据库,通过集中式的元数据管理,可以有效提升数据资产价值。

前提条件

  • 已创建LakeFormation实例,且实例处于正常运行状态。
  • 已创建待添加数据库的Catalog。
  • 已参考创建元数据存储路径提前创建了用于存储数据库的OBS并行文件系统。

管理数据库

  1. 登录管理控制台。
  2. 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
  3. 在左侧下拉框中选择待操作的LakeFormation实例,在左侧导航栏选择“元数据 > 数据库”。
  4. 在右上角“Catalog”后的下拉框中选择待创建数据库所属的Catalog名称。可以查看当前Catalog中包含的数据库。
  5. 单击“创建数据库”,配置相关参数。

    1. 在“基本信息”区域配置以下信息。
      表1 创建数据库

      参数

      参数说明

      库名称

      填写待创建数据库名称。

      只能包含中文、字母、数字、下划线,长度为1~128个字符。

      所属Catalog

      待创建数据库所属Catalog。

      选择位置

      数据库信息存储在OBS并行文件系统中的位置。

      单击“”,选择位置后,单击“确定”。

      • 所选位置只能以“obs://”开头,且必须包含一个存储对象,例如选择“obs://lakeformation-test/catalog1/database1”。如果没有合适的并行文件系统,可以单击“前往OBS创建”进行创建。
      • 必须与所属的Catalog存储路径(即创建Catalog时配置的“选择位置”参数)不同。
      • 如果所属Catalog配置了“数据库存储位置”参数,则此处该参数必须选择为所属Catalog“选择位置”的子路径、或“数据库存储位置”的子路径。

      描述

      所创建数据库的描述信息。

      长度为0~4000字节,1个中文字符对应3个字节。

    2. (可选)单击“数据表存储位置”区域中的“添加数据表存储位置”。单击“”按照需求手动选择数据表存储位置,单击“确定”。支持添加多条。
      • “数据表存储位置”为可选参数。
      • “数据表存储位置”可选择为所属Catalog路径及其子路径、或“数据库存储位置”路径及其子路径。
      • 如果配置了该参数,则该数据库下的数据表位置必须是该数据库“数据表存储位置”的子路径、或数据库“选择位置”的子路径。
    3. (可选)单击“函数存储位置”区域中的“添加函数存储位置”。单击“”按照需求手动选择函数存储位置,单击“确定”。支持添加多条。
      • “函数存储位置”为可选参数。
      • “函数存储位置”可选择为所属Catalog路径及其子路径、或“数据库存储位置”路径及其子路径。
      • 如果配置了该参数,则该数据库下的函数位置必须选择为该数据库“函数存储位置”或数据库“选择位置”的子路径。
    4. 单击“提交”。

  6. 创建完成后,即可在“数据库”页面查看库名称/ID、所属Catalog、数据库拥有者、存储位置等信息。

    单击“操作”列的“编辑”可以修改数据库配置信息。

    单击“操作”列的“数据表”,可以查看当前数据库下的数据表信息。

    在“更多”中可以为当前数据库进行授权、查看权限等操作。

  7. 如果需要删除数据库,可以选择“更多 > 删除”,确认操作影响,并根据界面提示确认是否删除其他数据后,单击“确定”。

    • 同时删除数据库下的表:如果当前数据库下存在未删除的数据表或函数,则必须勾选此选项,否则会报错。删除后的数据无法恢复,请谨慎操作!
    • 同时删除存储在OBS的数据:可选配置,删除后数据将会放入回收站目录下,可以在过期删除前恢复。

    删除元数据时如果同步删除文件,数据将移入对应OBS桶的回收站(“lake-formation-trash-dir/table_id”OBS路径)目录下。

相关文档