管理数据库
LakeFormation的一个Catalog下可以创建多个数据库,通过集中式的元数据管理,可以有效提升数据资产价值。
前提条件
- 已创建LakeFormation实例,且实例处于正常运行状态。
- 已创建待添加数据库的Catalog。
- 已参考创建元数据存储路径提前创建了用于存储数据库的OBS并行文件系统。
管理数据库
- 登录管理控制台。
- 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
- 在左侧下拉框中选择待操作的LakeFormation实例,在左侧导航栏选择“元数据 > 数据库”。
- 在右上角“Catalog”后的下拉框中选择待创建数据库所属的Catalog名称。可以查看当前Catalog中包含的数据库。
- 单击“创建数据库”,配置相关参数。
- 在“基本信息”区域配置以下信息。
表1 创建数据库 参数
参数说明
库名称
填写待创建数据库名称。
只能包含中文、字母、数字、下划线,长度为1~128个字符。
所属Catalog
待创建数据库所属Catalog。
选择位置
数据库信息存储在OBS并行文件系统中的位置。
单击“”,选择位置后,单击“确定”。
- 所选位置只能以“obs://”开头,且必须包含一个存储对象,例如选择“obs://lakeformation-test/catalog1/database1”。如果没有合适的并行文件系统,可以单击“前往OBS创建”进行创建。
- 必须与所属的Catalog存储路径(即创建Catalog时配置的“选择位置”参数)不同。
- 如果所属Catalog配置了“数据库存储位置”参数,则此处该参数必须选择为所属Catalog“选择位置”的子路径、或“数据库存储位置”的子路径。
描述
所创建数据库的描述信息。
长度为0~4000字节,1个中文字符对应3个字节。
- (可选)单击“数据表存储位置”区域中的“添加数据表存储位置”。单击“”按照需求手动选择数据表存储位置,单击“确定”。支持添加多条。
- “数据表存储位置”为可选参数。
- “数据表存储位置”可选择为所属Catalog路径及其子路径、或“数据库存储位置”路径及其子路径。
- 如果配置了该参数,则该数据库下的数据表位置必须是该数据库“数据表存储位置”的子路径、或数据库“选择位置”的子路径。
- (可选)单击“函数存储位置”区域中的“添加函数存储位置”。单击“”按照需求手动选择函数存储位置,单击“确定”。支持添加多条。
- “函数存储位置”为可选参数。
- “函数存储位置”可选择为所属Catalog路径及其子路径、或“数据库存储位置”路径及其子路径。
- 如果配置了该参数,则该数据库下的函数位置必须选择为该数据库“函数存储位置”或数据库“选择位置”的子路径。
- 单击“提交”。
- 在“基本信息”区域配置以下信息。
- 创建完成后,即可在“数据库”页面查看库名称/ID、所属Catalog、数据库拥有者、存储位置等信息。
单击“操作”列的“编辑”可以修改数据库配置信息。
单击“操作”列的“数据表”,可以查看当前数据库下的数据表信息。
在“更多”中可以为当前数据库进行授权、查看权限等操作。
- 如果需要删除数据库,可以选择“更多 > 删除”,确认操作影响,并根据界面提示确认是否删除其他数据后,单击“确定”。
- 同时删除数据库下的表:如果当前数据库下存在未删除的数据表或函数,则必须勾选此选项,否则会报错。删除后的数据无法恢复,请谨慎操作!
- 同时删除存储在OBS的数据:可选配置,删除后数据将会放入回收站目录下,可以在过期删除前恢复。
删除元数据时如果同步删除文件,数据将移入对应OBS桶的回收站(“lake-formation-trash-dir/table_id”OBS路径)目录下。