更新时间:2024-11-21 GMT+08:00
规划数据湖
MRS对接LakeFormation仅支持对接LakeFormation实例的数据目录名称为“hive”的Catalog,名称为“default”的数据库。
LakeFormation实例创建成功后,用户可按照业务规划创建相关Catalog及内部的数据库、表等元数据。
例如参考以下步骤,创建Catalog名称为“hive”(固定名称,不可自定义),并为该Catalog创建数据库“default”(固定名称,不可自定义),数据库内包含两个数据表“table_A”、“table_B”,并进行授权。
创建存储元数据的OBS路径
- 登录管理控制台。
- 在页面左上角单击,选择“存储 > 对象存储服务”,进入对象存储服务页面。
- 选择“并行文件系统 > 创建并行文件系统”,进入创建页面,配置相关参数后单击“立即创建”。
- 文件系统名称:根据界面要求设置并行文件系统名称,例如“lakeformation-test”。
- 其他参数根据实际情况选择。
- 在并行文件系统页面,单击已创建的文件系统名称,例如“lakeformation-test”。
- 在左侧导航栏选择“文件”,单击“新建文件夹”,填写待创建的文件夹名称,单击“确定”。继续单击该文件夹名称,单击“新建文件夹”,可以创建其子文件夹。
参考该步骤,依次创建用于存放元数据的路径,例如:
- Catalog存储路径:lakeformation-test/catalog1
- 数据库存储路径:lakeformation-test/catalog1/database1
- 数据表存储路径:lakeformation-test/catalog1/database1/table1、lakeformation-test/catalog1/database1/table2
- 函数存储路径:lakeformation-test/catalog1/database1/udf1
创建Catalog
- 登录管理控制台。
- 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
- 在左侧下拉框中选择创建LakeFormation实例及客户端连接已创建的LakeFormation实例(例如lakeformation-test),在左侧导航栏选择“元数据 > Catalog”。
如果当前实例已包含名称为“hive”的Catalog,则跳过Catalog的创建操作。
- 单击“创建Catalog”,配置以下参数后,单击“提交”。
- 创建完成后,即可在“Catalog”页面查看相关信息。
创建数据库
- 登录管理控制台。
- 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
- 在左侧下拉框中选择创建LakeFormation实例及客户端连接已创建的LakeFormation实例(例如lakeformation-test),在左侧导航栏选择“元数据 > 数据库”。
- 在右上角“Catalog”后的下拉框中选择“hive”。
如果当前已包含名称为“default”的数据库,则跳过数据库的创建操作。
- 单击“创建数据库”,配置相关参数后,单击“提交”。
- 创建完成后,即可在“数据库”页面查看详细信息。
创建数据表
- 登录管理控制台。
- 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
- 在左侧下拉框中选择创建LakeFormation实例及客户端连接已创建的LakeFormation实例(例如lakeformation-test),选择“元数据 > 表”,在右上角“Catalog”和“数据库”后的下拉框中分别选择“hive”、“default”。
- 单击“创建表”,配置相关参数后,单击“提交”。
- 表名称:自定义,例如“table_A”。
- 数据存储位置:单击“”,选择表存储在OBS并行文件系统中的位置,例如选择“obs://lakeformation-test/catalog1/database1/table1”,单击“确定”。
- 其他参数请根据实际需要进行配置。
- 参考4创建名称为“table_B”的数据表,存储路径为“lakeformation-test/catalog1/database1/table2”。
- 创建完成后,即可在数据表页面查看相关信息。
为元数据授权
- 登录管理控制台。
- 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
- 在左侧下拉框中选择待操作的LakeFormation实例,选择“数据权限 > 数据授权”。
- 单击“授权”,根据实际需要对hive数据目录、default数据库等进行授权,单击“确定”。
更多授权详细配置及要求请参考新增授权章节。