更新时间:2025-08-13 GMT+08:00
通过Spark-sql创建Hudi表或者Hive表,未插入数据前查询表统计信息为空
问题现象
通过spark-sql创建Hudi表或者Hive表,未插入数据之前,查询表统计信息都为空。
处理步骤
可以通过以下两种方式生成:
- 手动通过analyze命令,触发统计信息收集。如果没有插入数据,analyze命令执行完之后,再通过desc formatted table_name命令查询totalsize等于0。
- 配置spark.sql.statistics.size.autoUpdate.enabled=true,再插入数据,后台会触发统计信息收集。
父主题: 使用Spark