文档首页/ MapReduce服务 MRS/ 组件操作指南(LTS版)/ 使用Spark/Spark2x/ Spark故障排除/ 通过Spark-sql创建Hudi表或者Hive表,未插入数据前,查询表统计信息为空
更新时间:2024-07-24 GMT+08:00

通过Spark-sql创建Hudi表或者Hive表,未插入数据前,查询表统计信息为空

问题

通过spark-sql创建Hudi表或者Hive表,未插入数据之前,查询表统计信息都为空。

回答

可以通过以下两种方式生成:

  1. 手动通过analyze命令,触发统计信息收集。如果没有插入数据,analyze命令执行完之后,再通过desc formatted table_name命令查询totalsize等于0。
  2. 配置spark.sql.statistics.size.autoUpdate.enabled=true,再插入数据,后台会触发统计信息收集。