Hive 实战:NULL 的隐身术陷阱

  • 2025-06-08 01:56:32
  • dfer
  • 27
作为 Hive 资深开发者,我们常常在复杂的数据计算中游刃有余,但 NULL 值在不等式比较(!= 或 <>)中的行为,却是一个极易踩坑、导致数据偏差的经典陷阱。理解这一点,是写出健壮、准确 Hive SQL 代码的关键基础。 1. NULL 的本质 NULL 的本质:NULL 不是值,而...

Hive分区表新增字段后重跑历史数据,新增字段值为Null的问题

  • 2025-06-05 01:51:55
  • dfer
  • 29
近期开发中因为上游系统需要将历史全量数据增加字段,Hive分区表新增字段后重跑历史数据后遇到新增字段值为Null的问题 Hive分区表新增字段后重跑历史数据,新增字段值为Null的问题 alter table my_table add columns(new_column string) ; ...

Hive null safe的用法

  • 2025-04-15 01:57:10
  • dfer
  • 55
总结: null safe 是用<=> 代表比较,而不是用 =。null <=> null 返回 true, 而 null = null 代表 false。 NULL 和任意字符比较都返回 NULL,而不是 true 或者 false。如 SELECT 1 = 1, NULL = NULL, 1 ...