支持hive spark flink
美国公司开发的~
都在使用,这些企业都在用
支持hadoop的,更新,插入,删除 和数据增量处理
支持流式数据处理.
hive是离线数仓
hive不支持事物 insert overwrite 底层后来通过这种方式支持了事物
insert overwrite处理数据很低效,因为更新是基于覆盖实现的
.parquet .avro这两种数据格式,
这个支持流处理,也支持批处理~
可以实时获取流数据,提供了事物...都是解决大数据处理的痛点的.
然后会把一个个小文件进行合并,这里也称为压缩~
hudi可以把很多大数据框架集合起来,做更好的处理