背景 存储情况 当前的存储引擎可谓百花齐放,层出不穷。为什么会这样了?因为不存在One for all的存储,不同的存储总有不同的存储的优劣和适用场景。因此,在实际的业务场景中,不同特点的数据会存储到不同的存储引擎里。 业务挑战 然而异构的存储和数据源,却给分析查询带来了挑战,比如跨源查询,以及跨集群查询该怎么做了? 异构数据关联分析 异构的数据需要关联分析时,按照常规的流程,需要对其进行处理放到同一个存储中,然后再进行关联分析,如下所示: 按照上面的处理方式,流程会很冗长,对于业务人员而言成本太高,此外需要额外的存储,也浪费资源。如果能够基于异构数据源直接联邦