然后我们来看如何把mysql数据实时同步到hive中去
可以看到,其实就是使用
CaptureChangeMySql来获取mysql中变化的数据,具体就是增删改数据
然后再用RouteOnAttribute通过属性,也就是根据是增删改的话,根据这个属性进行路由
把数据路由到不同的位置
然后再用EvaluateJsonPath这个处理器,利用jsonpath表达式,将json中的属性数据提取出来,然后
再用ReplaceText处理器,将对应的属性数据进行替换,然后把替换后的hive的sql语句进行
把数据插入到hive中去就可以了.
首先我们去创建一个hive表,有id name day_time字段
这里是因为nifi,现在已经是支持2版本的hive了,因为我们的hive是1版本的所以要替换一下jar包.
要不然会提示有些类不存在.
然后我们来看一下用到的处理器首先
CaptureChangeMySql