然后我们来看nifi的处理器,可以看到左上角是用来添加处理器的,
拖过来就能添加
拖过来以后,会显示一个弹框,里面会显示各种处理器,有293个..常用的都够了
可以在右边搜索以后添加
看一下常用的处理器
puthiveql:把数据写入到hive中去.
上面这3个是经常一块用的
这个publishkafka可以把数据直接推送到kafka topic中去
selecthiviesql:查询hive的数据
putsql支持很多关系型数据库,插入数据,更新数据用的
GetFile是将某个目录中的文件读取,然后转换为flowfiles
gethdfs,是从hadoop中读取文件,读取文件成flowfile文件