处理器有很多类这里主要分了,数据转换的可以看到上面的这些是数据转换常用的
然后:
这里这个controlrate,用来控制流的速率,来保护作用,防止崩掉
distributeLoad用来负载均衡,减轻压力
这里的路由是,根据是否满足对应的条件,来执行是否把数据路由到某个地方.
然后来看数据库访问处理器包含的一些处理器
这里注意putsql主要是,将flowfile中定义的sql,来更新关系型数据库.
而这个puthiveql,主要是用来更新hive数据库.
属性提取主要是从数据中提取有用数据,然后生成一个内容,放到attribute,或者是flowfile的内容中去.
这里要注意executeprocess可以做为源头处理器,也就是说,他可以单个