之前才接触airflow的时候遇到这个问题,但是解决了没有记录,今天又遇到了想起来就记录下
就拿这个图举例,这是个典型的分支路最后汇合执行的task,用代码演示就是这种情况,有两条路可以执行,最后又回归同一个task。
我的dag 顺序逻辑定义是这样的:
....
if xxxxx :
....
else :
....
.....
我截图里面是我理想状态下,走任意一条路,之后最后retrain_model_by_model_info都会执行,但是这个问题就是遇到它执行,不管走的哪条路都不执行。
其实问题的关键就是TriggerRule,TriggerRule默认是ALL_SUCCESS,也就是与门,我们想要的是或门,就是只有当所有上游任务都没有失败时,当前任务才会被触发(即上游任务要么成功要么被跳过)。就是NONE_FAILED
关于TriggerRule其他的类型可以参考我这篇blog:Airflow 中的trigger_rule-CSDN博客
所以定义Operator的时候就加上这个TriggerRule就可以了
retrain_model_by_model_info = PythonOperator(
task_id='retrain_model_by_model_info',
provide_context=True,
python_callable=retrain_model_by_model_info,
trigger_rule=TriggerRule.NONE_FAILED,
dag=dag,
)