airflow看不到任务日志解决方案

news2024/9/20 1:10:37

1. 基础信息

airflow 版本:2.5.3

2. 问题现象

airflow web-server 界面,看到某些任务的具体运行日志,只有少量日志,如下图所示:

image-20240830180654826

具体日志内容如下:

na-fudao-data-airflow-test-2-21.alibji.zybang.com
*** Log file does not exist: /data/homework/workflow/airflow/logs/dag_id=warehouse_bzr_dws_run_1min/run_id=scheduled__2024-08-30T09:52:00+00:00/task_id=dws_trade_order_bzr.middle_expand/attempt=1.log
*** Fetching from: http://na-fudao-data-airflow-test-2-21.alibji.zybang.com:8793/log/dag_id=warehouse_bzr_dws_run_1min/run_id=scheduled__2024-08-30T09:52:00+00:00/task_id=dws_trade_order_bzr.middle_expand/attempt=1.log
*** Failed to fetch log file from worker. [Errno 111] Connection refused

日志内容解释:

  1. 第一行:表示该任务被分配到哪个 worker 节点上运行了,显示的是节点的主机名称 hostname
  2. 第二行:表示从 web-server 机器上查找本地日志文件,然后找不到。这是正常的,一般来说,如果是搭建的集群形式的 airflow,web-server 和 worker 是分节点部署的,web-server 节点上没有 worker 运行,所以 web-server 节点上是没有本地日志文件的。
  3. 第三行:表示通过访问 http 的方式,从 worker 节点上拉取日志,后面是具体的访问地址。注意域名后面的端口号 8793,这个端口号是 worker 节点上提供给 web-server 进程,用于远程拉取日志文件使用的。
  4. 第四行:表示 web-server 通过 http 方式,从 worker 节点上获取日志文件失败了,原因是连接被拒绝。

3. 问题分析

日志内容解释中第 4 点提到,web-server 通过 http 方式,从 worker 节点上获取日志,连接被拒绝。然后我们可以登录日志中提到的节点上,查看对应的端口号是否有进程在运行。使用 root 用户登录对应节点,然后运行下面的命令(使用搭建 airflow 的用户也可以):

netstat -aptn | grep 8793

然后发现没有任何信息输出,说明该节点上对应的端口号的用于提供元策划给你日志访问的服务进程不存在。

image-20240830180536032

4. 解决方案

问题分析中已经提到了,在对应的 worker 节点上,发现 8793 这个端口,并没有对应的服务在运行,因此我们只需要把这个服务启动即可。

不过 airflow 并没有单独的这个服务的进程启动方式,它是 worker 服务中的一部分,所以我们只需要重启一下 worker 服务即可,重启命令可参考下面的命令代码:

/data/homework/anaconda3/envs/airflow/bin/airflow celery worker --daemon --pid /data/homework/workflow/airflow/process/worker/airflow-worker.pid --stdout /data/homework/workflow/airflow/process/worker/airflow-worker.out --stderr /data/homework/workflow/airflow/process/worker/airflow-worker.err --log-file /data/homework/workflow/airflow/process/worker/airflow-worker.log

注意前面的路径,这是你当初搭建 airflow 时,启动的 python 虚拟环境地址。

启动之后,再次观察该机器上 8793 端口的服务情况,运行如下命令:

netstat -aptn | grep 8793

发现输出如下:

image-20240830193835539

表示该节点上的 8793 端口有对应的服务在运行。

再次观察 airflow 界面任务日志,发现正常输出了

image-20240830193936379

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2092231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

某视频云平台存在未授权窃取用户凭据漏洞

我和你一样,历经破碎、痛苦的生活,却未垮掉,每一日都从承受的苦难中,再一次将额头浸入光明 漏洞详情: 某视频云平台存在未授权访问漏洞,攻击者可以直接访问平台的API接口文档,从而获取系统的A…

【大模型】Reflextion解读

前言:一种大模型强化学习技术,将传统的梯度更新时的参数信号替换成上下文的语言总结,过程和人类反思相似。区别与RLHF,Reflextion是agent自我反思,RLHF是人类反馈。 目录 1. 基础知识1.1 强化学习1.2 大模型Agent 2. 创…

Upload-LABS通关攻略【1-20关】

Pass-01 第一关是前端JS绕过 上传一个php文件显示只能上传特定后缀名的文件 这里将1.php改为1.jpg直接进行抓包,在数据包中将jpg改为php放行 文件上传成功,邮件图片新建页面打开 可以访问到1.php文件,则一句话密码上传成功 使用蚁剑 进行连接…

探秘DevSecOps黄金管道,安全与效率的完美融合

软件应用的安全性已成为企业和用户关注的焦点,DevSecOps作为一种将安全融入开发和运维全过程的理念和实践,旨在消除传统开发模式中安全被后置处理的弊端。DevSecOps黄金管道(Golden Pipeline)是实现这一理念的核心框架&#xff0c…

蜂鸣器奏乐

一、粗略了解简谱 拍号:如图,“2”表示一个小节有2拍,“4”表示4分音符为一拍 终止线表示歌曲结束 注意:以下音符都按以四分音符为一拍计算拍数 四分音符: 唱一拍 二分音符: 某一个音右边有一个小横线&…

OpenAI GPT3 Search API not working locally

题意:"OpenAI GPT-3 搜索 API 在本地无法工作" 问题背景: I am using the python client for GPT 3 search model on my own Jsonlines files. When I run the code on Google Colab Notebook for test purposes, it works fine and returns …

文件上传漏洞详解(持续更新…)

第一关 步骤一,打开第一关先点击浏览上传一个jpg格式的图片 步骤二,打开BP修改jpg为php然后放包 步骤三,右键打开图像 成功解析 步骤四,打开蚁剑 第一关还是蛮简单的 第二关 步骤一,打开第二关先点击浏览上传一个j…

leetcode637. 二叉树的层平均值,广度优先搜索BFS

leetcode637. 二叉树的层平均值 给定一个非空二叉树的根节点 root , 以数组的形式返回每一层节点的平均值。与实际答案相差 10-5 以内的答案可以被接受。 给定一个非空二叉树的根节点 root , 以数组的形式返回每一层节点的平均值。与实际答案相差 10-5 以内的答案可以被接受。…

跑通llama-factory

1.在ubuntu下安装环境 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e “.[torch,metrics]” pip install --no-deps -e . 在本地windows,打开http://0.0.0.0:7863/,总是显示无法打开界面。 之后在…

!!学习整理知识模块——关于【如何本地搭建Whisper语音识别模型】/请按需收藏!!

成长路上不孤单😊【14后,C爱好者,持续分享所学,如有需要欢迎收藏转发😊😊😊😊😊😊😊!!!!&#xff…

经验风险最小化和极大似然估计的关系

一、经验风险定义 给定一个训练数据集 T { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) } T\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\} T{(x1​,y1​),(x2​,y2​),...,(xN​,yN​)},模型f(X)关于训练数据集的平均损失称为经验风险(Empirical…

冻死你都觉得简单

小说大纲 标题:《学霸的豪门对决》 背景设定: 两个家族在商业界拥有举足轻重的地位,但因为历史原因,两家长期处于竞争状态。主角们在顶级私立学校就读,既是学霸也是家族的继承人。 主要人物: 男主角&a…

【前端开发必备小技巧】前端代码规范Vue篇

文章目录 🟢 前端代码规范🟢 一、前端代码规范Vue篇👉1、Vue编码基础👉1.1、组件规范👉1.2、模板中使用简单的表达式👉1.3、指令都使用缩写形式👉1.4、 标签顺序保持一致👉1.5、必须…

<数据集>车辆识别数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:3002张 标注数量(xml文件个数):3002 标注数量(txt文件个数):3002 标注类别数:21 标注类别名称:[ambulance, army vehicle, auto rickshaw, bicycle, bus, car, garba…

互联网平台大模型网络架构设计

字节跳动:大模型网络实践分享 自2019年起,字节跳动公司便开始着手白盒项目。2020年,推出了首款接入交换机——25G型号,随后逐步实现软硬件的自主研发。在当前一代产品中,已经实现了100G接入、25.6T400G互联&#xff0c…

SprinBoot+Vue实验室考勤管理小程序的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue3.6 uniapp代码 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平…

信息学奥赛一本通/openjudge Crossing River

题目 一本通题目入口 openjudge题目入口 (注:由于一本通题面描述的可能有些欠缺,所以这里的题面采用openjudge英文翻译后的题面) 题目分析 首先我们来看样例,为什么样例的结果是17呢?首先观察,“5”和“…

node环境安装、vue-cli搭建过程、element-UI搭建使用过程

vue-cli 官方提供的一个脚手架,用于快速生成一个 vue 的项目模板;预先定义好的目录结构及基础代码,就好比咱们在创建 Maven 项目时可以选择创建一个骨架项目,这个骨架项目就是脚手架,我们的开发更加的快速 前端项目架…

Spark-Job启动、Stage划分

一、上下文 《Spark-driver和executor启动过程》详细分析了driver和executor的启动,此时资源已经给我们分配好了,且Application也已经注册完成。下面我们就来看看Spark是如何启动job并根据DAG来划分Stage的 二、Job启动 Spark RDD中的算子分为Transfo…

leetcode算法题之 K 个一组翻转链表

照我说这道题其实是披着困难皮的中等题目,问题如下: 题目地址 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍…