Linux 调试之 TRACE_EVENT(一)

news2025/1/11 11:36:52

文章目录

  • 前言
  • 一、TRACE_EVENT简介
  • 二、TRACE_EVENT() 结构
    • 2.1 TRACE_EVENT简介
    • 2.2 trace_sched_switch示例
      • 2.2.1 Name
      • 2.2.2 Prototype
      • 2.2.3 Arguments
      • 2.2.4 Structure
      • 2.2.5 Assignment
      • 2.2.6 Print
    • 2.3 Format file
      • 2.3.1 tracing/events/
      • 2.3.2 perf
      • 2.3.3 bpftrace
      • 2.3.4 bcc
      • 2.3.5 SystemTap
  • 三、The header file
  • 参考资料

前言

在Linux的整个历史中,人们一直希望在内核中添加静态跟踪点,即记录内核中特定位置的数据以供以后检索的函数。与Ftrace函数跟踪程序不同,跟踪点可以记录的不仅仅是输入的函数。跟踪点可以记录函数的局部变量。随着时间的推移,已经尝试了各种添加跟踪点的策略,TRACE_EVENT()宏是添加内核跟踪点的最新方法。

一、TRACE_EVENT简介

trace markers:添加一个非常低的开销 tracer hook ,尽管trace markers通过使用精心制作的宏解决了性能问题,但跟踪标记将记录的信息以printf格式嵌入核心内核中的位置,但是这让核心内核代码看起来像是分散在各处的调试代码。

tracepoints:跟踪点在内核代码中包含一个函数调用,当启用该函数时,将调用一个回调函数,将跟踪点的参数传递给该函数,就像使用这些参数调用回调函数一样。这比trace markers要好得多,因为它允许传递回调函数可以取消引用的类型转换指针,而不是标记接口,trace markers需要回调函数解析字符串。使用 tracepoints ,回调函数可以有效地从结构中获取所需的任何内容。

尽管这是对跟踪标记的改进,但对于开发人员来说,为他们想要添加的每个跟踪点创建回调,以便跟踪程序输出其数据仍然太过乏味。内核需要一种更自动化的方式来将跟踪程序连接到跟踪点。这将需要自动创建回调并格式化其数据,就像跟踪标记所做的那样,但应该在回调中完成,而不是在内核代码中的跟踪点位置。

为了解决自动跟踪点的问题,TRACE_EVENT()宏应运而生,该宏专门用于允许开发人员向其子系统添加跟踪点,并使Ftrace能够自动跟踪它们。开发人员不需要了解Ftrace的工作原理,他们只需要使用TRACE_EVENT()宏创建跟踪点。此外,他们需要遵循一些指南来创建头文件,这样他们就可以完全访问Ftrace跟踪程序。TRACE_EVENT()宏设计的另一个目的是不将其耦合到Ftrace或任何其他跟踪器。

ftrace、perf、SystemTap,ebpf和LTTng等都使用了TRACE_EVENT()。

二、TRACE_EVENT() 结构

2.1 TRACE_EVENT简介

自动跟踪点具有必须满足的各种要求:
(1)必须创建一个可以放置在内核代码中的跟踪点。
(2)必须创建一个可以挂接到该跟踪点的回调函数。
(3)回调函数必须能够以最快的方式将传递给它的数据记录到跟踪环缓冲区中。
(4)必须创建一个函数,该函数可以解析记录到环形缓冲区中的数据,并将其转换为跟踪程序可以向用户显示的人类可读格式。

为了实现上述要求,TRACE_EVENT()宏被分为六个组件,它们对应于宏的参数:

#define TRACE_EVENT(name, proto, args, struct, assign, print)	\
	DECLARE_TRACE(name, PARAMS(proto), PARAMS(args))

name:要创建的跟踪点的名称。
prototype:跟踪点回调的原型
args:与原型匹配的参数。
struct:跟踪程序可以使用(但不需要)存储传递到跟踪点的数据的结构。
assign:已类似于 C-like 的方式 将数据分配给结构。
print:以可读的ASCII格式输出结构的方法。

比如:sched_switch的跟踪点。

2.2 trace_sched_switch示例

下面将使用该定义来描述TRACE_EVENT()宏的每个部分。

// linux-3.10/include/trace/events/sched.h

/*
 * Tracepoint for task switches, performed by the scheduler:
 */
TRACE_EVENT(sched_switch,

	TP_PROTO(struct task_struct *prev,
		 struct task_struct *next),

	TP_ARGS(prev, next),

	TP_STRUCT__entry(
		__array(	char,	prev_comm,	TASK_COMM_LEN	)
		__field(	pid_t,	prev_pid			)
		__field(	int,	prev_prio			)
		__field(	long,	prev_state			)
		__array(	char,	next_comm,	TASK_COMM_LEN	)
		__field(	pid_t,	next_pid			)
		__field(	int,	next_prio			)
	),

	TP_fast_assign(
		memcpy(__entry->next_comm, next->comm, TASK_COMM_LEN);
		__entry->prev_pid	= prev->pid;
		__entry->prev_prio	= prev->prio;
		__entry->prev_state	= __trace_sched_switch_state(prev);
		memcpy(__entry->prev_comm, prev->comm, TASK_COMM_LEN);
		__entry->next_pid	= next->pid;
		__entry->next_prio	= next->prio;
	),

	TP_printk("prev_comm=%s prev_pid=%d prev_prio=%d prev_state=%s%s ==> next_comm=%s next_pid=%d next_prio=%d",
		__entry->prev_comm, __entry->prev_pid, __entry->prev_prio,
		__entry->prev_state & (TASK_STATE_MAX-1) ?
		  __print_flags(__entry->prev_state & (TASK_STATE_MAX-1), "|",
				{ 1, "S"} , { 2, "D" }, { 4, "T" }, { 8, "t" },
				{ 16, "Z" }, { 32, "X" }, { 64, "x" },
				{ 128, "K" }, { 256, "W" }, { 512, "P" }) : "R",
		__entry->prev_state & TASK_STATE_MAX ? "+" : "",
		__entry->next_comm, __entry->next_pid, __entry->next_prio)
);

除第一个参数外的所有参数都用另一个宏(TP_PROTO、TP_ARGS、TP_STRUCT__entry、TP_fast_assign和TP_printk)封装。这些宏提供了更多的处理控制,并且允许在TRACE_EVENT()宏中使用逗号。

2.2.1 Name

Name:第一个参数是名称。

TRACE_EVENT(sched_switch,

这是用于调用此跟踪点的名称。实际使用的跟踪点在名称前加上trace_前缀(即trace_sched_switch),比如:

#define CREATE_TRACE_POINTS
#include <trace/events/sched.h>

/**
 * prepare_task_switch - prepare to switch tasks
 * @rq: the runqueue preparing to switch
 * @prev: the current task that is being switched out
 * @next: the task we are going to switch to.
 *
 * This is called with the rq lock held and interrupts off. It must
 * be paired with a subsequent finish_task_switch after the context
 * switch.
 *
 * prepare_task_switch sets up locking and calls architecture specific
 * hooks.
 */
static inline void
prepare_task_switch(struct rq *rq, struct task_struct *prev,
		    struct task_struct *next)
{
	//使用 tracepoint:sched_switch
	trace_sched_switch(prev, next);
	sched_info_switch(prev, next);
	perf_event_task_sched_out(prev, next);
	fire_sched_out_preempt_notifiers(prev, next);
	prepare_lock_switch(rq, next);
	prepare_arch_switch(next);
}

2.2.2 Prototype

Prototype:第二个参数是函数原型。

	TP_PROTO(struct task_struct *prev,
		 struct task_struct *next),

编写原型时,就像直接声明跟踪点一样:

trace_sched_switch(struct task_struct *prev, struct task_struct *next),

它被用作添加到内核代码中的跟踪点和回调函数的原型。请记住,跟踪点调用回调函数,就像在跟踪点的位置调用回调函数一样。

2.2.3 Arguments

Arguments:第三个参数是函数原型使用的参数。

TP_ARGS(prev, next),

它不仅是TRACE_EVENT()宏所需要的,它也是下面的跟踪点基础结构所需要的。跟踪点代码在激活时将调用回调函数(可以为给定的跟踪点分配多个回调)。
创建跟踪点的宏必须同时访问原型和参数。以下是跟踪点宏完成此操作所需的说明:

struct tracepoint_func {
	void *func;
	void *data;
};

struct tracepoint {
	const char *name;		/* Tracepoint name */
	struct static_key key;
	void (*regfunc)(void);
	void (*unregfunc)(void);
	struct tracepoint_func __rcu *funcs;
};

extern struct tracepoint __tracepoint_##name;			\
static inline void trace_##name(proto)				\
{								\
	if (static_key_false(&__tracepoint_##name.key))		\
		__DO_TRACE(&__tracepoint_##name,		\
			TP_PROTO(data_proto),			\
			TP_ARGS(data_args),			\
			TP_CONDITION(cond),,);			\
}	

2.2.4 Structure

Structure:此参数描述将存储在跟踪器环形缓冲区中的数据的结构布局。

TP_STRUCT__entry(
	__array(	char,	prev_comm,	TASK_COMM_LEN	)
	__field(	pid_t,	prev_pid			)
	__field(	int,	prev_prio			)
	__field(	long,	prev_state			)
	__array(	char,	next_comm,	TASK_COMM_LEN	)
	__field(	pid_t,	next_pid			)
	__field(	int,	next_prio			)
),

此参数描述将存储在跟踪器环形缓冲区中的数据的结构布局。结构的每个元素都由另一个宏定义。这些宏用于自动创建结构,与功能不同。请注意,宏之间没有任何分隔符(没有逗号或分号)。
sched_switch跟踪点使用的宏包括:
__array(type,name,len)-这定义了一个数组项,相当于int name[len];其中类型为int,数组的名称为array,数组中的项数为len。
__field(type,name):这定义了一个普通的结构元素,比如in tvar;其中类型为int,名称为var。
还有其他元素宏将在后面的文章中描述。sched_switch跟踪点的定义将生成如下结构:

struct {
   char   prev_comm[TASK_COMM_LEN];
   pid_t  prev_pid;
   int    prev_prio;
   long   prev_state;
   char   next_comm[TASK_COMM_LEN];
   pid_t  next_pid;
   int    next_prio;
};

2.2.5 Assignment

Assignment:第五个参数定义了将参数中的数据保存到环形缓冲区的方式。

TP_fast_assign(
	memcpy(__entry->next_comm, next->comm, TASK_COMM_LEN);
	__entry->prev_pid	= prev->pid;
	__entry->prev_prio	= prev->prio;
	__entry->prev_state	= __trace_sched_switch_state(prev);
	memcpy(__entry->prev_comm, prev->comm, TASK_COMM_LEN);
	__entry->next_pid	= next->pid;
	__entry->next_prio	= next->prio;
),

TP_fast_assign()中的代码是正常的C代码。特殊变量__entry表示指向由TP_STRUCT__entry定义的结构类型的指针,并直接指向环形缓冲区。TP_fast_assign用于填充TP_STRUCT__entry中创建的所有字段。然后可以使用TP_PROTO和TP_ARGS定义的参数的变量名将适当的数据分配到__entry结构中。

2.2.6 Print

Print:最后一个参数定义如何使用printk()打印TP_STRUCT__entry结构中的字段。

TP_printk("prev_comm=%s prev_pid=%d prev_prio=%d prev_state=%s%s ==> next_comm=%s next_pid=%d next_prio=%d",
	__entry->prev_comm, __entry->prev_pid, __entry->prev_prio,
	__entry->prev_state & (TASK_STATE_MAX-1) ?
	  __print_flags(__entry->prev_state & (TASK_STATE_MAX-1), "|",
			{ 1, "S"} , { 2, "D" }, { 4, "T" }, { 8, "t" },
			{ 16, "Z" }, { 32, "X" }, { 64, "x" },
			{ 128, "K" }, { 256, "W" }, { 512, "P" }) : "R",
	__entry->prev_state & TASK_STATE_MAX ? "+" : "",
	__entry->next_comm, __entry->next_pid, __entry->next_prio)

变量__entry再次用于引用指向包含数据的结构的指针。格式字符串与任何其他printf格式一样。__print_flags()是TRACE_EVENT()附带的一组帮助函数的一部分。

2.3 Format file

Format file:sched_switch TRACE_EVENT()宏以/sys/kernel/debug/tracking/events/sched/sched_switch/format格式生成以下格式文件:

[root@localhost ~]# cat /sys/kernel/debug/tracing/events/sched/sched_switch/format
name: sched_switch
ID: 326
format:
        field:unsigned short common_type;       offset:0;       size:2; signed:0;
        field:unsigned char common_flags;       offset:2;       size:1; signed:0;
        field:unsigned char common_preempt_count;       offset:3;       size:1; signed:0;
        field:int common_pid;   offset:4;       size:4; signed:1;

        field:char prev_comm[16];       offset:8;       size:16;        signed:1;
        field:pid_t prev_pid;   offset:24;      size:4; signed:1;
        field:int prev_prio;    offset:28;      size:4; signed:1;
        field:long prev_state;  offset:32;      size:8; signed:1;
        field:char next_comm[16];       offset:40;      size:16;        signed:1;
        field:pid_t next_pid;   offset:56;      size:4; signed:1;
        field:int next_prio;    offset:60;      size:4; signed:1;

print fmt: "prev_comm=%s prev_pid=%d prev_prio=%d prev_state=%s%s ==> next_comm=%s next_pid=%d next_prio=%d", REC->prev_comm, REC->prev_pid, REC->prev_prio, REC->prev_state & (1024-1) ? __print_flags(REC->prev_state & (1024-1), "|", { 1, "S"} , { 2, "D" }, { 4, "T" }, { 8, "t" }, { 16, "Z" }, { 32, "X" }, { 64, "x" }, { 128, "K" }, { 256, "W" }, { 512, "P" }) : "R", REC->prev_state & 1024 ? "+" : "", REC->next_comm, REC->next_pid, REC->next_prio

请注意,格式文件中的__entry替换为REC。第一组字段(common_*)不是来自TRACE_EVENT()宏,而是由创建此格式文件的Ftrace添加到所有事件中,其他跟踪程序可以添加不同的字段。格式文件为用户空间工具提供解析包含sched_switch项的二进制输出所需的信息。

2.3.1 tracing/events/

与进程调度有关的其他 tracepoints 点:

[root@localhost ~]# cat /sys/kernel/debug/tracing/events/sched/
enable                       sched_move_numa/             sched_process_free/          sched_stat_runtime/          sched_switch/
filter                       sched_pi_setprio/            sched_process_hang/          sched_stat_sleep/            sched_wait_task/
sched_kthread_stop/          sched_process_exec/          sched_process_wait/          sched_stat_wait/             sched_wake_idle_without_ipi/
sched_kthread_stop_ret/      sched_process_exit/          sched_stat_blocked/          sched_stick_numa/            sched_wakeup/
sched_migrate_task/          sched_process_fork/          sched_stat_iowait/           sched_swap_numa/             sched_wakeup_new/

2.3.2 perf

除了通过 debugfs 的 /tracing/events/ 查看 tracepoint点还可以通过 perf list 查看:

[root@localhost ~]# perf list tracepoint | grep sched:
  sched:sched_kthread_stop                           [Tracepoint event]
  sched:sched_kthread_stop_ret                       [Tracepoint event]
  sched:sched_migrate_task                           [Tracepoint event]
  sched:sched_move_numa                              [Tracepoint event]
  sched:sched_pi_setprio                             [Tracepoint event]
  sched:sched_process_exec                           [Tracepoint event]
  sched:sched_process_exit                           [Tracepoint event]
  sched:sched_process_fork                           [Tracepoint event]
  sched:sched_process_free                           [Tracepoint event]
  sched:sched_process_hang                           [Tracepoint event]
  sched:sched_process_wait                           [Tracepoint event]
  sched:sched_stat_blocked                           [Tracepoint event]
  sched:sched_stat_iowait                            [Tracepoint event]
  sched:sched_stat_runtime                           [Tracepoint event]
  sched:sched_stat_sleep                             [Tracepoint event]
  sched:sched_stat_wait                              [Tracepoint event]
  sched:sched_stick_numa                             [Tracepoint event]
  sched:sched_swap_numa                              [Tracepoint event]
  sched:sched_switch                                 [Tracepoint event]
  sched:sched_wait_task                              [Tracepoint event]
  sched:sched_wake_idle_without_ipi                  [Tracepoint event]
  sched:sched_wakeup                                 [Tracepoint event]
  sched:sched_wakeup_new                             [Tracepoint event]

2.3.3 bpftrace

对于支持 ebpf 的高版本Linux内核版本,可以用bpftrace查看:

yl@yl-virtual-machine:~/Desktop$ uname -r
5.19.0-23-generic
yl@yl-virtual-machine:~/Desktop$ sudo bpftrace -l tracepoint:sched:*
tracepoint:sched:sched_kthread_stop
tracepoint:sched:sched_kthread_stop_ret
tracepoint:sched:sched_kthread_work_execute_end
tracepoint:sched:sched_kthread_work_execute_start
tracepoint:sched:sched_kthread_work_queue_work
tracepoint:sched:sched_migrate_task
tracepoint:sched:sched_move_numa
tracepoint:sched:sched_pi_setprio
tracepoint:sched:sched_process_exec
tracepoint:sched:sched_process_exit
tracepoint:sched:sched_process_fork
tracepoint:sched:sched_process_free
tracepoint:sched:sched_process_hang
tracepoint:sched:sched_process_wait
tracepoint:sched:sched_stat_blocked
tracepoint:sched:sched_stat_iowait
tracepoint:sched:sched_stat_runtime
tracepoint:sched:sched_stat_sleep
tracepoint:sched:sched_stat_wait
tracepoint:sched:sched_stick_numa
tracepoint:sched:sched_swap_numa
tracepoint:sched:sched_switch
tracepoint:sched:sched_wait_task
tracepoint:sched:sched_wake_idle_without_ipi
tracepoint:sched:sched_wakeup
tracepoint:sched:sched_wakeup_new
tracepoint:sched:sched_waking

2.3.4 bcc

使用bcc查看:

yl@yl-virtual-machine:~/Desktop$ sudo /usr/share/bcc/tools/tplist -v "sched:*"
sched:sched_kthread_stop
    char comm[TASK_COMM_LEN];
    pid_t pid;
sched:sched_kthread_stop_ret
    int ret;
sched:sched_kthread_work_queue_work
    void * work;
    void * function;
    void * worker;
sched:sched_kthread_work_execute_start
    void * work;
    void * function;
sched:sched_kthread_work_execute_end
    void * work;
    void * function;
sched:sched_waking
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
    int target_cpu;
sched:sched_wakeup
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
    int target_cpu;
sched:sched_wakeup_new
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
    int target_cpu;
sched:sched_switch
    char prev_comm[TASK_COMM_LEN];
    pid_t prev_pid;
    int prev_prio;
    long prev_state;
    char next_comm[TASK_COMM_LEN];
    pid_t next_pid;
    int next_prio;
sched:sched_migrate_task
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
    int orig_cpu;
    int dest_cpu;
sched:sched_process_free
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
sched:sched_process_exit
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
sched:sched_wait_task
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
sched:sched_process_wait
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int prio;
sched:sched_process_fork
    char parent_comm[TASK_COMM_LEN];
    pid_t parent_pid;
    char child_comm[TASK_COMM_LEN];
    pid_t child_pid;
sched:sched_process_exec
    __data_loc char[] filename;
    pid_t pid;
    pid_t old_pid;
sched:sched_stat_wait
    char comm[TASK_COMM_LEN];
    pid_t pid;
    u64 delay;
sched:sched_stat_sleep
    char comm[TASK_COMM_LEN];
    pid_t pid;
    u64 delay;
sched:sched_stat_iowait
    char comm[TASK_COMM_LEN];
    pid_t pid;
    u64 delay;
sched:sched_stat_blocked
    char comm[TASK_COMM_LEN];
    pid_t pid;
    u64 delay;
sched:sched_stat_runtime
    char comm[TASK_COMM_LEN];
    pid_t pid;
    u64 runtime;
    u64 vruntime;
sched:sched_pi_setprio
    char comm[TASK_COMM_LEN];
    pid_t pid;
    int oldprio;
    int newprio;
sched:sched_process_hang
    char comm[TASK_COMM_LEN];
    pid_t pid;
sched:sched_move_numa
    pid_t pid;
    pid_t tgid;
    pid_t ngid;
    int src_cpu;
    int src_nid;
    int dst_cpu;
    int dst_nid;
sched:sched_stick_numa
    pid_t src_pid;
    pid_t src_tgid;
    pid_t src_ngid;
    int src_cpu;
    int src_nid;
    pid_t dst_pid;
    pid_t dst_tgid;
    pid_t dst_ngid;
    int dst_cpu;
    int dst_nid;
sched:sched_swap_numa
    pid_t src_pid;
    pid_t src_tgid;
    pid_t src_ngid;
    int src_cpu;
    int src_nid;
    pid_t dst_pid;
    pid_t dst_tgid;
    pid_t dst_ngid;
    int dst_cpu;
    int dst_nid;
sched:sched_wake_idle_without_ipi
    int cpu;

2.3.5 SystemTap

SystemTap也可以查看:

[root@localhost ~]# stap -L 'kernel.trace("sched*")'
kernel.trace("sched:sched_kthread_stop") $t:struct task_struct*
kernel.trace("sched:sched_kthread_stop_ret") $ret:int
kernel.trace("sched:sched_migrate_task") $p:struct task_struct* $dest_cpu:int
kernel.trace("sched:sched_move_numa") $tsk:struct task_struct* $src_cpu:int $dst_cpu:int
kernel.trace("sched:sched_pi_setprio") $tsk:struct task_struct* $newprio:int
kernel.trace("sched:sched_process_exec") $p:struct task_struct* $old_pid:pid_t $bprm:struct linux_binprm*
kernel.trace("sched:sched_process_exit") $p:struct task_struct*
kernel.trace("sched:sched_process_fork") $parent:struct task_struct* $child:struct task_struct*
kernel.trace("sched:sched_process_free") $p:struct task_struct*
kernel.trace("sched:sched_process_hang") $tsk:struct task_struct*
kernel.trace("sched:sched_process_wait") $pid:struct pid*
kernel.trace("sched:sched_stat_blocked") $tsk:struct task_struct* $delay:u64
kernel.trace("sched:sched_stat_iowait") $tsk:struct task_struct* $delay:u64
kernel.trace("sched:sched_stat_runtime") $tsk:struct task_struct* $runtime:u64 $vruntime:u64
kernel.trace("sched:sched_stat_sleep") $tsk:struct task_struct* $delay:u64
kernel.trace("sched:sched_stat_wait") $tsk:struct task_struct* $delay:u64
kernel.trace("sched:sched_stick_numa") $tsk:struct task_struct* $src_cpu:int $dst_cpu:int
kernel.trace("sched:sched_swap_numa") $src_tsk:struct task_struct* $src_cpu:int $dst_tsk:struct task_struct* $dst_cpu:int
kernel.trace("sched:sched_switch") $prev:struct task_struct* $next:struct task_struct*
kernel.trace("sched:sched_wait_task") $p:struct task_struct*
kernel.trace("sched:sched_wake_idle_without_ipi") $cpu:int
kernel.trace("sched:sched_wakeup") $p:struct task_struct* $success:int
kernel.trace("sched:sched_wakeup_new") $p:struct task_struct* $success:int

tracepoint 是由内核开发人员在代码中设置的静态 hook 点,具有稳定的 API 接口,不会随着内核版本的变化而变化,可以提高我们内核跟踪程序的可移植性。但是由于 tracepoint 是需要内核研发人员参数编写,因此在内核代码中的数量有限,并不是所有的内核函数中都具有类似的跟踪点。

三、The header file

内核中的跟踪点都是定义在该目录下:

linux-3.10/include/trace/events/

在这里插入图片描述
与任务调度相关的 tracepoints 点都是在该目录下:

linux-3.10/include/trace/events/sched.h

#undef TRACE_SYSTEM
#define TRACE_SYSTEM sched

#if !defined(_TRACE_SCHED_H) || defined(TRACE_HEADER_MULTI_READ)
#define _TRACE_SCHED_H

#include <linux/sched.h>
#include <linux/tracepoint.h>
#include <linux/binfmts.h>

/*
 * Tracepoint for calling kthread_stop, performed to end a kthread:
 */
TRACE_EVENT(sched_kthread_stop,

	TP_PROTO(struct task_struct *t),

	TP_ARGS(t),

	TP_STRUCT__entry(
		__array(	char,	comm,	TASK_COMM_LEN	)
		__field(	pid_t,	pid			)
	),

	TP_fast_assign(
		memcpy(__entry->comm, t->comm, TASK_COMM_LEN);
		__entry->pid	= t->pid;
	),

	TP_printk("comm=%s pid=%d", __entry->comm, __entry->pid)
);

/*
 * Tracepoint for the return value of the kthread stopping:
 */
TRACE_EVENT(sched_kthread_stop_ret,

	TP_PROTO(int ret),

	TP_ARGS(ret),

	TP_STRUCT__entry(
		__field(	int,	ret	)
	),

	TP_fast_assign(
		__entry->ret	= ret;
	),

	TP_printk("ret=%d", __entry->ret)
);
......

TRACE_EVENT()头中的第一行不是常规的 #ifdef _TRACE_SCHED_H ,而是:

#undef TRACE_SYSTEM
#define TRACE_SYSTEM sched

#if !defined(_TRACE_SCHED_H) || defined(TRACE_HEADER_MULTI_READ)
#define _TRACE_SCHED_H

此示例用于调度程序跟踪事件,其他事件的 headfile 将使用sched和_trace_sched_H以外的其他内容。TRACE_HEADER_MULTI_READ测试允许多次包含此文件;这对于TRACE_EVENT()宏的处理非常重要。还必须为文件定义TRACE_SYSTEM,并且必须在#if的保护范围之外。TRACE_SYSTEM定义文件中TRACE_EVENT()宏所属的组。这也是事件将在debugfs tracing/events/ 目录中分组的目录名。此分组对Ftrace很重要,因为它允许用户按组启用或禁用事件。
然后,该文件包含TRACE_EVENT()宏内容所需的任何 headers 。(例如#include<linux/sched.h>)。
The tracepoint.h file 也要求:

#include <linux/tracepoint.h>

现在可以使用 TRACE_EVENT() 宏定义所有跟踪事件。请在TRACE_EVENT()宏上方包含描述跟踪点的注释。查看include/trace/events/sched.h作为示例。文件结尾为:

#endif /* _TRACE_SCHED_H */

/* This part must be outside protection */
#include <trace/define_trace.h>

define_trace.h是创建跟踪点的 all the magic 所在。关于这个文件如何工作的解释将留给另一篇文章。现在,只要知道这个文件必须包含在跟踪头文件的底部,不受#endif的保护就足够了。

要使用跟踪点,必须包含 headerfile ,但在包含跟踪之前,一个C文件还必须定义CREATE_TRACE_POINTS。这将导致define_trace.h来创建生成跟踪事件所需的必要函数,如下所示:

// linux-3.10/kernel/sched/core.c

#define CREATE_TRACE_POINTS
#include <trace/events/sched.h>

如果另一个文件需要使用跟踪文件中定义的跟踪点,那么它只需要包含跟踪文件,而不需要定义CREATE_TRACE_POINTS了。为同一头文件多次定义它将在生成时导致链接器错误。比如:

// linux-3.10/kernel/fork.c

#include <trace/events/sched.h>

// 这里的 CREATE_TRACE_POINTS 是生成与 task 有关的 tracepoint
#define CREATE_TRACE_POINTS
#include <trace/events/task.h>

代码中使用的跟踪点与TRACE_EVENT()宏中定义的一样:

/**
 * prepare_task_switch - prepare to switch tasks
 * @rq: the runqueue preparing to switch
 * @prev: the current task that is being switched out
 * @next: the task we are going to switch to.
 *
 * This is called with the rq lock held and interrupts off. It must
 * be paired with a subsequent finish_task_switch after the context
 * switch.
 *
 * prepare_task_switch sets up locking and calls architecture specific
 * hooks.
 */
static inline void
prepare_task_switch(struct rq *rq, struct task_struct *prev,
		    struct task_struct *next)
{
	trace_sched_switch(prev, next);
	sched_info_switch(prev, next);
	perf_event_task_sched_out(prev, next);
	fire_sched_out_preempt_notifiers(prev, next);
	prepare_lock_switch(rq, next);
	prepare_arch_switch(next);
}

参考资料

Linux 3.10.0

https://lwn.net/Articles/379903/
https://blog.csdn.net/rikeyone/article/details/116057261

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/98936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

逻辑回归 鸢尾花分类预测

目录 一&#xff1a;加载数据 二&#xff1a;数据集划分 三&#xff1a;选择算法 四&#xff1a;网格模型 超参数最优解 五&#xff1a;鸢尾花分类预测 六&#xff1a;预测与实际比对 七&#xff1a;完整源码分享 一&#xff1a;加载数据 from sklearn.datasets import…

Jenkins启动项目时报错问题

问题 在工作中使用jenkins进行项目部署启动时遇到问题&#xff0c;项目构建成功但是发布时一直显示时间增加&#xff0c;但是项目本身并没有问题&#xff0c;使用传统方法部署项目也能正常启动。报错如下图所示&#xff1a; 解决方法 是由于jenkins文件中打印日志的问题&am…

PayPal,Stripe,Square轮询支付系统

轮询展示 展示我们轮询的页面 轮询套餐 根据不同的用户和需求&#xff0c;可以选择不同的套餐 普通版 1500元 1年 1个用户 支持Paypal/Stripe 不限制A站个数 不限制B站个数 不限制提交模式 订单管理 物流管理 风控管理 必要的网站数据处理 24小时远程协助 开始…

springcloud服务消费与熔断

今天与大家分享服务消费与熔断&#xff0c;就是说当我们服务消费者转发到服务生产者时&#xff0c;如果有那一步出现了问题或者error&#xff0c;可以进行服务熔断&#xff08;服务降级&#xff09;&#xff0c;为了补救系统问题&#xff0c;不让用户使用时看见error报错信息&a…

《Java》String、StringBuffer、StringBuilder有什么区别?

目录 String StringBuffer StringBuilder 总结 ps&#xff1a;昨天在讨论完String的不可变性之后突然想要做一份总结笔记&#xff0c;总结一下String、StringBuffer、StringBuilder的区别 String String是Java中的基础类&#xff0c;提供了各种构造和对字符串的基本操作&am…

Cocos Creater(3.6.1)开发笔记——Typscript

文章目录项目入门关于cocos creator 3.x关于TypeScript新建项目VS setting json配置屏蔽项事件节点添加脚本&#xff08;事件&#xff09;案例代码素材使用技巧素材组合固定布局&#xff08;类似css&#xff09;项目入门 关于cocos creator 3.x 相当于cocos所有版本的功能的综…

初探MapReduce

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录MapReduce核心思想MapReduce编程模型MapReduce编程实例——词频统计思路1、Map阶段&#xff08;映射阶段&#xff09;2、Reduce阶段&#xff08;归并阶段&#xff09…

VS2019下C#调用C++ DLL详解+数据转换

VS2019下C#调用C DLL详解数据转换 -C#调用OpenCV&#xff08;c的.dll主要有两种常见的方式&#xff1a;托管和非托管两种形式&#xff01; 非托管的形式即是采用[DllImport]的形式&#xff0c;这种形式只能调用的C的函数&#xff0c;适合用于简单的图形处理调用&#xff0c;这也…

正交编码器溢出处理

文章目录1.正交编码器1.1 参数特性1.2 应用范围2.正交编码器使用2.1 溢出问题2.2 中断模式2.3 循环模式延伸1.正交编码器 正交编码器一般指的是增量式光栅&#xff08;磁栅&#xff09;编码器&#xff0c;通常有三路输出信号&#xff0c;A相、B相、Z相&#xff0c;俗称ABZ编码器…

【2022年度系列工作总结】「国内软件质量调查问卷」针对于本年度软件质量分析总结报告

前提背景 针对于目前的软件行业而言&#xff0c;软件的质量目前越来越被大家所在关注&#xff0c;慢慢的QA以及SQA的角色也变得愈加重要。接下来我就针对于我司&#xff08;XXX&#xff09;的相关的实际开发情况对应的【2022年国内软件质量调查问卷】&#xff0c;为大家梳理和…

[附源码]计算机毕业设计Python大学生考勤管理系统论文(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

听说Linux基础指令很多?这里都帮你总结好了

✨个人主页&#xff1a; Yohifo &#x1f389;所属专栏&#xff1a; Linux学习之旅 &#x1f38a;每篇一句&#xff1a; 图片来源 &#x1f383;操作环境&#xff1a; CentOS 7.6 阿里云远程服务器 You can’t use up creativity. The more you use, the more you have. 创造力…

微软数据科学家助理(Data Scientist Associate)认证考试通过经验分享(DP-100)

今天冒着大疫情&#xff0c;去海淀的test center参加考试&#xff0c;通过了微软DP-100 在 Azure 上设计和实现数据科学解决方案&#xff0c;并且获得了经 Microsoft 认证&#xff1a;Azure 数据科学家助理 的证书。 经 Microsoft 认证&#xff1a;Azure 数据科学家助理 考试结…

Hadoop编译源码

文章目录第一章 Hadoop编译源码1.1 前期准备工作1.2 Jar包安装配置maven的环境变量在 mirrors节点中添加阿里云镜像安装gcc make配置环境变量1.3编译源码第二章 常见错误及解决方案第一章 Hadoop编译源码 1.1 前期准备工作 1&#xff09;CentOS联网 配置CentOS能连接外网。Li…

力扣(LeetCode)1703. 得到连续 K 个 1 的最少相邻交换次数(C++)

贪心 将至少连续 KKK 个 111 放在一起。首先考虑他们是相邻着放在一起的&#xff0c;然后考虑性质 : 设相邻摆放后&#xff0c;起始 111 的位置是 mid{mid}mid &#xff0c;对于每个 111 的位置 aia_iai​ &#xff0c;它需要被摆放的位置是 amidia_{mid}iamid​i 。考虑一个等…

【Effective_Objective-C_2对象,消息,运行期2】

文章目录前言12.理解消息转发机制消息转发动态方法解析动态方法解析的前提备援接受者完整的消息转发消息转发全部流程要点总结13.用“方法调配技术”调试“黑盒方法”方法调配动态消息派发系统和IMP如何交换方法实现要点总结14.理解“类对象”的用意在类的继承体系中查询类型信…

【经济学】【综合篇】经济机器是怎样运行的

原视频&#xff1a;经济机器是怎样运行的 (时长30分钟) Ray Dalio 前言&#xff1a;经济与我们每一个人息息相关&#xff0c;经济社会的一些变革或举措也会直接或间接的反映到我们每个个体身上。了解经济&#xff0c;提高自己的认知&#xff0c;可以帮助我们更好的参与经济活动…

excel数据统计技巧:如何对表格区域内所含字母进行计数

小王是一家快餐店的财务人员。受疫情影响公司开展了店外销售业务&#xff0c;所有销售采取手工记账的方式。为了简化销售人员的工作量&#xff0c;为每种商品指定了一个字母代码&#xff0c;营业员只需要记录每一单销售的商品代码即可。下面是根据手工记账登记的销售记录表&…

论文投稿指南——中国(中文EI)期刊推荐(第8期)

&#x1f384;&#x1f384; EI是国际知名三大检索系统之一&#xff0c;在学术界的知名度和认可度仅次于SCI&#xff01; 【前言】 想发论文怎么办&#xff1f;手把手教你论文如何投稿&#xff01;那么&#xff0c;首先要搞懂投稿目标——论文期刊。其中&#xff0c;中文期刊的…

【运筹优化】子集和问题(Subset Sum Problems , SSP)介绍 + 动态规划求解 + Java代码实现

文章目录一、问题介绍二、动态规划求解思路三、Java代码实现一、问题介绍 子集和问题&#xff08;Subset Sum Problems , SSP&#xff09;&#xff0c;它是复杂性理论中最重要的问题之一。 SSP会给定一组整数 a1,a2,....,ana_1,a_2,....,a_na1​,a2​,....,an​ &#xff0c;…