Linux 内核启动流程与入口函数分析

news2025/1/13 15:54:43

                                  

从启动引导程序 bootloader(uboot)跳转到 Linux 内核后,Linux 内核开始启动,今天我们分析一下 Linux 内核启动入口。

跳转过去初始化肯定是在汇编文件中,根据架构可以选择不同的平台,这里看一下链接汇编文件:

linux4.14/arch/arm/kernel/vmlinux.lds.S

这里可以看到链接时候 Linux 入口是 stext 段,这里是启动引导程序跳转过来的第一段Linux 代码:

第一:Linux入口地址

我们先看一下入口地址的确定,同一文件。



SECTIONS
{
 /*
  * XXX: The linker does not define how output sections are
  * assigned to input sections when there are multiple statements
  * matching the same input section name.  There is no documented
  * order of matching.
  *
  * unwind exit sections must be discarded before the rest of the
  * unwind sections get included.
  */
 /DISCARD/ : {
  *(.ARM.exidx.exit.text)
  *(.ARM.extab.exit.text)
  ARM_CPU_DISCARD(*(.ARM.exidx.cpuexit.text))
  ARM_CPU_DISCARD(*(.ARM.extab.cpuexit.text))
  ARM_EXIT_DISCARD(EXIT_TEXT)
  ARM_EXIT_DISCARD(EXIT_DATA)
  EXIT_CALL
#ifndef CONFIG_MMU
  *(.text.fixup)
  *(__ex_table)
#endif
#ifndef CONFIG_SMP_ON_UP
  *(.alt.smp.init)
#endif
  *(.discard)
  *(.discard.*)
 }

 . = PAGE_OFFSET + TEXT_OFFSET;
 .head.text : {
  _text = .;
  HEAD_TEXT
 }

这个 SECTIONS 比较长,只放一部分。在这里有个比较重要的东西:

. = PAGE_OFFSET + TEXT_OFFSET;

这一句表示了 Linux 系统真正的启动地址。

PAGE_OFFSET 是 Linux 内核空间的虚拟起始地址,定义在:

linux4.14/arch/arm64/include/asm/memory.h

注意,这里的地址都很重要,很多地方会用到。当然,这里的地址可能会随着 Linux 内核版本的不同和硬件的不同,会变化。这里没有一个具体的数,因为 VA_BITS 中的数字是可选的,大家可以根据自己的平台算一下。

TEXT_OFFSET 定义在:

linux4.14/arch/arm/Makefile 中:

这个值一般是 0x00008000 ,算出 PAGE_OFFSET 后加上这个值就是 Linux 内核的起始地址。

修改这个偏移量就可以使Linux内核拷贝到不同的地址,自己修改注意内存对齐。

第二:stext 段

从上面的ENTRY(stext)可以知道,一开始是运行stext段,这个段内的代码是 start_kernel 函数前汇编环境的初始化。

linux4.14/arch/arm64/kernel/head.S

preserve_boot_args 保存 bootloader 传递过来的参数。

el2_setup 是设置 Linux 启动模式是 EL2。Linux 有 EL0、EL1、EL2、EL3 四种异常启动模式,这里设置一开始是 EL2,EL2 支持虚拟内存技术,然后注释说明后面又退回 EL1,在 EL1 启动 kernel。EL3 一般是只在安全模式使用。

set_cpu_boot_mode_flag 保存上面 cpu 的启动模式。

__create_page_tables 创建页表。

__cpu_setup 初始化CPU,这里主要是初始化和 MMU 内存相关的 CPU 部分。

__primary_switch 这里会进行跳转。

在同一个文件中,会跳转到这里,739 行开启了MMU。然后最重要的是跳转到

__primary_switched 函数。先把 __primary_switched 地址放到 x8 寄存器中,再跳转到 x8,也就是跳转到 __primary_switched。

接下来分析 __primary_switched 函数:

324-327  初始化了 init 进程的内存信息,开辟了内存空间。

329-334 设置了向量表。

336-340 保存了FDT,也就是 flat device tree 。

342-348 清除了BSS 段,我们知道一般是内存四区:堆区、栈区、全局区、代码区。其中全局区可以再分为 data 段和 BSS 段,BSS 段存储了未初始化的变量,这里将BSS段进行清零操作,否则内存中的值是不确定的,这是一个传统操作。

367 行跳转到了我们熟悉的 start_kernel,就可以看下面这篇文章:

上次我们写过了 Linux 启动详细流程,这次单独解析 start_kernel 函数。

如下请参考注释:

Linux kernel-6.1/init/main.c

asmlinkage __visible void __init __no_sanitize_address start_kernel(void)
{
 char *command_line;
 char *after_dashes;

 set_task_stack_end_magic(&init_task);/*设置任务栈结束魔术数,用于栈溢出检测*/
 smp_setup_processor_id();/*跟 SMP 有关(多核处理器),设置处理器 ID*/
 debug_objects_early_init();/* 做一些和 debug 有关的初始化 */
 init_vmlinux_build_id();

 cgroup_init_early();/* cgroup 初始化,cgroup 用于控制 Linux 系统资源*/

 local_irq_disable();/* 关闭当前 CPU 中断 */
 early_boot_irqs_disabled = true;

 /*
  * Interrupts are still disabled. Do necessary setups, then
  * enable them.
  * 中断关闭期间做一些重要的操作,然后打开中断
  */
 boot_cpu_init();/* 跟 CPU 有关的初始化 */
 page_address_init();/* 页地址相关的初始化 */
 pr_notice("%s", linux_banner);/* 打印 Linux 版本号、编译时间等信息 */
 early_security_init();
 
 /* 系统架构相关的初始化,此函数会解析传递进来的
 * ATAGS 或者设备树(DTB)文件。会根据设备树里面
 * 的 model 和 compatible 这两个属性值来查找
 * Linux 是否支持这个单板。此函数也会获取设备树
 * 中 chosen 节点下的 bootargs 属性值来得到命令
 * 行参数,也就是 uboot 中的 bootargs 环境变量的
 * 值,获取到的命令行参数会保存到 command_line 中
 */
 setup_arch(&command_line);
 setup_boot_config();
 setup_command_line(command_line);/* 存储命令行参数 */
 
 /* 如果只是 SMP(多核 CPU)的话,此函数用于获取
 * CPU 核心数量,CPU 数量保存在变量 nr_cpu_ids 中。
 */
 setup_nr_cpu_ids();
 setup_per_cpu_areas();/* 在 SMP 系统中有用,设置每个 CPU 的 per-cpu 数据 */
 smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
 boot_cpu_hotplug_init();

 build_all_zonelists(NULL);/* 建立系统内存页区(zone)链表 */
 page_alloc_init();/* 处理用于热插拔 CPU 的页 */

 /* 打印命令行信息 */ 
 pr_notice("Kernel command line: %s\n", saved_command_line);
 /* parameters may set static keys */
 jump_label_init();
 parse_early_param();/* 解析命令行中的 console 参数 */
 after_dashes = parse_args("Booting kernel",
      static_command_line, __start___param,
      __stop___param - __start___param,
      -1, -1, NULL, &unknown_bootoption);
 print_unknown_bootoptions();
 if (!IS_ERR_OR_NULL(after_dashes))
  parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
      NULL, set_init_arg);
 if (extra_init_args)
  parse_args("Setting extra init args", extra_init_args,
      NULL, 0, -1, -1, NULL, set_init_arg);

 /* Architectural and non-timekeeping rng init, before allocator init */
 random_init_early(command_line);

 /*
  * These use large bootmem allocations and must precede
  * kmem_cache_init()
  */
 setup_log_buf(0);/* 设置 log 使用的缓冲区*/
 vfs_caches_init_early(); /* 预先初始化 vfs(虚拟文件系统)的目录项和索引节点缓存*/
 sort_main_extable();/* 定义内核异常列表 */
 trap_init();/* 完成对系统保留中断向量的初始化 */
 mm_init();/* 内存管理初始化 */

 ftrace_init();

 /* trace_printk can be enabled here */
 early_trace_init();

 /*
  * Set up the scheduler prior starting any interrupts (such as the
  * timer interrupt). Full topology setup happens at smp_init()
  * time - but meanwhile we still have a functioning scheduler.
  */
 sched_init();/* 初始化调度器,主要是初始化一些结构体 */

 if (WARN(!irqs_disabled(),
   "Interrupts were enabled *very* early, fixing it\n"))
  local_irq_disable();/* 检查中断是否关闭,如果没有的话就关闭中断 */
 radix_tree_init();/* 基数树相关数据结构初始化 */
 maple_tree_init();

 /*
  * Set up housekeeping before setting up workqueues to allow the unbound
  * workqueue to take non-housekeeping into account.
  */
 housekeeping_init();

 /*
  * Allow workqueue creation and work item queueing/cancelling
  * early.  Work item execution depends on kthreads and starts after
  * workqueue_init().
  */
 workqueue_init_early();

 rcu_init();/* 初始化 RCU,RCU 全称为 Read Copy Update(读-拷贝修改) */

 /* Trace events are available after this */
 trace_init();/* 跟踪调试相关初始化 */

 if (initcall_debug)
  initcall_debug_enable();

 context_tracking_init();
 /* init some links before init_ISA_irqs() */
 
 /* 初始中断相关初始化,主要是注册 irq_desc 结构体变
 * 量,因为 Linux 内核使用 irq_desc 来描述一个中断。
 */
 early_irq_init();
 init_IRQ();/* 中断初始化 */
 tick_init();/* tick 初始化 */
 rcu_init_nohz();
 init_timers();/* 初始化定时器 */
 srcu_init();
 hrtimers_init();/* 初始化高精度定时器 */
 softirq_init();/* 软中断初始化 */
 timekeeping_init();
 time_init();/* 初始化系统时间 */

 /* This must be after timekeeping is initialized */
 random_init();

 /* These make use of the fully initialized rng */
 kfence_init();
 boot_init_stack_canary();

 perf_event_init();
 profile_init();
 call_function_init();
 WARN(!irqs_disabled(), "Interrupts were enabled early\n");

 early_boot_irqs_disabled = false;
 local_irq_enable();/* 使能中断 */

 kmem_cache_init_late();/* slab 初始化,slab 是 Linux 内存分配器 */

 /*
  * HACK ALERT! This is early. We're enabling the console before
  * we've done PCI setups etc, and console_init() must be aware of
  * this. But we do want output early, in case something goes wrong.
  */
 /* 初始化控制台,之前 printk 打印的信息都存放
  * 缓冲区中,并没有打印出来。只有调用此函数
  * 初始化控制台以后才能在控制台上打印信息。
  */
 console_init();
 if (panic_later)
  panic("Too many boot %s vars at `%s'", panic_later,
        panic_param);

 lockdep_init();

 /*
  * Need to run this when irqs are enabled, because it wants
  * to self-test [hard/soft]-irqs on/off lock inversion bugs
  * too:
  */
 locking_selftest();/* 锁自测 */ 

 /*
  * This needs to be called before any devices perform DMA
  * operations that might use the SWIOTLB bounce buffers. It will
  * mark the bounce buffers as decrypted so that their usage will
  * not cause "plain-text" data to be decrypted when accessed.
  */
 mem_encrypt_init();

#ifdef CONFIG_BLK_DEV_INITRD
 if (initrd_start && !initrd_below_start_ok &&
     page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {
  pr_crit("initrd overwritten (0x%08lx < 0x%08lx) - disabling it.\n",
      page_to_pfn(virt_to_page((void *)initrd_start)),
      min_low_pfn);
  initrd_start = 0;
 }
#endif
 setup_per_cpu_pageset();
 numa_policy_init();
 acpi_early_init();
 if (late_time_init)
  late_time_init();
 sched_clock_init();
 /* 测定 BogoMIPS 值,可以通过 BogoMIPS 来判断 CPU 的性能
 * BogoMIPS 设置越大,说明 CPU 性能越好。
 */
 calibrate_delay();
 pid_idr_init();
 anon_vma_init();/* 生成 anon_vma slab 缓存 */ 
#ifdef CONFIG_X86
 if (efi_enabled(EFI_RUNTIME_SERVICES))
  efi_enter_virtual_mode();
#endif
 thread_stack_cache_init();
 cred_init();/* 为对象的每个用于赋予资格(凭证) */
 fork_init();/* 初始化一些结构体以使用 fork 函数 */
 proc_caches_init();/* 给各种资源管理结构分配缓存 */
 uts_ns_init();
 key_init();/* 初始化密钥 */
 security_init();/* 安全相关初始化 */
 dbg_late_init();
 net_ns_init();
 vfs_caches_init();/* 虚拟文件系统缓存初始化 */
 pagecache_init();
 signals_init();/* 初始化信号 */
 seq_file_init();
 proc_root_init();/* 注册并挂载 proc 文件系统 */
 nsfs_init();
 /* 初始化 cpuset,cpuset 是将 CPU 和内存资源以逻辑性
 * 和层次性集成的一种机制,是 cgroup 使用的子系统之一
 */
 cpuset_init();
 cgroup_init();/* 初始化 cgroup */
 taskstats_init_early();/* 进程状态初始化 */
 delayacct_init();

 poking_init();
 check_bugs();/* 检查写缓冲一致性 */

 acpi_subsystem_init();
 arch_post_acpi_subsys_init();
 kcsan_init();

 /* Do the rest non-__init'ed, we're now alive */
 /* 调用 rest_init 函数 */
 /* 创建 init、kthread、idle 线程 */
 arch_call_rest_init();

 prevent_tail_call_optimization();
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/560568.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32 Simulink 自动代码生成电机控制——记录一次电机初始位置检测及NS极的判断实验

目录 前言 基本原理 仿真实现 代码生成及开发板验证 前言 之前做了脉振高频注入的仿真到代码生成开发板运行的实验&#xff0c;电机可以通过高频注入计算出角度&#xff0c;但是在初始位置检测的时候&#xff0c;尝试了不少方法但是效果一般&#xff0c;很容易反转&#xff…

服务器模型 setsockopt 网络超时检测 广播组播和unix域套接字 5.23

四.服务器模型 1.循环服务器 TCP服务器 TCP服务器端运行后等待客户端的连接请求。 TCP服务器接受一个客户端的连接后开始处理&#xff0c;完成了客户的所有请求后断开连接。 TCP循环服务器一次只能处理一个客户端的请求。 只有在当前客户的所有请求都完成后&#xff0c;服务…

Lucene(6):分词器

1 分词理解 在对Document中的内容进行索引之前&#xff0c;需要使用分词器进行分词 &#xff0c;分词的目的是为了搜索。分词的主要过程就是先分词后过滤。 分词&#xff1a;采集到的数据会存储到document对象的Field域中&#xff0c;分词就是将Document中Field的value值切分…

netty学习第一课

技术主题 Netty是一个基于Java NIO&#xff08;非阻塞 I/O&#xff09;框架的网络编程框架。它提供了一系列的高级网络编程API&#xff0c;使得开发者可以非常容易地实现高性能、高可靠性的网络应用。Netty具有非常好的可扩展性和灵活性&#xff0c;能够很好地支持多种协议和数…

Fiddler抓包工具之fiddler的介绍及安装

Fiddler简介 Fiddler是比较好用的web代理调试工具之一&#xff0c;它能记录并检查所有客户端与服务端的HTTP/HTTPS请求&#xff0c;能够设置断点&#xff0c;篡改及伪造Request/Response的数据&#xff0c;修改hosts&#xff0c;限制网速&#xff0c;http请求性能统计&#xff…

从零实现一个数据库(DataBase) Go语言实现版 7.空闲列表: 重用页

英文源地址 由于我们的B树时不可变的, 每次对kv存储的更新都会在路径上创建新节点, 而不是更新当前节点, 从而使一些节点无法从最新版本访问到.我们需要从旧版本中重用这些不可访问的节点, 否则, 数据库文件将无限增长. 设计空闲列表 为了重用这些页, 我们将添加一个持久化存…

python处理字符串、文本实例及注释

1、多个界定符切割字符串 代码 line = asdf fjdk; afed, fjek,asdf, foo import re re.split(r[;,\s]\s*, line) 结果 在上面的例子中,分隔符可以是逗号,分号或者是空格,并且后面紧跟着任意个的空格。只要这个模式被找到,那么匹配的分隔符两边的实体都会被当成是结果中…

面了个20k的自动化测试,从腾讯出来的果然都有两把刷子···

现在找个会自动化测试的人真是难呀&#xff0c;10个里面有8个写了会自动化&#xff0c;但一问就是三不知 公司前段时间缺人&#xff0c;也面了不少测试&#xff0c;前面一开始瞄准的就是中级的水准&#xff0c;也没指望来大牛&#xff0c;提供的薪资在15-20k&#xff0c;面试的…

技巧:如何查看github的热门趋势和star排行

目录 1. 查看github的热门趋势2. 查看github的star排行3. 如何查看项目star增长曲线 1. 查看github的热门趋势 手动找到入口&#xff0c;打开github&#xff0c;登录后&#xff0c;找到Explore并点击进入&#xff0c;找到Trending切换&#xff0c;列出的就是github当天所有语言…

目标检测常用模型之R-CNN、Fast R-CNN、Faster R-CNN

文章目录 一、模型分类1. 一阶段目标检测2. 二阶段目标检测 二、常见模型1. R-CNN2. Fast R-CNN3. Faster R-CNN 一、模型分类 2012年卷积神经网络(Convolutional Neural Networks, CNNs)的兴起将目标检测领域推向了新的台阶。基于CNNs的目标检测算法主要有两条技术发展路线&am…

国外顶尖高校、企业分享人工智能自学课程英文原课程分享

人工智能无疑已经是当下最火热的方向&#xff0c;在很多领域已经融入我们生活&#xff0c;ChatGPT,Midjourney只是其中一个细分热点。目前这个领域&#xff0c;虽说国内也有不少课程&#xff0c;但是大部分源头还得从英文资料中找。如何学到最新最强得人工智能技能&#xff0c;…

Mongodb——快速入门,2个小时足够了

目录 1、Mongodb概述 1.1、为何使用Mongodb&#xff1f; 1.2、业务应用场景 1.3、Mongodb和MySQL的区别 2、Mongodb安装 2.1、Windows系统中安装启动 3、Mongodb的操作 3.1、数据库操作 3.2、集合操作 3.2.1、集合显式创建 3.2.2、集合的隐式创建 3.2.3集合的删除 …

k8s进阶3——资源配额、资源限制

文章目录 一、基本了解1.1 资源计算1.2 调度机制1.3 服务质量等级 二、资源配额 ResourceQuota2.1 支持的限制资源2.2 配额作用域2.3 资源配额选型2.3.1 计算资源配额2.3.2 存储资源配额2.3.3 对象数量配额 三、资源限制 LimitRange3.1 限制资源大小值3.2 设置限制默认值3.3 限…

buu [NPUCTF2020]共 模 攻 击 1

题目描述: task: hint: 题目分析&#xff1a; 先看hint(提示)这一部分&#xff0c;标题已经提示了是共模攻击&#xff0c;看到有e1,e2,c1,c2,n也可以想到是共模攻击&#xff0c;之后得到c&#xff0c;继续往下做 此时有点不知如何下手&#xff0c;e 256 并且 gcd(e // 4,p…

接口测试工具Postman接口测试图文教程(超详细)

目录 一、前言 二、Postman安装和使用 三、请求方式 四、资金记录接口实例演示 一、前言 在前后端分离开发时&#xff0c;后端工作人员完成系统接口开发后&#xff0c;需要与前端人员对接&#xff0c;测试调试接口&#xff0c;验证接口的正确性可用性。而这要求前端开发进度…

games103——作业4

实验四主要使用 Shallow Wave 模拟流体 完整项目已上传至github。 文章目录 Height Feild(高度场)更新高度场更新速度场 Shallow Wave EquationDiscretization(离散化)一阶导数二阶导数 Discretized Shallow Wave EquationSolution 1Solution 2Pressure(压强)Viscosity(粘滞) 算…

​性能测试基础——性能测试方案

前面所说的测试分析等准备工作实际上最终目的是制定测试方案&#xff0c;测试方案一般包括&#xff1a; 项目的简要说明、项目系统结构、项目的业务结构、以及项目的性能需求、测试环境数据以及测试策略方法、测试案例、测试人员进度安排以及测试风险预估等等。 下面是一个一般…

FreeRTOS创建静态任务教程及所遇到的问题解决方法

静态任务和动态任务的区别 相对于动态任务&#xff0c;静态任务不需要动态分配内存&#xff0c;而是手动指定一个静态内存缓冲区&#xff0c;并在任务生命周期中一直使用该缓冲区。这可以避免动态内存分配时可能出现的内存碎片和内存泄漏问题&#xff0c;提高了系统的稳定性。…

【Python lxml、BeautifulSoup和html.parser区别介绍】零基础也能轻松掌握的学习路线与参考资料

区别介绍 &#xff08;1&#xff09;lxml lxml是Python的一个XML解析库&#xff0c;它基于libxml2和libxslt库构建&#xff0c;可以读取、操作和输出XML文档。lxml具有很强的性能和稳定性&#xff0c;在处理较大的XML文件时表现尤佳&#xff0c;并且支持XPath、CSS选择器等高…

PHP复习资料(未完待续)

&#xff08;未完待续&#xff0c;请持续关注此板块&#xff09; 【计科三四】雪课堂PHP期末模拟题&#xff1a;https://ks.wjx.top/vm/tUAmjxq.aspx# 【计科一二】PHP第一章练习题 https://ks.wjx.top/vm/QnjHad4.aspx# 【计科一二】PHP第二章练习题 https://ks.wjx.top/vm/h2…