iOS——APP启动流程

news2025/1/9 1:50:29

APP启动

APP启动主要分为两个阶段:pre-main和main之后,而APP的启动优化也主要是在这两个阶段进行的。
main之后的优化:1. 减少不必要的任务,2.必要的任务延迟执行,例如放在控制器界面等等。

APP启动的大致过程:
APP启动 -> 加载libSystem -> Runtime注册回调函数 -> 加载image(镜像文件) -> 执行map_images和load_images方法 -> 调用main函数。

查看pre-main耗时,添加DYLD_PRINT_STATISTICS到(Edit Scheme -> Run -> Arguments -> Environment Variables)就可以在控制台看到耗时

缺页错误

我们应该知道:任何程序能运行都是因为存在物理内存,也就是说,程序加入到物理内存才能得以运行,也就是虚拟内存映射到物理内存。这个过程是个使用懒加载方式完成系统到CPU的交互(翻译)的过程。
而这个过程因为懒加载映射方式的缘故,它是“有多少拿多少”,所以我们会通过一页一页的方式也就是page的方式去加载的,iOS的页的大小是16kb,而macOS是4kb。
也是因为是懒加载的方式,所以如果需要用到的时候发现物理内存中没有,就会报出“page fault”的缺页错误,然后缺的页会再加载放入物理内存。这个过程很短,可能30ms,也可能是10ms。

pre-main(main函数前)

pre-main 指的是在程序的 main() 函数执行之前进行的一些初始化工作。这个过程发生在程序的启动阶段,具体是在操作系统加载可执行文件后,调用 main() 函数之前。
例如:加载我们需要的库啊,系统自己调用加载一些依赖库啊,加载类到内存中去啊,加载分类方法并插入到类的方法列表中啊等等

二进制重排

二进制重排是一种优化应用启动性能的技术。它的核心思想是通过重新排列二进制文件中的函数顺序,使得在应用启动时需要频繁调用的函数被排列在一起,从而减少缺页错误(page fault)并加快启动速度。
比如说,当我们启动APP时,就会需要加载很多的页,正常都会有几千页,虽然一页耗时少,但是那个时刻要加载那么多页数,耗时会更长了。我们可以根据InstrumentsSystem Trace找到Main Thread进行查看应用的page in也就是启动加载页数。苹果自用了二进制重排方案就可以优化这个的耗时,例如抖音的二进制重排,怎么找到所有的函数加载,将不必须在前面执行的函数放在后面。

二进制重排的难点

难点在于如何获取并确定这些函数的顺序。

二进制重排的流程

二进制重排流程

  1. 应用程序的启动时刻所加载的顺序是按照Build Phases的Compile Sources的顺序
  2. 去Build Settings中搜索 Write Link Map File设置为YES,就是写入。然后就是Path to Link Map File的地址。
  3. 找到build里面的txt格式的文件,如果是模拟器则为x86_64结尾的。这个就是现在的执行顺序
  4. 打开终端,cd到目录下创建order文件,例如:touch test.order
  5. 将你想要排序的函数依次写进去,然后再在Build Settings中的Order File的路径填写为test.order的文件路径,最后编译一下。

dyld、动态链接器

dyld在各种库加载映射到内存中去起到了至关重要的作用。
我们要研究dyld从APP启动到进入main函数究竟是怎么做的?

dyld流程剖析

我们看这个流程是为了看APP启动到main函数前,也就是dyld是如何将images(镜像文件:如动静态库等)链接到内存中去的。而在objc_init的时候是做了什么操作去调起dyld,以及dyld又如何回调至objc中。

我们根据查看底层的调用栈显示+load方法的调用流程为:_dyld_start->dyldbootstrap::start->dyld::_main->dyld::initializeMainExecutable->ImageLoader::runInitializers->ImageLoader::processInitializers->ImageLoader::recursiveInitialization->dyld::notifySingle->load_images->+[ViewController load]

_dyld_start

_dyld_start是启动时的入口点,它是用汇编语言实现的。
最主要的就是调用start方法,以及dyld层加载结束后调用我们的main方法。
这个函数的主要作用是调用dyldbootstrap::start函数。

dyldbootstrap::start

这个函数也是中间过程,不必知道详细,只知道通过这个函数调用到dyld::_main函数了。

dyld::_main (重要

到这里已经是dyld重中之重了,这个函数的代码行数为849近1000行代码。其实上面的函数调用栈的最大作用也就是引导我们到这里。而这里也大概就是dyld的执行流程了,包括主程序的实例化再到通知进入程序的main函数这个过程。

_main做的事:
第一步:设置运行环境。
第二步:加载共享缓存。
第三部:dyld2/dyld3(ClosureMode闭包模式)加载程序。
第四步:实例化主程序。
第五步:加载插入动态库。
第六步:链接主程序和动态库。
第七步:弱绑定主程序。
第八步:执行初始化。
第九步:返回main函数。

大致流程总结

  1. 条件准备:环境,平台,版本,路径,主机信息等等;
  2. 确定是否有共享缓存并去加载(一般是非模拟器情况)
  3. 载入GDB调试器通知。(老版本的不重要,没用,不知道这个名词没关系)
  4. 添加dyld到UUID列表中,启用堆栈符号化。(没用,不需要知道)
  5. 实例化主程序,instantiateFromLoadedImage(镜像文件加载器,就是以mach-o的header方式加载主程序镜像。)
  6. 加载任何插入的库,(使用loadInsertedDylib)
  7. link(链接)主程序
  8. link 镜像文件(前面插入的库)
  9. 弱引用绑定主程序
  10. (最重要)运行所有初始化的程序。(使用initializeMainExecutable)
  11. 通知dyld可以进入main函数了。(使用notifyMonitoringDyldMain)

初始化流程源码剖析

initializeMainExecutable和runInitializers和processInitializers

我们可以根据上面的调用栈的顺序知道,dyld::_main之后调用的就是dyld::initializeMainExecutable,同时根据上面的流程知道这一步也是最重要的一步,但是实际上这段代码和runInitializersprocessInitializers只是起到中间作用,它们最终调用的recursiveInitialization 才是我们真正重要的一步。

recursiveInitialization
void ImageLoader::recursiveInitialization(const LinkContext& context, mach_port_t this_thread, const char* pathToInitialize,
                                          InitializerTimingList& timingInfo, UninitedUpwards& uninitUps)
{
……
    if ( fState < dyld_image_state_dependents_initialized-1 ) {
        uint8_t oldState = fState;
        // break cycles
        fState = dyld_image_state_dependents_initialized-1;
        try {
            // initialize lower level libraries first
            // 优先初始化依赖的底层的库
            for(unsigned int i=0; i < libraryCount(); ++i) {
                ImageLoader* dependentImage = libImage(i);
                if ( dependentImage != NULL ) {
……
                    else if ( dependentImage->fDepth >= fDepth ) {
                        //依赖文件递归初始化
                        dependentImage->recursiveInitialization(context, this_thread, libPath(i), timingInfo, uninitUps);
                    }
                }
            }       
……
            fState = dyld_image_state_dependents_initialized;
            oldState = fState;
            //这里调用传递的状态是dyld_image_state_dependents_initialized,image传递的是自己。也就是最后调用了自己的+load。从libobjc.A.dylib开始调用。
            context.notifySingle(dyld_image_state_dependents_initialized, this, &timingInfo);
            
            // initialize this image
            //初始化镜像文件,调用c++构造函数。libSystem的libSystem_initializer就是在这里调用的。会调用到objc_init中。_dyld_objc_notify_register 中会调用自身的+load方法,然后c++构造函数。
            //1.调用libSystem_initializer->objc_init 注册回调。
            //2._dyld_objc_notify_register中调用 map_images,load_images,这里是首先初始化一些系统库,调用系统库的load_images。比如libdispatch.dylib,libsystem_featureflags.dylib,libsystem_trace.dylib,libxpc.dylib。
            //3.自身的c++构造函数
            bool hasInitializers = this->doInitialization(context);

            // let anyone know we finished initializing this image
            fState = dyld_image_state_initialized;
            oldState = fState;
            //这里调用不到+load方法。 notifySingle内部fState==dyld_image_state_dependents_initialized 才调用+load。
            context.notifySingle(dyld_image_state_initialized, this, NULL);
……
        }
……
    }
    recursiveSpinUnLock();
}

程序需要初始化的动态库image是从libImage()中获取,而libImage()的数据是在链接动态库的时recursiveLoadLibraries中的setLibImage保存的image
整个过程是一个递归的过程,先初始化最底层的依赖库,再逐步初始化到自己。
**调用notifySingle最终调用到了objc中所有的+load方法。**这里第一个notifySingle调用的是+load方法,第二个notifySingle由于参数是dyld_image_state_initialized不会调用到+load方法。这里的dyld_image_state_dependents_initialized意思是依赖文件初始化完毕了,可以初始化自己了。
调用doInitialization最终调用了c++的系统构造函数。先调用的是libSystem_initializer -> objc_init进行注册回调。在回调中调用了map_imagesload_images(+load)。这里的load_images是调用一些加载一些系统库,比如:libdisp

notifySingle

notifySingle是一个函数指针,在setContext函数里赋值。

map_images与load_images什么时候调用

因为每个镜像文件的加载时机我们是不知道的,所以当镜像文件加载完毕后得有个回调(下句柄)告诉其处理完毕,接下来dyld得需要有个状态去标识,所以我们必须要用notifySingle进行通知。

map_images :镜像文件的加载,引出read_images。该方法很重要
load_images :load方法的加载

map_images 是在notifyBatchPartial调用的,也就是注册完通知就立马去调用。
load_images 是在notifySingle调用。

请添加图片描述

dyld3或dyld2(ClosureMode闭包模式)加载程序

iOS11引入dyld3闭包模式,以回调的方式加载,闭包模式加载速度更快,效率更高。iOS13后动态库和三方库都使ClosureMode加载。
dyld2和dyld3的调用是在dyld::_main函数中的

dyld3:

使用mainClosure来加载。
找到/创建mainClosure后,通过launchWithClosure启动主程序,启动失败后会有重新创建mainClosure重新启动的逻辑。成功后返回result(主程序入口main函数)。launchWithClosure中的逻辑和dyld2启动主程序逻辑基本相同。

dyld2:启动主程序

实例化主程序instantiateFromLoadedImagesMainExecutable 是通过instantiateFromLoadedImage赋值的,也就是把主程序加入allImages中。
插入&加载动态库 loadInsertedDylib。加载在loadInsertedDylib中调用load(主程序和动态库都会添加到allImagesloadAllImages
链接主程序和链接插入动态库(link,主程序链接在前)。在这个过程中记录了dyld加载的时长。可以通过配置环境变量打印出来。
绑定符号(非懒加载、弱符号),懒加载在调用时绑定。
初始化主程序initializeMainExecutable,这个时候还没有执行到主程序中的代码。
找到主程序入口 LC_MAIN(main函数),然后返回主程序。

1.1 动态库和静态库的认识


1.1.1 介绍

库是已写好的、供开发者使用的可复用代码,每个程序都要依赖很多基础的底层库。从本质上,库是一种可执行代码的二进制形式。可以被操作系统载入内存执行。库分为两种:静态库(.a .lib)和 动态库 (framework .so .dll)。 .a是纯二进制文件,.framework中除了有二进制文件外还有资源文件,.a文件不能直接使用,至少需要.h文件配合,而.framework可以直接使用。 .a + .h + sourceFile = .framework

所谓静态和动态是指链接过程,动静态是相对于编译期和运行期的,静态库在程序编译时会被链接到目标代码中,程序运行时将不再需要载入静态库。而动态库在程序编译时并不会被链接到目标代码中,只是在程序运行时才被载入,因为在程序运行期间还需要动态库的存在。

1.1.2 静态库

在链接阶段,会将汇编生成的目标文件.o 与 引用的库一起链接到可执行文件中。对应的链接方式称为 静态链接。 静态库中的所有指令都会包含进最终生成的文件中,静态库不能再包含其他的动态库或静态库,在动态链接库中还可以再包含其他的动态或静态链接库。

静态库.png

如果多个进程需要引用到【静态库】,在内存中就会存在多份拷贝,如上图中进程1 用到了静态库1、5,进程2也用到了静态库1、5,那么静态库1、5在编译期就分别被链接到了进程1和进程2中,假设静态库1占用2M内存,如果有20个这样的进程需要用到静态库1,将占用40M的空间。

特点:

  • 静态库对函数库的链接是在编译期完成的。执行期间代码装载速度快。
  • 使可执行文件变大,浪费空间和资源(占空间)
  • 程序的更新、部署与发布不方便,需要全量更新。如果 某一个静态库更新了,所有使用它的应用程序都需要重新编译、发布给用户。

优缺点: 优点:编译完成后,库文件实际上就没有作用了,目标程序没有外部依赖 缺点:由于静态库会存在多分,所以会导致目标程序的体积增大,对内存、性能、速度消耗很大

1.1.3 动态库

动态库在程序构建时并不会链接到目标代码中,而是在运行时才被载入,不同的应用程序如果调用相同的库,那么在内存中只需要有一份该共享库的实例,避免了空间浪费问题。同时也解决了静态库对程序的更新的依赖,用户只需更新动态库即可。

理解:

  • 动态库包含一些可供应用程序或其他动态链接库调用的函数
  • 在应用程序调用一个动态链接库里面的函数的时候,操作系统会将动态链接库的文件映射到进程的地址空间中,这样进程中所有的线程就可以调用动态链接库中的函数了
  • 动态链接库加载完成后,并没有将代码编译到可执行文件中,这个时候动态链接库对于进程来说只是一些被放在地址进程空间附加的代码和数据
  • 动态库在内存中只有一个,操作系统也只会加载一次到内存中。只是针对不同的进程进行各自的映射
  • 代码段在内存中的权限都是只读的,所以多个程序虽然使用同一个动态库,但是并不会修改源代码
  • 动态函数库的名字一般是libxxx.so,相对于静态函数库,动态函数库在编译的时候并没有被编译进目标代码中,你的程序执行到相关函数时才调用该函数库里的相应函数,因此动态函数库所产生的可执行文件比较小。由于函数库没有被整合进你的程序,而是程序运行时动态的申请并调用,所以程序的运行环境中必须提供相应的库。动态函数库的改变并不影响你的程序,所以动态函数库的升级比较方便。

动态库.png

  • 【动态库】在内存中只存在一份拷贝,如果某一进程需要用到动态库,只需在运行时动态载入即可。

特点:

  • 动态库把对一些库函数的链接载入推迟到程序运行时期(占时间)。
  • 可以实现进程之间的资源共享。(因此动态库也称为共享库)
  • 将一些程序升级变得简单,不需要重新编译,属于增量更新。

优缺点:

优点:

  • 减少打包后APP的大小,因为不需要拷贝至目标程序中
  • 共享内存、节约资源,因为同一份库被多个程序使用
  • 通过更新动态库即可更新程序,因为不需要重新编译 缺点:
  • 动态库载入会带来一部分性能损失

注意:系统的.framework是动态库,自己建立的.framework是静态库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2111761.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

腾讯云 Spring Boot 安装 SSL 证书

linux和windows下&#xff0c;因为有ngxin&#xff0c;所以安装ssl证书都感觉比较容易&#xff0c;毕竟通过代理方式能够胜任大多数的https安全问题。 但是有些情况下&#xff0c;ngxin可能无法安装什么的&#xff0c;可能需要在spring boot下直接安装ssl&#xff0c;咋办&…

【漏洞复现】某客圈子社区小程序审计(0day)

0x00 前言 █ 纸上得来终觉浅,绝知此事要躬行 █ Fofa:"/static/index/js/jweixin-1.2.0.js"该程序使用ThinkPHP 6.0.12作为框架,所以直接审计控制器即可.其Thinkphp版本较高,SQL注入不太可能,所以直接寻找其他洞. 0x01 前台任意文件读取+SSRF 在 /app/api/c…

细致刨析JDBC ① 基础篇

“加油” 我已经说腻了&#xff0c;下次我要说&#xff1a;”祝你拥有随时停留和休息的底气“ —— 24.9.6 一、JDBC概述 1.JDBC的概念 JDBC&#xff1a;Java Database Connectivity&#xff0c;意为Java数据库连接 JDBC是Java提供的一组独立于任何数据库管理系统的API。 J…

单片机学习笔记

一、单片机帝国的诞生与发展 1.1 单片机的基本概念 单片机是一种集成电路芯片&#xff0c;采用超大规模的集成电路把具有数据处理功能的中央处理器存储器、输入输出端口、外围电路和相关外设集成在一块硅片上构成一个小而完整的微型计算机系统。 一般而言&#xff0c;单片机也…

项目7-音乐播放器7(测试报告)

1.项目背景 音乐播放器采用前后端分离的方法来实现&#xff0c;基于SSM框架构建&#xff0c;同时使用了数据库来存储相关的数据&#xff0c;同时将其部署到云服务器上。 用户可以轻松注册登录&#xff0c;浏览丰富的音乐库&#xff0c;搜索喜欢的歌曲。系统支持多种音频格式播…

44. 数字序列中某一位的数字

comments: true difficulty: 中等 edit_url: https://github.com/doocs/leetcode/edit/main/lcof/%E9%9D%A2%E8%AF%95%E9%A2%9844.%20%E6%95%B0%E5%AD%97%E5%BA%8F%E5%88%97%E4%B8%AD%E6%9F%90%E4%B8%80%E4%BD%8D%E7%9A%84%E6%95%B0%E5%AD%97/README.md 面试题 44. 数字序列中某…

超越传统:Reflection 70B如何革新AI语言处理

Reflection 70B&#xff1a;AI语言模型的新里程碑&#x1f680; AI领域迎来了革命性的变革&#xff0c;HyperWrite公司推出的开源AI大模型Reflection 70B&#xff0c;以其卓越的性能在多个基准测试中超越了GPT-4o和Llama 3.1。这款基于Meta的Llama 3.1 70B Instruct构建的模型…

electron 客户端 windows linux(麒麟V10)多系统离线打包 最新版 <二>

这节主要讲解以下 linux系统&#xff08;国产麒麟&#xff09;下&#xff0c;electron如何配置打包。 第一&#xff0c; 下载二进制包 和windows的一样&#xff0c;还是下载二进制包。只不过是linux版本的&#xff0c;千万不要下错了。 地址&#xff1a;CNPM Binaries Mirro…

大型视觉语言模型的有效性评估

原文地址&#xff1a;https://arxiv.org/abs/2403.04306 摘要&#xff1a;大型视觉语言模型&#xff08;LVLM&#xff09;的出现代表了通用人工智能的探索取得了显着的进步。然而&#xff0c;该模型在专业和一般任务中的有效性值得进一步研究。本文致力于评估流行的 LVLM 分别在…

Leetcode面试经典150题-210.课程表II

这个题是图的问题&#xff0c;因为图的拓扑排序在实际应用中有非常多的用途图&#xff0c;所以最近考的越来越多 解法都在代码里&#xff0c;不懂就留言或者私信 看这个题之前一定要好好看看207题我写的题解&#xff0c;也许207看懂了的话&#xff0c;210只是一个coding问题了…

集成电路学习:什么是RTC实时时钟

一、RTC&#xff1a;实时时钟 RTC&#xff0c;即实时时钟&#xff08;Real-Time Clock&#xff09;&#xff0c;是一种能够在设备中持续运行并准确记录时间的电子组件。它广泛应用于计算机、手机、嵌入式系统、智能家居设备等多种场合&#xff0c;为这些设备提供精确的时间基准…

利用 Redis 实现延迟队列(点赞场景)

&#x1f308;点赞场景在前段时间有很多人都在争论&#xff0c;我也看了一些视频和文档&#xff0c;最后觉得b站技术的这篇写得很好 【点个赞吧】 - B站千亿级点赞系统服务架构设计 - 哔哩哔哩 &#x1f308;所以我也尝试用 Redis 的延迟队列来写一个点赞处理的 demo&#xff0…

iOS——通知协议代理

通知 概要 观察者和被观察者都无需知晓对方&#xff0c;只需要通过标记在NSNotificationCenter中找到监听该通知所对应的类&#xff0c;从而调用该类的方法。并且在NSNotificationCenter中&#xff0c;观察者可以只订阅某一特定的通知&#xff0c;并对其做出相应操作&#xf…

《论多源数据集成及应用》写作框架,软考高级系统架构设计师

论文真题 在如今信息爆炸的时代,企业、组织和个人面临着大量的数据。这些数据来自不同的渠道和资源,包括传感器、社交媒体、销售记录等,它们各自具有不同的数据格式、分布和存储方式。因此如何收集、整理和清洗数据,以建立一个一致、完整的数据集尤为重要。多源数据集成可…

Leetcode 700-二叉搜索树中的搜索

给定二叉搜索树&#xff08;BST&#xff09;的根节点 root 和一个整数值 val。 你需要在 BST 中找到节点值等于 val 的节点。 返回以该节点为根的子树。 如果节点不存在&#xff0c;则返回 null 。 题解 如果root.val>val&#xff0c;则搜索左子树&#xff0c;如果roo…

finalshell 4.5.x在m1mac闪退

使用过程中会出现突然闪退&#xff0c;尤其在定位生产打开一堆窗口的情况下&#xff0c;绝绝子 闪退崩溃日志&#xff1a; Thread 116 Crashed:: Java: pool-4-thread-28 0 libsystem_kernel.dylib 0x18e926600 __pthread_kill 8 1 libsystem_pthread.dyl…

基于opencv实现双目立体匹配点云距离

双目相机或两个单目相机。 一、相机标定 MATLAB软件&#xff0c;打开双目标定app。 点击add images&#xff0c;弹出加载图像的窗口&#xff0c;分别导入左图和右图&#xff0c;设置黑白格长度&#xff08;标定板的长度一般为20&#xff09;。 点击确定&#xff0c;弹出加载…

ArrayList,LinkedList

ArrayList集合 底层原理 1.利用空参创建的集合&#xff0c;在底层创建一个默认长度为0的数组 2.添加第一个元素时&#xff0c;底层会创建一个新的长度为10的数组 3.存满时&#xff0c;会扩容1.5倍 4.如果一次添加多个元素&#xff0c;1.5倍还放不下&#xff0c;则新创建数…

【C++】list的使用与简单模拟实现

目录 1、list的介绍和使用&#xff1a; 1、结构&#xff1a; 2、接口函数&#xff1a; 迭代器遍历&#xff1a; 增删查改&#xff1a; 翻转与排序&#xff1a; 2、list的模拟实现&#xff1a; 1、节点的封装&#xff1a; 2、迭代器的封装&#xff1a; 3、list的模拟实…

Flutter中自定义气泡框效果的实现

在用户界面的设计中&#xff0c;气泡框&#xff08;Bubble&#xff09;是一种非常有效的视觉工具&#xff0c;它可以用来突出显示信息或提示用户。气泡框广泛应用于聊天应用、通知提示等场景。在 Flutter 中&#xff0c;虽然有很多现成的气泡框组件&#xff0c;但如果你想要更多…