概述
- 在生产环境下,为了提高页面加载性能,构建工具一般将项目的代码打包(bundle)到一
起,这样上线之后只需要请求少量的 JS 文件,大大减少 HTTP 请求。当然,Vite 也不例
外,默认情况下 Vite 利用底层打包引擎 Rollup 来完成项目的模块打包。 - 某种意义上来说,对线上环境进行项目打包是一个必须的操作。但随着前端工程的日渐复
杂,单份的打包产物体积越来越庞大,会出现一系列应用加载性能问题,而代码分割可以
很好地解决它们。 - 我们看下 Code Splitting 解决了单产物打包模式下的哪些问题,然后用具体的项目示例体验一下 Vite 默认自带的 CodeSplitting 效果。
- 从中,你将了解到 Vite 的默认分包策略,以及底层所使用的 Rollup 拆包 API—— munaulChunks
- 当然,在实际的项目场景中,只用 Vite 默认的策略是不够的,我们会更深入一步,学习Rollup 底层拆包的各种高级姿势,实现自定义拆包,同时我也会带大家通过实际案例复现 Rollup 自定义拆包经常遇到的坑—— 循环引用 问题,分析问题出现的原因
- 需要注意的是,bundle 、 chunk 、 vendor 这些构建领域的专业概念
- bundle 指的是整体的打包产物,包含 JS 和各种静态资源
- chunk 指的是打包后的 JS 文件,是 bundle 的子集
- vendor 是指第三方包的打包产物,是一种特殊的 chunk
Code Splitting 解决的问题
- 在传统的单 chunk 打包模式下,当项目代码越来越庞大,最后会导致浏览器下载一个巨
大的文件,从页面加载性能的角度来说,主要会导致两个问题:- 无法做到按需加载,即使是当前页面不需要的代码也会进行加载
- 线上缓存复用率极低,改动一行代码即可导致整个 bundle 产物缓存失效
- 首先说第一个问题,一般而言,一个前端页面中的 JS 代码可以分为两个部分: Initital Chunk 和 Async Chunk ,前者指页面首屏所需要的 JS 代码,而后者当前页面并不一定需要,一个典型的例子就是 路由组件 ,与当前路由无关的组件并不用加载。
- 而项目被打包成单 bundle 之后,无论是 Initial Chunk 还是 Async Chunk ,都会打包进同一个产物,也就是说,浏览器加载产物代码的时候,会将两者一起加载,导致许多冗余的加载过程,从而影响页面性能。而通过 Code Splitting 我们可以将按需加载的代码拆分出单独的chunk,这样应用在首屏加载时只需要加载 Initial Chunk 即可,避免了冗余的加载过
程,使页面性能得到提升。 - 其次,线上的 缓存命中率 是一个重要的性能衡量标准。对于线上站点而言,服务端一般在
响应资源时加上一些 HTTP 响应头,最常见的响应头之一就是 cache-control ,它可以指
定浏览器的强缓存,比如设置为下面这样:cache-control: max-age=31536000
- 表示资源过期时间为一年,在过期之前,访问相同的资源 url,浏览器直接利用本地的缓
存,并不用给服务端发请求,这就大大降低了页面加载的网络开销。不过,在单 chunk 打包模式下面,一旦有一行代码变动,整个 chunk 的 url 地址都会变化,比如下图所示的场景
- 由于构建工具一般会根据产物的内容生成哈希值,一旦内容变化就会导致整个 chunk 产 物的强缓存失效,所以单 chunk 打包模式下的缓存命中率极低,基本为零。
- 而进行 Code Splitting 之后,代码的改动只会影响部分的 chunk 哈希改动,如下图所示
-
入口文件引用了 A 、 B 、 C 、 D 四个组件,当我们修改 A 的代码后,变动的 Chunk 就只有 A 以及 依赖 A 的 Chunk 中,A 对应的 chunk 会变动,这很好理解,后者也会变动是因为相应的引入语句会变化,如这里的入口文件会发生如下内容变动:
import CompA from './A.d3e2f17a.js' // 更新 import 语句 import CompA from './A.a5d2f82b.js'
-
也就是说,在改动 A 的代码后, B 、 C 、 D 的 chunk 产物 url 并没有发生变化,从而可以让浏览器复用本地的强缓存,大大提升线上应用的加载性能
Vite 默认拆包策略
-
刚刚我们说到了为什么要进行拆包,实际上 Vite 中已经内置了一份拆包的策略,接下来让我们来看看 Vite 默认的拆包模式是怎样的。
-
在生产环境下 Vite 完全利用 Rollup 进行构建,因此拆包也是基于 Rollup 来完成的,但Rollup 本身是一个专注 JS 库打包的工具,对应用构建的能力还尚为欠缺,Vite 正好是补足了 Rollup 应用构建的能力,在拆包能力这一块的扩展就是很好的体现。
-
Vite 2.9 之前的版本, 在初始化一个项目后,执行 $
npm run build
,接着终端会出现如下的构建信息: -
下产物的结构
. ├── assets │ ├── Dynamic.3df51f7a.js // Async Chunk │ ├── Dynamic.f2cbf023.css // Async Chunk (CSS) │ ├── favicon.17e50649.svg // 静态资源 │ ├── index.1e236845.css // Initial Chunk (CSS) │ ├── index.6773c114.js // Initial Chunk │ └── vendor.ab4b9e1f.js // 第三方包产物 Chunk └── index.html // 入口 HTML
-
一方面 Vite 实现了自动 CSS 代码分割的能力,即实现一个 chunk 对应一个 css 文件,比如上面产物中 index.js 对应一份 index.css ,而按需加载的 chunk Danamic.js 也对应单独的一份 Danamic.css 文件,与 JS 文件的代码分割同理,这样做也能提升 CSS 文件的缓存复用率。
-
而另一方面, Vite 基于 Rollup 的 manualChunks API 实现了应用拆包的策略:
- 对于 Initital Chunk 而言,业务代码和第三方包代码分别打包为单独的 chunk,在上述的例子中分别对应 index.js 和 vendor.js 。需要说明的是,这是 Vite 2.9 版本之前的做法,而在 Vite 2.9 及以后的版本,默认打包策略更加简单粗暴,将所有的 js代码全部打包到 index.js 中
- 对于 Async Chunk 而言 ,动态 import 的代码会被拆分成单独的 chunk,如上述的 Dynacmic 组件
-
小结一下,Vite 默认拆包的优势在于实现了 CSS 代码分割与业务代码、第三方库代码、动态 import 模块代码三者的分离,但缺点也比较直观,第三方库的打包产物容易变得比较臃肿,上述例子中的 vendor.js 的大小已经达到 500 KB 以上,显然是有进一步拆包的优化空间的,这个时候我们就需要用到 Rollup 中的拆包 API —— manualChunks 了。
自定义拆包策略
-
针对更细粒度的拆包,Vite 的底层打包引擎 Rollup 提供了 manualChunks ,让我们能自定义拆包策略,它属于 Vite 配置的一部分,示例如下:
// vite.config.ts export default { build: { rollupOptions: { output: { // manualChunks 配置 manualChunks: {}, }, } }, }
-
manualChunks 主要有两种配置的形式,可以配置为一个对象或者一个函数。我们先来看看对象的配置,也是最简单的配置方式,你可以在上述的示例项目中添加如下的 manualChunks 配置代码
// vite.config.ts { build: { rollupOptions: { output: { // manualChunks 配置 manualChunks: { // 将 React 相关库打包成单独的 chunk 中 'react-vendor': ['react', 'react-dom'], // 将 Lodash 库的代码单独打包 'lodash': ['lodash-es'], // 将组件库的代码打包 'library': ['antd', '@arco-design/web-react'], }, }, } }, }
-
在对象格式的配置中, key 代表 chunk 的名称, value 为一个字符串数组,每一项为第三方包的包名。
-
在进行了如上的配置之后,我们可以执行 npm run build 尝试一下打包:
-
你可以看到原来的 vendor 大文件被拆分成了我们手动指定的几个小 chunk,每个chunk 大概 200 KB 左右,是一个比较理想的 chunk 体积。这样,当第三方包更新的时候,也只会更新其中一个 chunk 的 url,而不会全量更新,从而提高了第三方包产物的缓存命中率。
-
除了对象的配置方式之外,我们还可以通过函数进行更加灵活的配置,而 Vite 中的默认拆包策略也是通过函数的方式来进行配置的,我们可以在 Vite 的实现中瞧一瞧:
// Vite 部分源码 function createMoveToVendorChunkFn(config: ResolvedConfig): GetManualChunk { const cache = new Map < string, boolean > () // 返回值为 manualChunks 的配置 return (id, { getModuleInfo }) => { // Vite 默认的配置逻辑其实很简单 // 主要是为了把 Initial Chunk 中的第三方包代码单独打包成`vendor.[hash].js` if ( id.includes('node_modules') && !isCSSRequest(id) && // 判断是否为 Initial Chunk staticImportedByEntry(id, getModuleInfo, cache) ) { return 'vendor' } } }
-
Rollup 会对每一个模块调用 manualChunks 函数,在 manualChunks 的函数入参中你可以拿到 模块 id 及 模块详情信息 ,经过一定的处理后返回 chunk 文件的名称 ,这样当前 id 代表的模块便会打包到你所指定的 chunk 文件中。我们现在来试着把刚才的拆包逻辑用函数来实现一遍:
manualChunks(id) { if (id.includes('antd') || id.includes('@arco-design/web-react')) { return 'library'; } if (id.includes('lodash')) { return 'lodash'; } if (id.includes('react')) { return 'react'; } }
-
打包后结果如下:
-
看上去好像各个第三方包的 chunk (如 lodash 、 react 等等)都能拆分出来,但实际上你可以运行 npx vite preview 预览产物,会发现产物根本没有办法运行起来,页面出现白屏,同时控制台出现如下的报错:
-
这也就是函数配置的坑点所在了,虽然灵活而方便,但稍不注意就陷入此类的产物错误问题当中。
-
那上面的这个报错究竟是什么原因导致的呢?
解决循环引用问题
-
从报错信息追溯到产物中,可以发现 react-vendor.js 与 index.js 发生了循环引用:
// react-vendor.e2c4883f.js import { q as objectAssign } from "./index.37a7b2eb.js"; // index.37a7b2eb.js import { R as React } from "./react-vendor.e2c4883f.js";
-
这是很典型的 ES 模块循环引用的场景,我们可以用一个最基本的例子来复原这个场景:
// a.js import { funcB } from './b.js'; funcB(); export var funcA = () => { console.log('a'); } // b.js import { funcA } from './a.js'; funcA(); export var funcB = () => { console.log('b') }
-
接着我们可以执行一下 a.js 文件
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> </head> <body> <script type="module" src="/a.js"></script> </body> </html>
-
在浏览器中打开会出现类似的报错
-
代码的执行原理如下:
- JS 引擎执行 a.js 时,发现引入了 b.js ,于是去执行 b.js
- 引擎执行 b.js ,发现里面引入了 a.js (出现循环引用),认为 a.js 已经加载完成,继续往下执行
- 执行到 funcA() 语句时发现 funcA 并没有定义,于是报错
-
而对于如上打包产物的执行过程也是同理
-
可能你会有疑问: react-vendor 为什么需要引用 index.js 的代码呢?其实也很好理解,我们之前在 munaulChunks 中仅仅将路径包含 react 的模块打包到 react-vendor 中,殊不知,像 object-assign 这种 react 本身的依赖并没有打包进 react-vendor 中,而是打包到另外的 chunk 当中,从而导致循环依赖关系
-
那我们能不能避免这种问题呢?当然是可以的,之前的 manualChunks 逻辑过于简单粗暴,仅仅通过路径 id 来决定打包到哪个 chunk 中,而漏掉了间接依赖的情况。如果针对像 object-assign 这种间接依赖,我们也能识别出它属于 react 的依赖,将其自动打包到 react-vendor 中,这样就可以避免循环引用的问题。我们来梳理一下解决的思路
- 确定 react 相关包的入口路径。
- 在 manualChunks 中拿到模块的详细信息,向上追溯它的引用者,如果命中 react 的路径,则将模块放到 react-vendor 中
-
接下来让我们进行实际代码的实现
// 确定 react 相关包的入口路径 const chunkGroups = { 'react-vendor': [ require.resolve('react'), require.resolve('react-dom') ], } // Vite 中的 manualChunks 配置 function manualChunks(id, { getModuleInfo }) { for (const group of Object.keys(chunkGroups)) { const deps = chunkGroups[group]; if ( id.includes('node_modules') && // 递归向上查找引用者,检查是否命中 chunkGroups 声明的包 isDepInclude(id, deps, [], getModuleInfo) ) { return group; } } }
-
实际上核心逻辑包含在 isDepInclude 函数,用来递归向上查找引用者模块:
// 缓存对象 const cache = new Map(); function isDepInclude (id: string, depPaths: string[], importChain: string[], getModuleInfo): boolean | undefined { const key = `${id}-${depPaths.join('|')}`; // 出现循环依赖,不考虑 if (importChain.includes(id)) { cache.set(key, false); return false; } // 验证缓存 if (cache.has(key)) { return cache.get(key); } // 命中依赖列表 if (depPaths.includes(id)) { // 引用链中的文件都记录到缓存中 importChain.forEach(item => cache.set(`${item}-${depPaths.join('|')}`, true)); return true; } const moduleInfo = getModuleInfo(id); if (!moduleInfo || !moduleInfo.importers) { cache.set(key, false); return false; } // 核心逻辑,递归查找上层引用者 const isInclude = moduleInfo.importers.some( importer => isDepInclude(importer, depPaths, importChain.concat(id), getModuleInfo) ); // 设置缓存 cache.set(key, isInclude); return isInclude; };
-
对于这个函数的实现,有两个地方需要大家注意:
- 我们可以通过 manualChunks 提供的入参 getModuleInfo 来获取模块的详情 moduleInfo ,然后通过 moduleInfo.importers 拿到模块的引用者,针对每个引用者又可以递归地执行这一过程,从而获取引用链的信息。
- 尽量使用缓存。由于第三方包模块数量一般比较多,对每个模块都向上查找一遍引用链会导致开销非常大,并且会产生很多重复的逻辑,使用缓存会极大加速这一过程。
-
完成上述 manualChunks 的完整逻辑后,现在我们来执行 $
npm run build
来进行打包: -
可以发现 react-vendor 可以正常拆分出来,查看它的内容:
-
从中你可以看出 react 的一些间接依赖已经成功打包到了 react-vendor 当中,执行 $
npx view preview
预览产物页面也能正常渲染了: -
说明循环依赖的问题已经被我们解决掉了
终极解决方案
- 尽管上述的解决方案已经能帮我们正常进行产物拆包,但从实现上来看,还是显得略微繁琐,那么有没有开箱即用的拆包方案,能让我们直接用到项目中呢?
- 答案是肯定的,接下来我就给大家介绍 Vite 自定义拆包的终极解决方案—— viteplugin-chunk-split 。
首先安装一下这个插件: $pnpm i vite-plugin-chunk-split -D
- 然后你可以在项目中引入并使用:
// vite.config.ts import { chunkSplitPlugin } from 'vite-plugin-chunk-split'; export default { chunkSplitPlugin({ // 指定拆包策略 customSplitting: { // 1. 支持填包名。`react` 和 `react-dom` 会被打包到一个名为`render-vendor`的 chunk 里面(包括它们的依赖,如 object-assign) 'react-vendor': ['react', 'react-dom'], // 2. 支持填正则表达式。src 中 components 和 utils 下的所有文件被会被打包为`component-util`的 chunk 中 'components-util': [/src\/components/, /src\/utils/] } }) }
- 相比于手动操作依赖关系,使用插件只需几行配置就能完成,非常方便。
- 当然,这个插件还可以支持多种打包策略,包括 unbundle 模式打包
- 更多参考文档:vite-plugin-chunk-split