系统设计中的缓存技术:完整指南

news2024/11/28 16:43:07

529b5f17f2b35b70c928fc96bef26f47.jpeg

Image.png

缓存是软件工程中用于提高系统性能和用户体验的基本技术。它通过临时存储频繁访问的数据在缓存中,缓存比数据的原始来源更容易访问。

作为一名软件工程师,了解缓存以及它在不同类型的系统中的工作方式是至关重要的。在本文中,我们将涵盖关于缓存的一切,从定义和重要性到不同类型的缓存以及实施的最佳实践。

I. 什么是缓存?

缓存是位于应用程序和数据的原始来源之间的高速存储层,例如数据库、文件系统或远程Web服务。当应用程序请求数据时,首先检查缓存。如果在缓存中找到数据,它将被返回给应用程序。如果在缓存中找不到数据,它将从其原始来源检索,存储在缓存中以供将来使用,并返回给应用程序。

缓存可以用于各种类型的数据,如网页、数据库查询、API响应、图像和视频。缓存的目标是减少数据需要从其原始来源获取的次数,这可以导致更快的处理和较低的延迟。

可以通过不同的方式实现缓存,包括内存缓存、磁盘缓存、数据库缓存和CDN缓存。内存缓存将数据存储在计算机的主存中,比磁盘存储更快。磁盘缓存将数据存储在硬盘上,比从远程来源检索数据更快。数据库缓存将经常访问的数据存储在数据库中,减少了访问外部存储的需求。CDN缓存将数据存储在分布式服务器网络上,减少了从远程位置访问数据的延迟。

II. 为什么缓存很重要?

在软件工程中,缓存在提高系统性能和用户体验方面发挥着关键作用。通过将经常访问的数据存储在缓存中,应用程序可以减少操作的响应时间和延迟,从而实现更快速和更高效的处理。以下是一些缓存很重要的原因:

1.改善系统性能: 缓存可以通过减少数据需要从其原始来源获取的次数来显著改善应用程序的性能。由于缓存数据可以比从原始来源获取数据更快地检索,这导致了处理时间的显著减少,从而实现了更响应的应用程序。2.减少网络负载: 缓存还可以通过最小化需要通过网络传输的数据量来减少网络负载。由于缓存数据存储在本地,不需要从原始来源获取数据,从而减少了需要传输的数据量。3.提高可扩展性: 缓存可以通过减少对原始来源的负载来提高应用程序的可扩展性。通过将经常访问的数据存储在缓存中,原始来源不太可能被请求压倒,使其更具可扩展性。4.更好的用户体验: 更快的响应时间和降低的延迟可以提供更好的用户体验。快速加载并及时响应用户请求的应用程序更有可能被用户使用和偏爱。

III. 缓存的类型

根据特定用例和被缓存的数据类型,可以以各种方式实现缓存。以下是一些常见的缓存类型:

1.内存缓存: 内存缓存将数据存储在计算机的主存中,比磁盘存储更快。内存缓存适用于可以容纳在可用内存中的经常访问数据。这种类型的缓存通常用于缓存API响应、会话数据和网页片段。要实现内存缓存,软件工程师可以使用各种技术,包括使用缓存库,如Memcached或Redis,或在应用程序代码中实现自定义缓存逻辑。2.磁盘缓存: 磁盘缓存将数据存储在硬盘上,比从远程来源检索数据更快。磁盘缓存适用于太大无法容纳在内存中或需要在应用程序重新启动之间持久化的数据。这种类型的缓存通常用于缓存数据库查询和文件系统数据。3.数据库缓存: 数据库缓存将经常访问的数据存储在数据库中,减少了访问外部存储的需求。这种类型的缓存可以使用各种技术实现,包括数据库查询缓存和结果集缓存。4.CDN缓存: CDN缓存将数据存储在分布式服务器网络上,降低了从远程位置访问数据的延迟。这种类型的缓存适用于从世界各地访问的数据,如图像、视频和其他静态资源。CDN缓存通常用于内容交付网络和大规模Web应用程序。5.DNS缓存: DNS缓存是域名系统(DNS)中使用的一种缓存,用于在一段时间内存储DNS查询的结果。当用户请求访问网站时,他们的计算机发送DNS查询到DNS服务器,以将网站的域名解析为IP地址。DNS服务器以IP地址回应,然后用户的计算机可以使用IP地址访问网站。DNS缓存通过减少发送到DNS服务器的请求次数来提高DNS系统的性能。当DNS服务器收到对域名的请求时,它检查其本地缓存是否有该域名的IP地址。如果IP地址在缓存中,DNS服务器可以立即用IP地址回应,无需查询其他服务器。这可以显著减少DNS查询的响应时间,并提高系统的整体性能。

e874f70aa40dc3b3941fd771a83358db.jpeg

Image.png

IV. 缓存替换策略

在实施缓存时,有一个缓存替换策略非常重要,以确定缓存变满时应删除哪些项目。以下是一些最常见的缓存替换策略:

最近最少使用 (LRU): LRU 是一种缓存替换策略,当缓存变满时,它会删除最近最少使用的项目。这种策略假定最近访问的项目更有可能在将来再次被访问。•最不常使用 (LFU): LFU 是一种缓存替换策略,当缓存变满时,它会删除最不常使用的项目。这种策略假定更频繁访问的项目更有可能在将来再次被访问。•先进先出 (FIFO): FIFO 是一种缓存替换策略,当缓存变满时,它会删除最旧的项目。这种策略假定缓存中的最旧项目最不可能在将来再次被访问。•随机替换: 随机替换是一种缓存替换策略,当缓存变满时,它会随机删除一个项目。这种策略不做关于将来访问的可能性的任何假设,可以在访问模式不可预测时有用。

不同替换策略的比较

每种缓存替换策略都有其优点和缺点,选择使用哪种策略取决于具体的用例。通常情况下,LRU 和LFU比FIFO和随机替换更有效,因为它们考虑了缓存的访问模式。但是,LRU和LFU的实现可能更昂贵,因为它们需要维护额外的数据结构来跟踪访问模式。FIFO和随机替换更容易实现,但在优化缓存性能方面可能不如LRU和LFU有效。总之,应谨慎选择使用的缓存替换策略,以平衡性能和复杂性之间的权衡。

V. 缓存失效策略

缓存失效是在数据不再有效时从缓存中移除数据的过程。使缓存失效是确保缓存中存储的数据准确和最新的关键步骤。以下是一些常见的缓存失效策略:

写透缓存(Write-through cache): 在这种方案下,数据被写入缓存并同时写入相应的数据库。缓存的数据允许快速检索,并且由于相同的数据被写入永久存储,缓存和存储之间将具有完全的数据一致性。此外,这种方案确保在发生崩溃、断电或其他系统中断时不会丢失任何数据。尽管写透缓存减少了数据丢失的风险,因为每个写操作必须在返回成功给客户端之前执行两次,但这种方案的缺点是写操作的延迟较高。•写绕缓存(Write-around cache): 这种技术类似于写透缓存,但数据直接写入永久存储,绕过缓存。这可以减少缓存被写操作淹没的情况,后续不会被重新读取,但缺点是对最近写入的数据的读取请求将创建“缓存未命中”,必须从较慢的后端存储中读取并经历较高的延迟。•写回缓存(Write-back cache): 在这种方案下,数据只写入缓存,并立即向客户端确认完成。写入永久存储是基于某些条件进行的,例如,当系统需要一些空闲空间时。这会导致写入密集型应用程序的低延迟和高吞吐量;然而,这种速度伴随着在崩溃或其他不利事件发生时数据丢失的风险,因为写入的数据的唯一副本在缓存中。•写后缓存(Write-behind cache): 这与写回缓存非常相似。在这种方案下,数据写入缓存并立即向应用程序确认,但不会立即写入永久存储。相反,写操作被推迟,数据最终会在稍后的时间写入永久存储。写回缓存和写后缓存之间的主要区别在于数据何时写入永久存储。在写回缓存中,只有在需要缓存释放空间时才会将数据写入永久存储,而在写后缓存中,数据将在指定的时间间隔内写入永久存储。

总之,应该谨慎选择使用的缓存失效策略,以在性能和数据准确性之间取得平衡。通过了解可用的不同缓存失效策略,软件工程师可以选择适当的策略来优化缓存性能并减少延迟,同时确保缓存中存储的数据准确和最新。

VI. 缓存失效方法

以下是一些著名的缓存失效方法:

清除(Purge): 清除方法会移除特定对象、URL或一组URL的缓存内容。通常在内容更新或更改时使用,因为缓存版本不再有效。当接收到清除请求时,缓存内容会立即移除,下一个请求的内容将直接从源服务器提供。•刷新(Refresh): 即使有缓存内容可用,刷新方法也会从源服务器获取请求的内容。当接收到刷新请求时,缓存内容将被更新为源服务器的最新版本,以确保内容是最新的。与清除不同,刷新请求不会移除现有的缓存内容;相反,它会使用最新版本进行更新。•封禁(Ban): 封禁方法根据特定条件(例如URL模式或标头)使缓存内容无效。当接收到封禁请求时,任何匹配指定条件的缓存内容将立即被移除,随后的内容请求将直接从源服务器提供。•生存时间到期(TTL到期): 此方法涉及为缓存内容设置生存时间值,超过该值后,内容将被视为陈旧并需要进行刷新。当接收到内容请求时,缓存会检查生存时间值,并仅在该值未到期时提供缓存内容。如果该值已到期,缓存将从源服务器获取内容的最新版本并进行缓存。•同时陈旧时重新验证(Stale-while-revalidate): 此方法用于在Web浏览器和内容传递网络中提供陈旧内容,同时在后台更新内容。当接收到内容请求时,将立即提供缓存版本给用户,并异步请求源服务器以获取内容的最新版本。一旦最新版本可用,缓存版本将被更新。此方法确保用户始终能够快速获取内容,即使缓存版本略有陈旧。

470daae28f13c0f10e51e55b4276dfaf.jpeg

Image.png

VII. 缓存性能指标

在实施缓存时,测量缓存性能是非常重要的,以确保它在减少延迟和提高系统性能方面是有效的。以下是一些最常见的缓存性能指标:

命中率(Hit rate): 命中率是由缓存提供而不访问原始来源的请求的百分比。高命中率表示缓存在减少对原始来源请求的数量方面非常有效,而低命中率表示缓存可能无法提供显著的性能优势。•未命中率(Miss rate): 未命中率是未由缓存提供并需要从原始来源获取的请求的百分比。高未命中率表示缓存可能无法缓存正确的数据,或者缓存大小可能不足以存储所有频繁访问的数据。•缓存大小(Cache size): 缓存大小是为缓存分配的内存或存储容量。缓存大小可以影响缓存的命中率和未命中率。较大的缓存大小可能会导致更高的命中率,但也可能增加缓存解决方案的成本和复杂性。•缓存延迟(Cache latency): 缓存延迟是从缓存中访问数据所需的时间。较低的缓存延迟表示缓存更快,更有效地降低延迟并提高系统性能。缓存延迟可以受到所使用的缓存技术、缓存大小以及缓存替换和失效策略的影响。

VIII. 结论

主要观点

缓存是优化系统性能和减少延迟的软件工程中的重要工具。通过将频繁访问的数据存储在缓存中,可以减少对原始来源的请求次数,从而实现更快的响应时间和更好的可扩展性。缓存在各种软件应用程序中使用,从Web应用程序到数据库再到内容传递网络。

分布式系统中缓存的未来

随着分布式系统在软件工程中的普及,缓存将继续在优化系统性能方面发挥关键作用。像Redis和Memcached这样的分布式缓存解决方案变得越来越流行,允许数据在多个服务器和数据中心之间进行缓存。随着机器学习和人工智能的使用不断增长,缓存也将用于通过减少检索和处理数据所需的时间来优化这些应用程序的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1172440.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux 查看当前目录下每个文件夹大小

要在 Linux 中查看当前目录下每个文件夹的大小,可以使用 du 命令(磁盘使用情况)结合其他一些选项。下面是几个常用的命令示例: 显示当前目录下每个文件夹的大小——只显示一层文件夹: du -h --max-depth1该命令会以人…

微信小程序授权登录获取用户的openid

小程序可以通过微信官方提供的登录能力方便地获取微信提供的用户身份标识,快速建立小程序内的用户体系然而因为小程序中的openid不可以直接使用需要用code(登录凭证)去换取openid 获取openid的思路 获取openid首先需要调用小程序的login方法…

佳易王配件进出库开单打印进销存管理系统软件下载

用版配件进出库开单打印系统,可以有效的管理:供货商信息,客户信息,进货入库打印,销售出库打印,进货明细或汇总统计查询,销售出库明细或汇总统计查询,库存查询,客户往来账…

web:[CISCN2019 华北赛区 Day2 Web1]Hack World

题目 打开页面,页面提示为,想要的都在‘flag’表和‘flag’列里 随便输入一个数字看回显(1 2 3),发现回显不一样 输入1 输入2 输入3 输入4 输入单引号,显示bool(false) 尝试一下万能…

Leetcode 73 矩阵置0

class Solution {//1.用矩阵的第一行和第一列来标记该行或该列是否应该为0,但是这样的话忽视了第一行或第一列为0的情况//2.用标记row0和column0来标记第一行或第一列是否该为0public void setZeroes(int[][] matrix) {int n matrix.length;int m matrix[0].length;boolean r…

华为升腾C92安装windows NAS

华为升腾C92安装windows NAS NAS(Network Attached Storage:网络附属存储),我们之前所了解的群晖,也仅仅是NAS当中的一个品牌运营而已。 这次,我决定在C92上面试着安装Windows NAS。虽然群晖NAS是基于Linu…

Tomcat10 简单地enable Https

通常来讲, 建站后要启用https 有下面3个步骤 1.购买域名 2.绑定域名和 服务器的外部IP地址 3.为这域名购买SSL 证书 (还有其密码) 4.在Tomcat上启用https 和安装这个证书 但是其实没有域名也可以在tomcat 中enable https的, 至于…

【Linux】多路IO复用技术③——epoll详解如何使用epoll模型实现简易的一对多服务器(附图解与代码实现)

在正式阅读本篇博客之前,建议大家先按顺序把下面这两篇博客看一下,否则直接来看这篇博客的话估计很难搞懂 多路IO复用技术①——select详解&如何使用select模型在本地主机实现简易的一对多服务器http://t.csdnimg.cn/BiBib多路IO复用技术②——poll…

2.10 CSS BFC

1.简介 BFC是Block Formatting Context(块级格式上下文),可以理解成元素的一个“特异功能”。该“特异功能”,在默认的情况下处于关闭状态;当元素满足了某些条件后,该"特异功能被激活。所谓激活"特异功能”,专业点说就…

Java线程的基本概念和五种状态

1. 线程 1.1 创建线程 创建线程通常有以下三种方式: 实现 Runnable 接口,并重写其 run 方法: public class J1_Method01 {public static void main(String[] args) {System.out.println("Main线程的ID为:" Thread.curr…

shell综合项目

主菜单 http和Nginx分别的install的菜单&#xff0c;安装过程通过重定向到/dev/null达到看不见的效果 输入非整数或者大于4的数字都会提示错误 代码如下: [rootserver ~]# vim install_menu.sh #!/bin/bash function menu() { cat << EOF …

GraphQL入门与开源的GraphQL引擎Hasura体验

背景 Hasura 是一个开源的 GraphQL 引擎&#xff0c;它可以帮助开发人员快速构建和部署现代应用程序的后端。它提供了一个自动化的 GraphQL API &#xff0c;可以直接连接到现有的数据库&#xff0c;并提供实时数据推送和订阅功能。 Hasura 团队总部位于印度。 下载安装 脚本…

产品经理入门学习(三):产品解决方案

参考引用 黑马-产品经理入门基础课程 1. 需求分析 1.1 需求分析的目的 1.2 需求分析的方法 案例分析 福特公司的创始人亨利福特说&#xff1a;如果我当年去问顾客他们想要什么&#xff0c;他们肯定会告诉我&#xff1a;一匹更快的马 1.3 需求分析的实际应用 人性七宗罪&#…

计网note

其他 未分类文档 CDMA是码分多路复用技术 和CMSA不是一个东西 UPD是只确保发送 但是接收端收到之后(使用检验和校验 除了检验的部分相加 对比检验和是否相等。如果不相同就丢弃。 复用和分用是发生在上层和下层的问题。通过比如时分多路复用 频分多路复用等。TCP IP 应用层的…

css 图片好玩的一个属性,添加滤镜

鼠标经过效果对比&#xff1a; 上图是改变了图片的饱和度&#xff0c;代码如下&#xff1a; .img-box .v-image:hover {filter: saturate(1.75); }其他滤镜说明如下图&#xff1a;

2023全新小程序广告流量主奖励发放系统源码 流量变现系统 带安装教程

2023全新小程序广告流量主奖励发放系统源码 流量变现系统 分享软件&#xff0c;吃瓜视频&#xff0c;或其他资源内容&#xff0c;通过用户付费买会员来变现&#xff0c;用户需要付费&#xff0c;有些人喜欢白嫖&#xff0c;所以会流失一部分用户&#xff0c;所以就写了这个系统…

46基于matlab的模拟退火算法(SA)优化车辆路径问题(VRP)

基于matlab的模拟退火算法&#xff08;SA&#xff09;优化车辆路径问题&#xff08;VRP&#xff09;&#xff0c;在位置已知的条件下&#xff0c;确定车辆到各个指定位置的行程路线图&#xff0c;使得路径最短&#xff0c;运输成本最低。一个位置由一台车服务&#xff0c;且始于…

内存池设计实现

1.设计原理 1.内存池实际就是预先分配不同大小的内存块, 然如果需要调用的时候, 直接把这个块的指针返回. 图中, 就是内存池划分. 2.通过一个链表, 将这些分配的内存块串联起来, 每一块最头部都记录这这个块的信息 3.分配的时候, 会遍历一遍链表, 找到is_used未被置1, pool…

【C语言进阶】之动态内存管理笔试题及柔性数组

【C语言进阶】之动态内存管理笔试题 1.动态内存管理笔试题汇总1.1第一道题1.2第二道题1.3第三道题1.4第四道题 2.C/C内存管理3.柔性数组3.1什么是柔性数组3.2柔性数组的使用3.2柔性数组的优点 &#x1f4c3;博客主页&#xff1a; 小镇敲码人 &#x1f680; 欢迎关注&#xff1a…

Kubernetes Dashboard 用户名密码方式登录

Author&#xff1a;rab 前言 为了 K8s 集群安全&#xff0c;默认情况下 Dashboard 以 Token 的形式登录的&#xff0c;那如果我们想以用户名/密码的方式登录该怎么操作呢&#xff1f;其实只需要我们创建用户并进行 ClusterRoleBinding 绑定即可&#xff0c;接下来是具体的操作…