缓存架构,减少不必要的计算

news2024/12/23 23:40:38

前言:

互联网应用的主要挑战就是在高并发情况下,大量的用户请求到达应用系统服务器,造成巨大的计算压力。互联网应用的核心解决思路就是采用分布式架构,提供更多的服务器,从而提供更多的计算的资源,应对高并发带来的计算压力以及资源的消耗。

缓存:

就是将需要多次读取的数据暂存起来,这样在后面,应用程序需要多次读取的时候,就不必从数据源重复加载数据了,这样就可以降低数据的计算负载压力,提高数据的响应速度。

通读缓存(read-through):

应用程序访问通读缓存获取数据的时候,如果通读缓存有应用程序需要的数据,那么就返回这个数据,如果没有,那么通读缓存就自己负责访问数据源,从数据源获取数据返回给应用程序,并且将这个数据缓存在自己的缓存中,这样,下次,应用程序需要数据的时候,就可以通过通读缓存直接获取数据了。

通读缓存在架构中的位置与作用如下图

旁路缓存(cache-aside):

应用程序访问旁路缓存获取数据的时候,如果旁路缓存中有应用程序需要的数据,那么就返回这个数据,如果没有,就返回空,应用程序需要自己从数据源读取数据,然后将这个数据写入到旁路缓存中,这样,下次应用程序需要数据的时候,就可以通过旁路缓存直接获取数据了。

通读缓存:

互联网应用中主要使用的通读缓存是CDN和反向代理缓存。

CDN(Content Delivery Network)内容分发网络,上网的时候,APP或者浏览器想要连接到互联网的应用服务器,需要网络服务商,比如移动,电信这样的服务商为我们提供网络服务,建立网络连接才可以上网。

而这些服务商需要在全国范围内部署骨干网络,交换机机房才能完成网络连接服务,这些交换机机房可能距离用户非常近,用户在近距离获取自己想要的数据,既能提高响应速度,又能节省网络带宽和服务器资源。

部署在网络服务商机房中的缓存就是CDN,因为距离非常近,又被称作网络连接第一跳,目前很多网络应用大约80%以上的网络流量都是通过CDN返回的。

CDN只能缓存静态数据内容,比如说图片、CSS、JS、HTML等内容,而动态内容,比如说订单的信息,商品搜索结果等必须要应用服务器进行计算处理后才能获得,因此,互联网应用的静态内容和动态内容需要进行分离,静态内容和动态内容部署在不同的服务器集群上面,使用不同的二级域名,即所谓的动静分离,一方面便于运维管理,另一方面也便于CDN进行缓存,使CDN只缓存静态内容。

反向代理缓存是一种通读缓存:

上网的时候,有时候需要通过代理上网,这个代理就是代理我们客户端上网设备,而反向代理则是代理服务器,是应用程序服务器的门户,所有的网络请求都需要通过反向代理磁能到达应用程序服务器,既然所有的请求都需要通过反向代理才能到达应用服务器,那么在这里加一个缓存,尽快将数据返回给用户,而不是发送给应用服务器,这就是反向代理缓存。

用户请求到达反向代理缓存服务器,反向代理检查本地是否有需要的数据,如果有就直接返回,如果没有,就请求应用服务器,得到需要的数据后缓存到本地,然后返回给用户。

旁路缓存:

CDN和反向代理缓存通常 会作为系统架构的一部分,很多时候对应程序都是透明的,而应用程序在代码中主要使用的是对象缓存,对象缓存是一种旁路缓存。

不管是通读缓存还是旁路缓存,缓存通常都是以key、value的方式进行存储在缓存中的,比如说,CDN和反向代理缓存,每个URL是一个key,那么url对应的文件内容就是value,而对象缓存中,key通常是一个ID,比如说用户的ID,商品ID等等,而value则是是一个对象,就是ID对应的用户对象或者商品对象。

对于key、value的数据格式,比较快速的存取方式就是使用hash表,因此通读缓存和旁读缓存存在实现上基本都是使用hash表。

程序中的使用的对象缓存,可以分为两种,一种是本地缓存,缓存和应用程序在同一个进程中启动,使用程序的堆空间存放缓存数据,本地缓存的响应速度快,但是缓存可以使用的内存空间比较小,但是对于大型互联网应用所需缓存的数据通常以T计算,这个时候就要使用远程分布式缓存进行处理了。

分布式缓存是指将一组服务器构成一个缓存集群,共同对外提供缓存服务,那么应用程序在每次读写缓存的时候,如果知道要访问缓存集群中的具体那台服务器,通过Memcached为例子,分布式缓存的框架:

Memcached将多台服务器构成一个缓存集群,缓存数据存储在每台服务器的内存中,事实上,使用缓存的应用程序服务器通常也是以集群方式部署的,每个程序需要依赖一个Memcached的客户端SDK,通过SDK的API访问Memcached的服务器。

应用程序调用API,API调用SDK的路由算法,路由算法根据缓存的key值,计算这个key应用访问那台Memcached服务器,计算得到服务器的IP地址和端口后,API再调用SDK的通信模块,将key、value值以及缓存操作命令发送给具体的某台Memcached服务器,由这台服务器完成缓存操作。

路由算法计算Memcached的服务器IP端口,比较简单的方法是通过Hash算法一样,利用Key的Hash值对服务器列表长度取模,根据余数可以确定服务器列表的下标,进而得到服务器的IP和端口。

缓存的好处事项:

  1. 缓存数据通常存储在内存中,距离使用数据的应用也更近一些,因此相比从硬盘上获取,或者从远处网络上获取,它获取数据的速度要更快一点,响应时间更快,性能表现更好。
  2. 缓存的数据通过是计算后的结果,比如对象缓存中,通常存放经过计算加工的结果对象,如果缓存不命中,那么就需要从数据库中获取原始数据,然后进行加工才能得到结果对象,因此使用缓存可以减少CPU的计算消耗,节省计算资源,同样也加快了处理的速度。
  3. 通过对象缓存获取数据,可以降低数据库的负载压力,通过CDN,反向代理等通读缓存获取数据,可以降低服务器的负载压力,这些负载压力释放出来的计算资源,可以提供个其他更有需要的计算场景,比如写数据场景,间接提高整个系统的处理能力。

缓存的缺点:

  1. 数据脏读取的问题,缓存的数据来自数据源,如果数据源中的数据被修改了,那么缓存中的数据就编程脏数据了。
    1. 解决方案1:过期失效,每次写入缓存中的数据都标记其失效的时间,在读取缓存的时候,检查数据是否已经过期失效,如果失效,就重新从数据源获取数据,缓存失效依然可能会在未失效内读取到脏数据,但是一般的应用都可以容忍较短时间内数据的不一致问题。
    2. 解决方案2:失效通知,应用程序更新数据源的数据,同时发送通知,将该数据从缓存中清除,失效通知看起来的数据更新及时,但是实践中,更多使用的还是过期失效。

小结:

不是所有的数据使用缓存都有意义,在互联网应用中,大多数数据访问都是有热点的,比如说微博的热点新闻,名人博客等,可以使用缓存进行处理。相反,如果缓存的数据没有热点,写入缓存的数据就很难被重复读取,使用缓存 就没有必要了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/102680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VUE3-创建项目《一》

本案例使用vue3进行学习记录,和vue2有些是通用的。 1.需要了解HTML,CSS,JavaScript。 2.了解Node和NPM,node是vue的开发环境,npm是依赖管理包,npm就和Java的maven一样,和c#的NuGet一样&#x…

mac 微信备份到外接硬盘方案(软链接)

mac版本微信中并没有指定备份路径的功能,备份的聊天记录文件也在一个很难找的位置。对于使用256g硬盘的mac的用户,微信聊天记录动辄十几G、几十G的大小,会造成非常严重的硬盘容量恐慌。所以把微信备份文件迁移到外置硬盘是一件非常有意义的工…

实景三维数据汇交、接缝处理难?用网格大师轻松搞定!

为满足全国城市化、智慧化建设发展,实景三维建设进程加快,建设成果日渐增多,随之而来的数据汇交需求增大。然而在实际数据汇交过程中,不仅需要考虑到模型能否直接融合与替换的问题,还将面临几何接缝、色彩不均等问题。…

【DELM回归预测】基于matlab人工蜂群算法改进深度学习极限学习机数据回归预测【含Matlab源码 1885期】

⛄一、PSO-DELM简介 1 DELM的原理 在2004年,极限学习机(extreme learning machine,ELM)理论被南洋理工大学的黄广斌教授提出,ELM是一种单隐含层前馈神经网络(single-hidden layer feedforward neural network,SLFN&am…

虹科新闻 | 虹科与RACOM正式建立合作伙伴关系

近日,虹科与RACOM正式建立合作伙伴关系,双方就工业应用自动化领域进行深入的交流与合作,未来将共同致力于为客户提供高效、可靠的工业通信解决方案,帮助客户布局工业信息系统。 虹科与RACOM都表示十分期待这次的合作。虹科CEO陈秋…

【信管4.3】确认与控制范围

确认与控制范围在范围管理中,我们已经讲完了 4 个管理过程,剩下的两个过程就是对范围的确认以及在整个项目执行过程中进行范围的监控管理。这两个过程的内容都不多,所以今天的内容还是非常轻松的,在正式学习之前,我们先…

再学C语言9:数据类型(7)——总结

一、sizeof()函数检测C环境中数据类型大小 代码&#xff1a; #include <stdio.h> int main(void) {printf("Type int has a size of %u bytes.\n", sizeof(int));printf("Type char has a size of %u bytes.\n", sizeof(char));printf("Type …

技术分享 | Jenkins 多任务关联

当有多个 Jenkins job 时&#xff0c;job 的执行需要按照先后顺序去执行&#xff0c;这个过程就是 Jenkins 的多任务关联。通常用于项目的编译、打包、执行冒烟、执行项目 case 多任务协助的场景中。 > 霍格沃兹测试学院 TestingStudio 触发条件 多任务关联的使用场景是有…

【大数据 clickhouse】clickhouse 数据字典使用详解

一、数据字典介绍 数据字典是ClickHouse提供一种非常简单且实用的存储媒介&#xff0c;他以键值和属性映射的形式定义数据。字典中的数据会主动或被动加载到内存并支持动态更新。由于字典数据常驻内存的特性&#xff0c;所以非常适合保存常量或经常使用的维度表数据&#xff0c…

没想到H5也是黑灰产的攻击重点?

近几年&#xff0c;在数字化与疫情的推动下&#xff0c;越来越多的企业开辟了线上业务&#xff0c;在互联网上通过各种方式开展业务。线上业务不仅使得企业效率提升&#xff0c;同时也面临着被黑灰产攻击的风险。黑灰产通过各种业务漏洞&#xff0c;能够攫取大量利益&#xff0…

[附源码]计算机毕业设计Python公共台账管理系统(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

mysql的优化---定位低效率执行SQL-慢查询日志

-- 查看慢日志配置信息 show variables like %slow_query_log%-- 开启慢日志查询 set global slow_query_log 1-- 查看慢日志记录SQL的最低阈值时间,默认如果SQL的执行时间>10秒的&#xff0c;则算慢查询&#xff0c;则会将该操作记录到慢日志中去 show variables like lon…

文本生成项目(基于tensorflow1.14版本)

项目下载链接&#xff1a;链接: https://pan.baidu.com/s/1OfICplwlEtRBz_ta7Nwyyg?pwdyr5c 提取码: yr5c 复制这段内容后打开百度网盘手机App&#xff0c;操作更方便哦 --来自百度网盘超级会员v4的分享 1.模型代码&#xff1a;model.py # -*- coding: utf-8 -*- # file: m…

Qemu中SylixOS与VMware中Linux的通信链路搭建

1.适用范围 在与客户沟通交流后&#xff0c;ECSM管理Linux端docker及Linux与SylixOS间通信也成了客户比较关心的一部分。因此为了能够更好地给客户提供演示&#xff0c;必然需要搭建一套具有ECSM、SylixOS、linux的环境。 如果通过硬件搭建&#xff0c;一是携带麻烦&#xff0…

表哥推荐python自学书籍:从入门到精通,读这十本书就够了!

前言 人生苦短&#xff0c;我学python。 python编程语言在各种榜单上经常拿到前列位置&#xff0c;在全球范围内都非常受欢迎。 Python作为一种不受局限、跨平台的开源编程语言&#xff0c;其数据处理速度快、功能强大且简单易学。而且&#xff0c;Python采用解释运行的方式…

风电机组的预测性维护应该如何进行?

一、应用背景 风能是最重要的清洁能源之一&#xff0c;大力发展风电等清洁能源是实现国家可持续发展战略的必然选择。发展风电、光伏等新能源的高效运维技术已成为当前电力系统面临的重要问题之一。在风电机组单机容量较大、机组整体结构越来越复杂、各部件之间的耦合也愈加紧…

零基础入门智能射频——偶极子天线等效电路模型分析

1.前言 无人机的安全防范和管控&#xff0c;已经成为无人机行业的重点内容。无人机探测解决方案已经变得非常重要。前面系列文章给出了针对无人机侦察和干扰无人机的天线阵设计&#xff0c;上一期文章中&#xff0c;我们给出一种小型化的无人机侦测天线&#xff0c;每个阵元都…

GIS开发入坑(四)--QGIS导入POI数据并实现简单处理分析

POI数据&#xff0c;英文全称Point of Intersesting&#xff0c;中文的意思是兴趣点&#xff0c;指的是在地图上有意义的点&#xff1a;比如商店、酒吧、加油站、医院、车站等。POI数据能够赋能时空行为、城市规划、地理信息等研究&#xff0c;因此获取准而全的POI数据是开展科…

ChatGPT:你才是编译器!你全家都是编译器!

我是不是再也不需要编译器了&#xff1f;&#xff01;这个故事的灵感来自一个类似的文章&#xff1a;在 ChatGPT 中构建虚拟机。我印象深刻并决定尝试类似的东西&#xff0c;但这次不是 Linux 命令行工具&#xff0c;而是让 ChatGPT 成为我们的 Python 编译器。这是初始化 Chat…

论文投稿指南——中文核心期刊推荐(数学)

【前言】 &#x1f680; 想发论文怎么办&#xff1f;手把手教你论文如何投稿&#xff01;那么&#xff0c;首先要搞懂投稿目标——论文期刊 &#x1f384; 在期刊论文的分布中&#xff0c;存在一种普遍现象&#xff1a;即对于某一特定的学科或专业来说&#xff0c;少数期刊所含…