什么是CDN?
CDN的全称是Content Delivery Network,中文名称“内容分发网络”。其主要原理是在现有网络中增加一层新的网络架构,将源站中的内容发布到不同的网络节点上,使用户可以就近获得所需的内容,从而提高用户访问网站的速度。CDN可以在技术上有效解决由于网络带宽小、用户访问量大、网点分布不均等造成的访问延迟、线路拥堵等问题。
CDN技术原理
当用户访问已经加入CDN网络的网站时,首先会通过DNS重定向到最接近用户的最佳CDN节点。用户请求该节点,CDN服务器会代替源站将用户请求的内容提供给用户。
具体流程为:
用户在浏览器中输入想要访问域名,浏览器向本地DNS服务器请求该域名的解析地址,本地DNS最终请求到域名的权威DNS服务器,权威服务器将该域名的CNAME记录指向的另一个主机名(CDN DNS服务器)返回给本地DNS,本地DNS请求CDN DNS服务器,CDN DNS服务器根据访客IP,返回一个就近的CDN节点IP,本地DNS将这个IP地址告知访客,访客对这个IP地址发起访问。
CDN加速实例
当用户对www.a.com这个域名发起请求时,实际的处理流程如下图所示:
(1)用户对www.a.com发起1.jpg这个图片的访问请求,首先会先向LDNS发起域名解析请求;
(2)LDNS经过根域名服务器、顶级域名服务器寻址,最终向该域名授权的DNS(权威DNS服务器)发起域名解析请求;
(3)权威DNS服务器会将CNAME记录 www.a.tbcdn.com(DNS调度系统)返回给LDNS;
(4)LDNS向DNS调度系统发起请求;
(5)DNS调度系统会根据访客IP为其返回一个就近的CDN服务器节点2.2.2.2
(6)用户对2.2.2.2的CDN节点发起1.jpg这个文件的访问请求;
(7)如果该节点缓存由1.jpg文件,直接提供给用户;如果没有,则向源站请求数据,然后再提供给用户。
CDN缓存机制
由于CDN涉及各级缓存,所以必然需要考虑到缓存更新问题。如果浏览器本地缓存失效后,浏览器就会向就近的CDN节点发起请求。类似浏览器缓存,CDN节点也存在着一套缓存机制。如果CDN缓存有用户请求的内容,会直接返回给用户结果。如果缓存没有请求内容或缓存失效,CDN就会请求源站获取新的内容。
CDN缓存机制不仅减少了用户的访问延迟,也减轻了源站负载,但同样存在明显的缺点,当网站内容更新时,如果CDN节点上的数据没有及时同步,就会导致用户获取到错误的信息。在这种情况下,用户即使刷新浏览器缓存,也无法解决。
CDN的缓存策略
CDN的缓存策略会根据服务商不同而有所差别,但一般都遵循HTTP标准协议,通过HTTP响应头中的Cache-control: max-age的字段来设置CDN边缘节点数据缓存时间。
当客户端向CDN节点请求数据时,CDN就会判断缓存数据是否过期,如果没有过期,直接将数据返回给客户端;如果缓存数据已过期,CDN节点就会向源站发出回源请求,从源站获取最新数据,更新本地缓存,并将最新数据返回给客户端。
如果缓存时间太短,CDN节点会频繁对源站发起请求,增加了源站的负载,同时也加大了访问延迟;如果缓存时间太长,就会导致缓存数据更新不及时,用户获取信息异常的情况。所以网站运营者需要根据自身业务,设置合理的缓存时间管理。
CDN的缓存刷新
网站运营人员可以通过CDN服务商提供的缓存刷新接口来直接清理CDN边缘节点的缓存数据,这样网站内容更新后,就可以强制CDN节点缓存数据过期,重新请求源站,以保证客户端在访问时,获得最新数据。