数据压缩是指:通过特定的算法,将计算的中的文件大小得到降低的一种机制。
目前生活中最常见的应用例子,比如:你通过聊天软件将一张图片发送给好友,再选择发送图片的时候,有一个选项为是否发送原图,这里不选择原图发送,那么好友收到的图片就是不清晰的图片,用这样的方法,可以加快照片批量发送时所需的时间,但是牺牲了图片的画质。
数据压缩除了在生活中有着常见的场景外,在计算机领域,更是有着非常广泛的应用场景。比如:数据存到存储中时、数据进行备份时、数据库应用等等,都涉及到数据的压缩。在商业的计算机架构中,数据量动辄单位PB起步,数据量得到一半的压缩,那也可以节约非常多的存储支出成本,在其他方面也可以降低数据传输时所需的时间、网络带宽压力等。
数据压缩的原理也是非常简单的,那就是找数据中重复的数据!举一个简单的例子:比如这里有一个文本文件,文件中存放的信息为“AAAAAAAAAAABBBBBBB” ,其中开头有11个“A”,然后接着有7个“B”,这份文件在压缩时,告诉计算机“先存11个A再存7个B”,在恢复时只需要按照对等的算法进行解压缩原数据就可以正常恢复回来了,这样的话数据就得到了有效的压缩。这里只是举了一个非常简单的例子,供各位理解数据压缩原理用。
数据压缩在数据备份场景下是非常实用的,加入备份数据量达到100TB,那么经过压缩后能够压缩一半甚至更多的话,那就相当于可以节省50TB的存储空间,假设1G存储需要花费10元(这里指的非消费级存储,而是专业的企业级存储,是一个举例值,更高要求的存储可能价格更高),那么节省的成本相当于50万。
感兴趣的朋友们,可以更深入的了解数据压缩技术,比如无损压缩、有损压缩,压缩算法采用的编码类型,按照文件类型采用的不同压缩算法等。
关注数据备份的朋友们,也可以了解了解云祺。