有损压缩与无损压缩
- 数据压缩
- 有损压缩
- 无损压缩
- 有损压缩与无损压缩的区别
- Which One to Use?
- Final Words
- 有损压缩、无损压缩(图片、音频、视频)
- 图片文件格式
- 音频文件格式
- 视频文件格式
数据压缩
数据压缩(Data Compression)是减小任何数据或文件的存储大小以减少其在磁盘上占用的空间的过程。它是一种修改、重组、编码和转换任何数据的模式或实例以减少其大小的技术。简单地说,它转换文件的方式是最大限度地减少文件的大小。数据压缩也被称为比特率降低或源编码。
为什么需要数据压缩?造成这种情况的主要原因有两个:
- 存储:它有助于减少将数据存储在磁盘上所需的数据量。
- 时间:尺寸减小到一定程度,节省了数据传输时间。
有损压缩
有损压缩(Lossy Compression)是一种涉及消除特定数量数据的技术。它有助于减少文件大小在很大程度上没有任何明显的东西。而且,一旦文件被压缩,它就无法恢复到原始形式,因为文件中的数据大大减少了。当文件的质量不是很重要的时候,这种技术会更有用。此外,它还有助于节省存储数据的磁盘空间。
当文件的质量非常重要时,有损压缩是没有用的。另外,如果记录上还有进一步的分析需要处理,这种方法也不理想。该方法一般用于音频和视频的压缩,这类压缩存在大量的数据丢失,甚至用户无法识别。
无损压缩
无损压缩(Lossless Compression)是一种只涉及一定量数据消除的技术。这种技术也有助于减少文件大小,但不如有损压缩那么大。相反,在这种方法中,如果文件被压缩,则可以将其恢复到原始形式。此外,数据的质量不受影响;因此,缩小的幅度并不大。
当您希望减小大小以获得额外的存储空间时,无损压缩是没有用的。另外,如果要对文件执行任何进一步的分析,则无损压缩是没有好处的。通过只删除不需要的数据来维护文件的原创性是很有用的。这种技术通常用于文本文件、敏感文档和机密信息。
有损压缩与无损压缩的区别
基础 | 有损压缩 | 无损压缩 |
---|---|---|
定义 | 有损压缩是一种涉及消除特定数量数据的技术。 它有助于在没有任何明显注意的情况下大大减小文件大小 | 无损压缩是一种仅涉及消除一定量数据的技术。 此技术还有助于减小文件大小,但不会在更大程度上 |
压缩率 | 高 | 低 |
档案品质 | 低 | 高 |
消除数据 | 即使必要的数据也被删除,这并不明显 | 仅删除了特定数量的有害数据 |
恢复 | 无法恢复其原始形式 | 可以恢复其原始形式 |
信息丢失 | 此技术涉及一些信息丢失 | 此技术不包括任何信息丢失 |
数据调整 | 更多数据住宿 | 数据容纳量减少 |
失真 | 文件变形 | 无失真 |
资料储存能力 | 更多 | 更少 |
使用的算法 | 变换编码,DCT,DWT,分形压缩,RSSMS | RLW,LZW,算术编码,霍夫曼编码,香农法诺编码 |
文件类型 | JPEG,GIF,MP3,MP4,MKV,OGG等 | RAW,BMP,PNG,WAV,FLAC,ALAC等 |
Which One to Use?
尽管这两种都是数据压缩的类型,但在不同的情况下,它们都是有用的。例如,有损压缩有助于减少文件大小,这意味着它对那些在数据库中存储大量数据的人很有帮助。因此,这种技术在存储大小大大减小的数据时非常有用。另外,对于网页来说,这样小尺寸的文件有利于更快的加载。
此外,一旦压缩完成,此过程不允许对数据进行任何事后分析。此外,文件不能以其原始形式重新结构,因为这涉及到数据的丢失。
与有损压缩不同,无损压缩不涉及任何数据丢失。既不影响数据的质量,也不过度减少数据的大小。它保持原始格式,以便可以恢复它,并执行进一步的操作。对于那些需要在不影响数据质量的情况下再次访问数据的人来说,这种方法很有帮助。
Final Words
有损压缩和无损压缩都以其独特的方式帮助压缩数据。虽然有损压缩可以通过破坏数据来存储数据,但无损压缩却不行。无损压缩技术有利于保持数据的原创性,而有损压缩则不能。这两种方法都有助于数据库管理,从而识别和压缩相应的文件。
有损压缩、无损压缩(图片、音频、视频)
无损压缩:是对文件本身的压缩,和其它数据文件的压缩一样,是对文件的数据存储方式进行优化,采用某种算法表示重复的数据信息,文件可以完全还原,不会影响文件内容,对于数码图像而言,也就不会使图像细节有任何损失。
无损压缩的基本原理是相同的颜色信息只需保存一次。压缩图像的软件首先会确定图像中哪些区域是相同的,哪些是不同的。包括了重复数据的图像(如蓝天)就可以被压缩,只有蓝天的起始点和终结点需要被记录下来。但是蓝色可能还会有不同的深浅,天空有时也可能被树木、山峰或其他的对象掩盖,这些就需要另外记录。从本质上看,无损压缩的方法可以删除一些重复数据,大大减少要在磁盘上保存的图像尺寸。但是,无损压缩的方法并不能减少图像的内存占用量,这是因为,当从磁盘上读取图像时,软件又会把丢失的像素用适当的颜色信息填充进来。如果要减少图像占用内存的容量,就必须使用有损压缩方法。
有损压缩:是对图像本身的改变,在保存图像时保留了较多的亮度信息,而将色相和色纯度的信息和周围的像素进行合并,合并的比例不同,压缩的比例也不同,由于信息量减少了,所以压缩比可以很高,图像质量也会相应的下降。
有损压缩可以减少图像在内存和磁盘中占用的空间,在屏幕上观看图像时,不会发现它对图像的外观产生太大的不利影响。因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要,这就是有损压缩技术的基本依据。
图片文件格式
有损压缩格式:JPEG、JPG、WMF、WebP (jpeg、jpg、wmf)
无损压缩格式:BMP、PCX、TIFF、GIF、TGA、PNG、RAW(bmp、pcx、tiff、gif、tga、png、raw)
有损压缩详细格式:
- WebP是Google新推出的影像技术,它可让网页图档有效进行压缩,同时又不影响图片格式兼容与实际清晰度,进而让整体网页下载速度加快。与JPEG相同,WebP是一种有损压缩利用预测编码技术。但谷歌表示,这种格式的主要优势在于高效率。他们发现,“在质量相同的情况下,WebP格式图像的体积要比JPEG格式图像小40%,美中不足的是,WebP格式图像的编码时间“比JPEG格式图像长8倍”。
- JPEG也是最常见的一种图像格式,是一种有损压缩格式,能够将图像压缩在很小的储存空间,因此容易造成图像数据的损伤。JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。JPEG格式是目前网络上最流行的图像格式。JPEG格式的应用非常广泛,特别是在网络和光盘读物上。各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。JPEG 不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显的较简单的图片。
- JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。JPEG2000和JPEG相比优势明显,且向下兼容,因此可取代传统的JPEG格式。JPEG2000即可应用于传统的JPEG市场,如扫描仪、数码相机等,又可应用于新兴领域,如网路传输、无线通讯等等。
- WMF(Windows Metafile Format)是Windows中常见的一种图元文件格式,属于矢量文件格式。它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,其图形往往较粗糙。
无损压缩详细格式:
- BMP是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选1bit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。BMP可以用任何颜色深度(从黑白到24位颜色)存储单个光栅图像。Windows 位图文件格式与其他 Microsoft Windows 程序兼容。它不支持文件压缩,也不适用于Web页。从总体上看,Windows位图文件格式的缺点超过了它的优点。为了保证照片图像的质量,请使用 PNG、JPEG、TIFF文件。BMP文件适用于Windows中的墙纸。BMP 不支持压缩,这会造成文件非常大。
- PCX是最早支持彩色图像的一种文件格式,现在最高可以支持256种彩色。PCX设计者很有眼光地超前引入了彩色图像文件格式,使之成为非常流行的图像文件格式。PCX是PC机画笔的图像文件格式。PCX的图像深度可选为l、4、8bit。由于这种文件格式出现较早,它不支持真彩色。PCX文件采用RLE行程编码,文件体中存放的是压缩后的图像数据。因此,将采集到的图像数据写成PCX文件格式时,要对其进行RLE编码:而读取一个PCX文件时首先要对其进行 RLE解码,才能进一步显示和处理。PCX不受Web浏览器支持。
- TIF格式是由Aldus和Microsoft公司为桌上出版系统研制开发的一种较为通用的图像文件格式。TIFF格式灵活易变,它又定义了四类不同的格式:TIFF-B适用于二值图像;TIFF-G适用于黑白灰度图像;TIFF-P适用于带调色板的彩色图像;TIFF-R适用于RGB真彩图像。TIFF支持多种编码方法,其中包括RGB压缩、RLE压缩、JPEG压缩等。TIFF是现存图像文件格式中最复杂的一种,它具有扩展性、方便性、可改性,可以提供给IBMPC等环境中运行、图像编辑程序。
- GIF格式是一种基于LZW算法的连续色调的有损压缩格式。其压缩率一般在50%左右,它不属于任何应用程序。几乎所有相关软件都支持它,公共领域有大量的软件在使用GIF图像文件。GIF图像文件的数据是经过压缩的,而且是采用了可变长度等压缩算法。所以GIF的图像深度从1bit到8bit,也即GIF最多支持256种色彩的图像。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。GIF解码较快,但GIF不支持Alpha透明通道。
- TGA格式是由美国Truevision公司为其显示卡开发的,文件扩展名为".tga",已被国际上的图形、图像工业所接受。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有很大影响,是计算机生成图像向电视转换的一种首选格式。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件,一般图形、图像文件都为四方形,若需要有圆形、菱形甚至是缕空的图像文件时,TGA可就派上用场了。TGA格式支持压缩,使用不失真的压缩算法。是一种比较好的图片格式。
- PNG格式是网上接受的最新图像文件格式。PNG能够提供长度比GIF小30%的无损压缩图像文件。它同时提供 24位和48位真彩色图像支持以及其他诸多技术性支持。PNG非常新,所以并不是所有的程序都可以用它来存储图像文件,但Photoshop可以处理PNG图像文件,也可以用PNG图像文件格式存储。PNG 支持高级别无损耗压缩,但作为 Internet 文件格式,与 JPEG 的有损耗压缩相比,PNG 提供的压缩量较少。PNG 支持 alpha 通道透明度,但作为 Internet 文件格式,PNG 对多图像文件或动画文件不提供任何支持。GIF 格式支持多图像文件和动画文件。PNG 支持伽玛校正。PNG 支持交错。PNG 受最新的 Web 浏览器支持,但较旧的浏览器和程序可能不支持 PNG 文件。
- RAW格式包含了原图片文件在传感器产生后,进入照相机图像处理器之前的一切照片信息。用户可以利用PC上的某些特定软件对RAW格式的图片进行处理。许多图像处理软件可以对照相机输出的RAW文件进行处理。这些软件提供了对RAW格式照片的锐度、白平衡、色阶和颜色的调节。此外,由于RAW拥有12位数据,你可以通过软件,从RAW图片的高光或昏暗区域榨取照片细节,这些细节不可能在每通道8位的JPEG或TIFF图片中找到。兼容性不够强仍然是限制RAW格式发展的最大障碍。
音频文件格式
有损压缩格式:AIFF、MPEG 、MP3、MPEG-4、MIDI、MIDI、WMA
无损压缩格式:WAV、APE(wav,ape,flac)
有损压缩详细格式:
- AIFF是苹果电脑上面的标准音频格式,属于QuickTime技术的一部分。由于AIFF的包容特性,所以它支持许多压缩技术。
- MPEG是一种有损压缩格式,但是它的最大优势是以极小的声音失真换来了较高的压缩比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4。
- Mp3是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应 *.mp1 / *.mp2/ *.mp3 这3种声音文件。需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用 *.mp3 格式来储存,一般只有 .wav 文件的1/10,因而音质要次于CD格式或WAV格式的声音文件。Mp3文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为.mp3格式的发展提供了良好的条件。Mp3这种格式还是很流行,作为主流音频格式的地位难以被撼动。
- MPEG-4标准是由国际运动图像专家组于2000年10月公布的一种面向多媒体应用的视频压缩标准。它采用了基于对象的压缩编码技术。MPEG-4以其高质量、低传输速率等优点已经被广泛应用到网络多媒体、视频会议和多媒体监控等图像传输系统中。中国内外大部分成熟的MPEG-4应用均为基于PC层面的客户端和服务器模式,应用在嵌入式系统上的并不多,且多数嵌入式MPEG-4解码系统大多使用商业的嵌入式操作系统,如WindowsCE、VxWorks等,成本高、灵活性差。如以嵌入式Linux作为操作系统不仅开发方便,且可以节约成本,并可以根据实际情况进行裁减,占用资源少、灵活性强,网络性能好,适用范围更广。
- MIDI格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。.mid文件重放的效果完全依赖声卡的档次。.mid格式的最大用处是在电脑作曲领域。.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成.mid文件。
无损压缩详细格式:
- WAV文件是波形文件,是微软公司推出的一种音频储存格式,主要用于保存Windows平台下的音频源。WAV文件储存的是声音波形的二进制数据,由于没有经过压缩,使得WAV波形声音文件的体积很大。WAV文件占用的空间大小计算公式是[(采样频率×量化位数×声道数)÷8]×时间(秒),单位是字节(Byte)。理论上,采样频率和量化位数越高越好,但是所需的磁盘空间就更大。通用的WAV格式(即CD音质的WAV)是44100Hz的采样频率,16Bit的量化位数,双声道,这样的WAV声音文件储存一分钟的音乐需要10MB左右,占空间太大了,一般不是专业人士(例如专业录音室等需要极高音质的场合)不会选择用WAV来储存声音。
- APE,最原始的文件(WAV)通常是很大的,比如一盘CD上的音乐,就是700M左右,如果把它分离成每首歌曲,那每首歌曲文件的大小在20——60M。这样大的文件即占用硬盘空间,也不适合在网上进行传递。所以,通常要把这个原始的大文件进行压缩。其压缩方式有多种,可以分为两大类,一类是没有损失的压缩,比如用猴子(monkey.exe)这个软件就可以实现,它可以把这个原始的音乐文件(WAV文件)压缩到原来大小的50——60%,文件格式是APE。越来越多的人选择APE格式,网络传播是功不可没的,众多的音乐发烧友在网上交流APE格式音乐。
- FLAC代表免费的无损音频压缩,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样。FLAC更看重解码的速度。解码速度快。FLAC的每个数据帧都包含了解码所需的全部信息。解码当前帧无需参照它前面或后面的数据帧。FLAC使用了同步代码和CRC(类似于MPEG等编码格式),这样解码器在数据流中跳跃定位时可以有最小的时间延迟。可以实现流化。非常适合于存档应用:FLAC是一个开放的编码格式,并且没有任何数据的损失,你可以将它转换为你需要的任何其他格式。除了每个数据帧的CRC和MD5标记对数据完整性的保障,FLAC(译注:FLAC项目提供的命令行方式编码工具)还提供了一个verify(校验)选项,当使用该选项进行编码的时候,编码的同时就会立即对已编码数据进行解码并与原始输入数据进行比较,一旦发现不同就会退出并且报警提示。便于对CD进行备份:FLAC有一个“cue表”metadata数据块用于保存CD的内容列表和所有音轨的索引点。你可以将一张CD保存到一个单一文件,并导入CD的cue表格,这样一个FLAC文件就可以完整地记录整张CD的全部信息。当你的原来的CD损坏的时候,你就可以用这个文件恢复出与原来一模一样的CD副本。抗损伤:由于FLAC的帧结构,使得一旦发生数据流的损坏,损失会被限制在受损伤的数据帧之内。一般只是会丢失很短的一个片段。而很多其他无损音频压缩格式在遇到损伤的时候,一个损伤就会造成后面所有数据的丢失。
视频文件格式
有损压缩格式:MPEG、AVI、ASF、MOV
无损压缩格式:目前在windows操作系统之中也是存在无损压缩的视频,但是其并不是受限于格式限制,比如说MP4这种格式既可以支持高强度的视频压缩也是可以支持无损压缩格式,只不过是我们一般使用的多数都是有损压缩而已。
有损压缩详细格式:
- MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法,从而减少运动图像中的冗余信息。MPEG的压缩方法说的更加深入一点就是保留相邻两幅画面绝大多数相同的部分,而把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的。目前MPEG主要压缩标准有MPEG-1、MPEG-2、MPEG-4、MPEG-7与MPEG-21。
- AVI是音频视频交错的英文缩写,将视频和音频封装在一个文件里,且允许音频同步于视频播放。这种视频格式的优点是图像质量好,可以跨多个平台使用;其缺点是体积过大,而且更糟糕的是压缩标准不统一,所以在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决,与DVD视频格式类似,AVI文件支持多视频流和音频流。它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管画面质量不是太好,但其应用范围仍然非常广泛。
- ASF格式是一种可以直接在网上观看视频节目的文件压缩格式。用户可以直接使用Windows自带的Windows Media Player对其进行播放。它使用了MPEG-4的压缩算法,其压缩率和图像质量都很不错。因为ASF是以一种可以在网上即时观赏的视频流格式存在的,所以它的图像质量比VCD差一点,但比同是视频流格式的RAM格式要好。
- MOV格式是Apple公司开发的一种音频、视频文件格式,用于存储常用数字媒体类型。当选择QuickTime(w.mov)作为保存类型时,动画将保存为.mov文件。Quick Time原本是Apple公司用于Mac计算机上的一种图像视频处理软件。QuickTime提供了两种标准图像和数字视频格式,即可以支持静态的*.PIC和*.JPG图像格式,动态的基于Indeo压缩法的*。MOV和基于MPEG压缩法的*.MPG视频格式。QuickTime因具有跨平台(MacOS/Windows)、存储空间要求小等技术特点,而采用了有损压缩方式的MOV格式文件,画面效果较AVI格式要稍微好一些。现在这种格式有些非编软件也可以对它实行处理,其中包括Adobe公司的专业级多媒体视频处理软件After Effect和Premiere等。
- WMV格式是微软推出的一种流媒体格式,它是在ASF格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。
- 3GP格式是“第三代合作伙伴项目”制定的一种多媒体标准,即一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是目前手机中最为常见的一种视频格式。
- FLV/F4V格式也是一种视频流媒体格式。由于它形成的文件较小、加载速度很快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好地使用等缺点,应用较为广泛。