MPEG-1声音压缩与MP3

摘　要：本文阐述了MPEG标准，重点介绍MPEG-1声音压缩标准，MPEG-1声音压缩与MP3播放器的关系，以及MP3播放器的形成和特点。

关键词：MPEG MPEG-1 MP3
　　一、MPEG概述
　　MPEG的全名为（Moving Pictures Experts Group，MPEG），中文译名是动态图像专家组。是在1988年由国际标准化组织（International Organization for Standardization，ISO）和国际电工委员会（International Electrotechnical Commission，IEC）联合成立的专家组，负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准。这个专家组开发的的标准成为MPEG标准，到目前为止，已经开发和正在开发的MPEG标准有：
　　1、MPEG-1：数字电视标准，1992年正式发布。是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准，主要用于在CD－ROM（包括Video－CD、CD－I等）存储彩色的同步运动视频图像，它针对SIF（标准交换格式）标准分辨率(NTSC制为352×240；PAL制为352×288)的图像进行压缩，每秒可播放30帧画面，具备CD(指激光唱盘)音质。同时，它还被用于数字电话网络上的视频传输，如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。
　　使用MPEG－1的压缩算法，可以将一部120分钟长的电影压缩到1.2GB左右，因此，它被广泛地应用于VCD制作和一些视频片段的下载，目前90％以上的VCD都是用MPEG－1格式压缩的。
　　2、MPEG-2：数字电视标准，1994年正式发布。是针对3～10Mbps的数据传输率制定的的运动图像及其伴音编码的国际标准。MPEG－2可以提供一个较广的范围改变压缩比，以适应不同画面质量、存储容量和带宽的要求。它在与MPEG－1兼容的基础上实现了低码率和多声道扩展：MPEG－2可以将一部120分钟长的电影压缩到4～8GB(它提供的是我们通常所说的DVD品质)，其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音声道(因此DVD可有8种语言配音)。
　　除了作为DVD的指定标准外，MPEG－2还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说，由于现在电视机分辨率的限制，MPEG－2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显，倒是其音频特性(如加重低音、多伴音声道等)得到了广泛的应用。
　　3、MPEG-3：已于1992年7月合并到高清晰度电视（HDTV）工作组，但由于MPEG-2的出色性能已能适用于HDTV，因此MPEG-3标准并未制定。
　　4、MPEG-4：多媒体应用标准，1998年11月被ISO/IEC批准为正式标准。是针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。
　　5、MPEG-5：直今还没有看到定义。
　　6、MPEG-6：直今还没有看到定义。
　　7、MPEG-7：多媒体内容描述接口标准。继MPEG－4之后，要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。1998年10月基于这种设想的MPEG－7标准被提出，它的正式名称是“多媒体内容描述接口”，将对各种不同类型的多媒体信息进行标准化的描述，并将该描述与所描述的内容相联系，以实现快速有效的搜索。
　　8、MPEG-21：MPEG在1999年10月的MPEG会议上提出了“多媒体框架”的概念，同年的12月的MPEG会议确定了MPEG-21的正式名称是“多媒体框架”或“数字视听框架”，它以将标准集成起来支持协调的技术以管理多媒体商务为目标，目的就是理解如何将不同的技术和标准结合在一起需要什么新的标准以及完成不同标准的结合工作。
　　二、MPEG-1 声音（MPEG-1 Audio）
　　MPEG-1声音标准方案由5个部分组成：①MPEG-1系统（MPEG-1 Systems），规定电视图像数据、声音数据及其他相关数据的同步。②MPEG-1电视图像（MPEG-1 Video），规定电视数据的编码和解码。③MPEG-1 声音（MPEG-1 Audio），规定声音数据的编码和解码。④MPEG-1一致性测试（MPEG-1 Conformance testing），这个标准详细说明如何测试位数据流和解码器是否满足MPEG-1前3个部分（Part1,2和3）中所规定的要求。这些测试可由厂商和用户实施。⑤MPEG-1软件模拟（MPEG-1 Software simulation），实际上，这部分的内容不是一个标准，而是一个技术报告，给出了用软件执行MPEG-1标准前3个部分的结果。
　　MPEG-1 声音压缩采用子带编码方法（sub-band coding，SBC），这种方法首先把时域中的声音数据变换到频域，对频域中的子带分量分别进行量化和编码；然后根据心理声学模型确定样本的精度，从而到达压缩数据量的目的。
　　MPEG-1 声音（MPEG-1 Audio）标准的主要性能指标如下：
　　（1）MPEG-1编码器的输入信号为线性PCM信号，采样率为32kHz、44.1 kHz或48 kHz，输出为32kb/s~384 kb/s。
　　（2）MPEG-1声音标准提供三个独立的压缩层次：层1（Layer 1）、层2（Layer 2）、层3（Layer 3），用户对层次的选择可在复杂性和声音质量之间进行权衡。
　　①层1（Layer 1）的编码器最为简单，编码器的输出数据率为384 kb/s，采用的算法主要是将数字音频输入分解成32个子带滤波器、将数据按一定的格式分块的固定分割、确定自适应比特分配的心理学模拟、以及使用块压扩和格式化的量化。主要用于小型数字盒式磁带（DCC），压缩率为4：1。
　　②层2（Layer 2）的编码器的复杂程度属于中等，编码器的输出数据率为256 kb/s ~192 kb/s，它提供对比特分配、标度因子和取样附加码，使用了差帧。其应用包括数字广播声音（DBA）、数字音乐、只读光盘交互系统（CD-I）和视盘（VCD）等，压缩率为6：1~8：1。
　　③层3（Layer 3）的编码器最复杂，编码器的输出数据率为64 kb/s，它基于一个混合滤波器组将频率分辨率提高，增加了非均匀量化器、自适应分割以及对于量化值的熵编码。广泛应用于ISDN网咯和电视应用、数字卫星广播，压缩率为10：1~12：1。
　　（3）压缩后的比特流具有预定的几种比特率之一。此外，MPEG－1音频标准也支持用户使用预定的比特率之外的比特率。
（4）编码后的比特流支持循环冗余校验CRC(Cyclic Redundancy Check)。
（5）MPEG-1音频标准还支持在比特流中载带附加信息。
　　MPEG-1声音压缩标准包括了三个使用高性能音频数据压缩方法的感知编码方案(perceptual coding schemes)。按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分別是Layer 1、Layer 2、La yer 3三个层次。所有三个层次的编码采用的基本结构是相同的。它們均采用传统的频谱分析和编码技术的基础上应用了子带分析和心理噪声感知模型理论。也就是通过研究人耳和大大脑视觉神经对音频失真的敏感度，在编码时先分析声音文件的波形，利用过滤器找出噪声电平(Noise Level)，然后滤去人耳不敏感的信号，通过矩阵量化的方式將余下的数据每一位打散排列，最后编码形成MPEG-1声音压缩文件。虽然压缩是有失真的，但对人耳来说这些失真是听不到的。也即对人耳而言，MPEG－1音频压缩是不失真的。因此，MPEG－1音频标准的应用非常广泛。
　　三、MP3播放器
　　1、MP3概念及MP3播放器的出现
　　MP3的全称是Moving Pictures Experts Group，Audio LayerIII，它就是MPEG-1层3（Layer 3）,所使用的技术就是MPEG-1层3（Layer 3）音频压缩技术。是对声音信号进行压缩的一种格式。市场上的所说的MP3，实指MP3播放器。
　　MP3格式研究于1987年在德国Erlangen的Fraunhofer研究所开始的，1989年Fraunhofer在德国被获准取得了MP3的专利权，几年后这项技术被提交到国际标准组织(ISO)，整合进入了MPEG-1标准。
　　最早的播放器是Frauenhofer在1990年早期开发的，但只是一个非常不知名的小程序，没有引起大家的重视。而被大家公认的第一个MP3播放器是在1997年，由一个叫做Tomislav?Uzelac的开发者开发的。他开发了AMP?MP3?播放引擎。当AMP引擎进入网络以后不久，个大学生Justin?Frankel?和Dmitry?Boldyrev拿到了Amp引擎，并且为它添加了一个Windows界面，最后他们把这个程序命名为""Winamp.""? 1998年，当Winamp作为免费的音乐播放器在网络上传播的时候，MP3的狂潮开始了。
　　2、MP3音乐的制作
　　将音频文件压缩成MP3文件，其实就是利用MP3编码器找到并删除音频文件中人耳听不到的声音。正常的人耳只能听到频率在20赫兹至2万赫兹的声音，音频文件中包含的一些声音可能超出了人耳所能听到的范围，另外还有一些细微的声音可能被更大的声音掩盖，还有一些音乐中的声音可能根本就是多余的。编码软件能将代表这类声音的文件找出来并加以删除。这样，原先臃肿的音频文件就变小了。压缩音乐文件时，人们通常会说以多大的压缩比率进行压缩，压缩比率的单位为Kbps(千字节/秒)。当选择较高的压缩比率时(如128Kbps)，原始文件中被去除的数据将会比较少，音质比较好，但压缩后的文件比较大，有时会导致文件无法使用；相反，当选择的压缩比率较低时(如64Kbps)，被去除的数据会比较多，这样做虽然缩小了文件，但却会造成音质损失。
　　3、MP3的特点
　　音乐品质好，由于MP3是采用1：10的数字压缩格式，在64kbs压缩率下,标准的MP3过滤掉了10kHz以上的声音来节省空间，以减小文件尺寸，但是音乐的细节部分特别是高频会受到损耗，所以，在听感上仍无法和采用传统模拟技术的磁带以及采用无损编码方式的CD唱片相媲美。
　　MP3格式压缩比高，可以使音乐文件在音乐质量做很小牺牲的情况下将文件大小缩小很多。因此，目前网络上的音乐格式以MP3最为常见。
　　MP3通用性开放性好，有移动随身听MP3播放设备，各种软件工具较多。因此，所有的语音、音乐等音频资料文件全部采用MP3压缩格式保存，参数：采样频率44.1kHz,采样精度16位，压缩比率128kbps，立体声。这种高质量的参数便于以后编辑处理，而其它各种数字音频则根据不同要求用相关软件再进行处理，但是原始文件质量一定要留有备份且品质要高，因为各种压缩格式都是有损压缩，无法复原。

[参考文献]
[1] 林福宗，多媒体技术基础[M]，北京，清华大学出版社，2000.8
[2] 赵英良，多媒体应用技术实用教程[M]，北京，清华大学出版社，2007.8
[3] 冯博琴等，多媒体技术及应用[M]，北京，清华大学出版社，2005.2
[4] 鄂大伟，多媒体技术基础与应用[M]，北京，高等教育出版社，2003.9
[5] 钟玉琢、蔡莲红、史元春、沈洪，多媒体计算机技术基础及应用(第二版) [M]，北京，高等教育出版社，2005.1