|
|
| 首批MPEG-4编解码器的综述比较(一) |
|
| |
MPEG在决定数字视频产品的开放标准方面一直处于领先地位。创建于1988年的国际标准化组织(ISO)工作组先后在1992年和1994年提出了MPEG-1和MPEG-2作为数字视频的国际标准。其中MPEG-1规定了活动图像及其伴音的数字数据的编码、存储和检索以及数据流压缩率等标准。MPEG-2则力求取得更好的分辨率,它主要用于数字视频广播、DVD和HDTV等应用场合。MPEG-4延续了上述两者积累的经验,并联合了几十个国家的科技精英,集许多专利技术在一起,完全弥补了上述两种标准的不足之处,它以完整的对象为图像处理目标,更多地强调多媒体通信的交互性、灵活性和编码的高效性,广泛应用于因特网、无线传输与广播、卫星传输与直播、数字电视、移动多媒体通信、交互式多媒体和低码率/高效率的高质量AV服务等领域。它于1993年就开始进行标准制定的准备工作,1998年正式通过了版本1,一年多以后又通过了版本2。之所以花那么长的时间,是由于MPEG-4是一种庞大、复杂的标准,其各方面的特色需要用一本厚厚的书来综述。但由于其利益牵涉到方方面面,尤其是使用MPEG-4专利技术的授权问题曾经历了多次反复,不少从事MPEG-4的软件开发商无法进行其实际产品的开发。直到2002年1月31日,MPEG一站式服务的授权管理机构MPEG
LA(Licensing Authority)终于向媒体发布了统一的授权办法和概括了MPEG-4标准中的两个主要档次的授权项目新闻稿,结束了长期以来光说不练的局面,完成了MPEG-4从构思理念到标准制定,又从制定的标准转而推出实际MPEG-4产品的两次飞跃。
本文综述和比较了最近推出和正在开发中的几款MPEG-4编解码器的性能,并用几种MPEG-4播放器测试验证了这些编解码器的实际性能。由于测试均通过使用此前发布的软件进行的,因此无法公布这些编码器的具体得分。但通过对这些编解码器的测试性能综述,用户可全面了解当前MPEG-4的总体情况和开发中的潜在问题。
一、档次和等级
上面已经说过,MPEG-4标准本身非常庞大复杂,其各种特色涉及到几百种具体规范,但对某一种具体应用来说,其涉及的范围相当小,它只是其庞大功能整集中的一个子集,因此可以用档次(Profiles)和等级(Level)来具体规定其功能范围和数值大小。档次是指对特色和功能在性质上的制定,而等级则是指在同一档次内其功能在数量上的复杂程度。有了这种档次与等级的分类方法,MPEG-4标准就可以规定具体编解码器哪些该处理、哪些则不该处理的内容。只要遵循这些规则,任何符合规定的器件,不管是计算机软件、手机还是机顶盒,都可以正常工作。
因特网串流媒体联盟ISMA(Internet Streaming Media Alliance)是由Apple、IBM、Cisco、Kasenna、Philips和Sun等公司组成的联合团体,其宗旨是提出一个为MPEG-4使用的标准,这一标准有可能成为重要的开放式通用标准。ISMA提出的初步标准为档次0和档次1,前者主要用于窄带网,后者则用于宽带网。但目前非ISMA成员的Microsoft和RealNetworks尚未表态支持ISMA档次,RealNetworks只是从ISMA成员Envivio获得MPEG-4回放工具的授权,而Microsoft的Windows
Media播放器还不能提供任何支持MPEG-4文件格式和数据流的任何MPEG-4回放能力,而且也没有公开表示准备添加这一能力。Apple则宣称准备在QuickTime的下一版本中支持ISMA档次中的0和1,但由于MPEG-4的授权问题,目前尚未有任何进展。
表1列出了按档次与等级分类的各种档次及每一档次中的各种等级,用来传送MPEG-4的各种视频信息。
表中CIF代表普通图像格式(Common Image Format),其中QCIF为176×144,CIF为352×288,2CIF为352×576,4CIF为720×576像素。
1、 简单档次。是迄今为止最普通的档次,它对开发商来说即使在移动设备上也是最容易实现和解码的,它可用于低功率器件的视频录制。简单档次中的等级1相当于ISMA标准中的档次0,而等级0的极限帧率为15fps,其他档次的极限帧率均为30fps。简单档次对低功率的移动通信器件来说可能是最重要的档次,因为主流产品制造厂家由于要考虑较高的图像质量,可能不会选择简单档次而选择高级简单档次。
2、高级简单档次。是简单档次的超集,因此它可处理全部简单档次的内容。高级简单档次加进了许多增强措施来支持更好的视频质量,这些措施有B帧、全局移动补偿(GMC)和1/4像素移动估值。高级简单档次的等级3相当于ISMA标准中的档次1。希望高级简单档次能成为台式计算机、机顶盒和其他高功率器件的第一个主流MPEG-4视频档次。
3、简单可定标档次。它只是在简单档次的基础上加一增强层,使服务器能通过降低图像质量、帧率或分辨率等手段来动态地降低码率。PacketVideo是目前推出简单可定标档次创作工具和播放器的唯一公司。
4、精密可定标档次(FGS)。采用现有的简单档次和高级简单档次的全部内容并添加多级带宽以便取得比简单可定标档次有更高的质量。但本文综述的七种编码器目前还无一能支持FGS。
5、核心档次。它是在简单档次的基础上加上B帧和1比特形状编码而形成的,它支持实时掩蔽功能,透明度掩蔽本身在整个图像范围内都是相同的。同一档次中的两种等级都给予CPU留有足够的附加能力用来同时处理屏幕上的多重重叠目标和视频图像。
6、核心可定标档次。它增加了可变帧率和分辨率,这种多码率(MBR)带宽的减缩可便于服务器将视频信号的数据率与所连接线路的速率统一起来。
7、主档次。它的目标在于交互式广播,因而支持隔行扫描的视频信号。广播电视台所谈到的交互式MPEG-4的未来时,指的就是主档次。主档次中的最高等级可用来取代现有的DTV系统用于HDTV传输。主档次中没有等级1,因为主档次并非设计用来作低码率传输的。目前,Envivio和iVast两公司都已拥有编码工具和播放器,可支持主档次的先进特色。
二、MPEG-4编解码器的测试方法
测试的7种编解码器每种都对4种不同的图像源片段(如图1)进行压缩处理。图1a为一段电影图像,图1b为一段谈话人的人头图像,图1c为一段移动图形,图1d为一段高速移动图像。每一图像源片断的长度均为60秒,且不包括音频信号,然后对各个编解码器的性能进行评估。
电影图像测试片段由各种24fps的逐行扫描组成,它提供有黄金时间的戏剧、故事片和其他拍摄得很好的电影连续镜头,它们具有典型的帧率和图像的复杂程度
;谈话人头图像测试片段是一段未经剪辑的连续图像,很便于压缩,因此是判定编解码器将基本帧和增量帧之间质量匹配能力的一种优良测试材料 ;移动图形测试片段包括一系列越来越复杂的移动图形动画片,用来测试编解码器的彩色保真度和处理复杂移动动作的能力,因为对编解码器来说,要处理好滚动的文字特别困难
;高速移动图像测试片段是用快速移动、快速剪辑和复杂构图来考验编解码器的响应能力,看它是否能对这种特别困难的图像源仍然能保持正确的数据率。
每种编解码器的压缩工具均能支持不同的输入文件类型,绝大多数能接受AVI,但普遍不能接受YCrCb
4 : 2 : 0的格式,因此全部图像源片段都应事先准备成未压缩的RGB AVI文件,以便于读取数据信息。
测试中选择了三种目标数据率和分辨率组合作为统一的测试标准 :
1、30kbps和176×144像素。电影图像测试片段的帧率为8fps,其他三种像源均为10fps
;
2、200kbps和320×240像素。电影图像测试片段的帧率为24fps,其他三种像源均为29.97fps
;
3、800kbps和640×480像素。电影图像测试片段的帧率为24fps,其他三种像源均为29.97fps。
上面选定的三种目标数据率和分辨率组合主要是模拟典型的压缩视频传输的几种常用选项,其中30kbps的数据率归属于ISMA的档次0,用于移动通信器件
;200kbps的数据率是典型的保险数据率,其目标主要用于如DSL(数字用户线)和电缆调制解调器等领域的宽带连接 ;800kbps和640×480的数据率已超出ISMA的档次1的参数范围之外,并不是所有的MPEG-4播放器和编解码器都能支持它,但它是对编解码器和播放器高质量传输能力的最佳测试组合。
虽然各种编解码器自身的缺省压缩设置值是不同的,但在测试中还是设法尽量使它们统一标准化起来。在所有情况下,将这些编解码器均设置在其最高质量的模式下,即使这样做可能会导致较长的压缩时间。如果这是一种可选用的方案,则采用二次通过法的编码方案来进行压缩。这里要强调的一点是为了保证图像质量,在必要时可用一些帧率保留量。如果要对移动搜索值进行规定的话,则可将32像素用于30kbps
176×144和 200kbps 320×240的样值,将64像素用于800kbps 640×480样值。在绝大多数情况下,每隔10秒插入一帧基本帧。如果该种工具不支持10秒,则插入基本帧的时间分隔可取该种工具所能支持的最长时间值
;对于以简单档次和高级简单档次文件两者为目标的编解码器,则对两者分开编码。编解码器提供高级简单档次文件的特色也不相同,有的只加B帧,有的包含有1/4像素移动估值,有的则不能确定其精确算法。
如果一种编解码器能够对下载和串流提供优化的模式——典型地称作VBR(可变码率)和CBR(恒定码率),则就对这两种模式均进行编码。只有在VBR的实施办法中不能提供数据率的两个划定限值时才不进行VBR编码。
|
| |
| |
|