MPEG-2

MPEG-2适用于数位影片广播和数位多功能光碟其中的TS,以及PS,皆属于容器格式

MPEG-2是「运动图像和相关音讯资讯的通用编码」的标准。它用了有损视讯压缩有损音讯资料压缩方法的组合,允许使用当前可用的储存媒体和传输频宽储存和传输电影。虽然MPEG-2的效率不如H.264/AVCH.265/HEVC等新标准,但与现有硬体和软体的向下相容性意味着它仍在广泛使用,例如在无线数位电视广播和DVD-Video中。

第1部分的MPEG - 2解决互相结合的一个或多个基本码流的视讯和音讯,以及其他数据为一个或多个位元流,其他数据适合储存或传输。 具体来说有两种形式:程式流和传输流。

程式流是类似于 MPEG - 1系统的多重。它的结果从一个或多个Packetised Elementary Streams(PES)的结合,其中有一个共同的时间基准。 而程式流是专门使用在相对无错误的环境和适当的应用,这有可能干涉到软体处理。程式流封包可能会成为易变且相对长的长度。

传输流结合一个或多个PES,使具有一个或多个独立时基(time bases )的PES成为一个流。从一个程式中 基本流(Elementary streams )共享一个共同的时基。 传输流是专为使用在有可能发生错误的环境,如储存或传输损耗或嘈杂的媒体。 传输流的封包有188位元组。

第2部分的MPEG - 2建立在强大的压缩视讯功能的MPEG - 1水准,提供范围广泛的编码工具。 这些提供不同的功能。 在1994年11月时,MPEG - 2视讯最终认可时。使用现有的编码工具的MPEG - 2视讯,而具有处理的图片有颜色解析度4:2:2和较高的位元率( bitrate)的能力。.在经过一组进行了对照试验证实了 MPEG - 2比MPEG视讯更好,而且在许多情况下时,在位元率或演播室应用的标准或规格有更好的发展。 4:2:2模式已在1996年1月最终批准,现在是MPEG - 2视讯一个不可或缺的部分。而Multiview Profile 是一个使用现有的MPEG - 2视讯编码工具,它可以进行编码视讯序列在两个镜头拍摄的同一场景而他们微小角度之间,在1996年7月最终批准。

MPEG-2技术也应用在了HDTV传输系统和蓝光光碟中。

MPEG-2的第三部分定义了音讯压缩标准。用指定的编码表示,可以用来压缩音讯序列-包括单声道和立体声。该部分改进了MPEG-1的音讯压缩,支援两通道以上的音讯。MPEG-2音讯压缩部分也保持了向下相容的特点。

MPEG的第四和第五部分- 对应于第四部分和第五部分的MPEG - 1。 第四部分指定如何测试验证码流和解码器是否符合要求所指明的第1,第2和第3的MPEG - 1标准。这些测试可以验证厂家的编码器和他们的客户,是否有有效的位元流产生。 第五部分在技术上没有一个标准,具有一个技术报告,提出了一个完整的软体实施前三部分的MPEG - 1标准。

MPEG-2的第七部分定义了不能向下相容的音讯压缩。该部分提供了更强的音讯功能。通常我们所说的MPEG-2AAC指的就是这一部分。

MPEG-2的第八部分,原计划进行编码的视讯时,输入样本为10位。 在进行这部分工作之后,因为一些因素而停止开发。

MPEG-2的第十部分是一致性测试的一部分。

标准技术细节

一个MPEG-2系统流一般包括两个基本元素:

  • 视讯资料 + 时间戳
  • 音讯资料 + 时间戳

以下为MPEG-2中用到的重要压缩技巧:

1. 空间上的冗余去除 视讯资料的一个特性是空间冗余。一般来说,在同一张画面上必有一些共通特性,也许是色彩上的,也许是几何上的,或是其它特征值得到的。所谓的空间冗余去除,就是要辨识出画面中重要的元素,并移除重复且较无影响的元素的动作。MPEG-2用到色彩取样,离散余弦变换等冗余去除手法。

2. 时间上的冗余去除 视讯资料的另一个特性是时间上的冗余。一般播放的视讯,其实只是一连串连续的图像序列,然而因为人类视觉的视觉暂留现象,所以会有连贯影像的错觉。而此种视讯因为画面间时间间隔甚小,因此相临的画面几无差异,大多只是图像内容的位置变化。因为有此现象产生,所以我们可以利用除去在时间轴上画面与画面的相似性造成的冗余来进行压缩。MPEG-2用的动态补偿即为此类手法,在做动态补偿之前,首先将画面分为16x16的大区块(Macro-block,MB),然后找寻其在参考画面(Reference Picture)中近似的大区块所在位置,并将由目标大区块到参考大区块间位置的坐标差记录成动态向量(Motion Vector)。参考画面在该画面之前,称为向前预测(Forward Prediction);参考画面在该画面之后,称为向后预测(Backward Prediction);而参考画面在该画面前后都有,称为双向预测(Bi-directionally Prediction)。而整个找寻动态向量的过程称为动态估计(Motion Estimation),常见的有区块匹配法(Block Match Method)及递回法(Recursive Method)。

视讯编码概述

MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余资讯。如果我们能将这些冗余资讯去除,只保留少量非相关资讯进行传输,就可以大大节省传输频带。而接收机利用这些非相关资讯,按照一定的解码演算法,可以在保证一定的图像品质的前提下恢复原始图像。

MPEG-2视讯通常包含多个GOP(Group Of Pictures),每一个GOP包含多个影格(frame)。影格的影格类(frame type)通常包括I-影格(I-frame)、P-影格(P-frame)和B-影格(B-frame)。其中I-影格采用影格内编码,P-影格采用前向估计,B-影格采用双向估计。

I影格图像采用影格内编码方式,仅使用本身的画面资料进行空间的冗余去除,并没有参考其他画面的资料,我们称为Intra模式大区块(Intra Mode Macro-block)。在I影格图像中,所有的大区块皆为Intra模式大区块。I影格图像可以做为视讯资料流中的索引点,也是提供随机存取能力的主要来源。I画面通常在视讯序列或画面群组的第一张,解码时I画面可独立解码,并做为P及B画面的参考影像的来源。由于不须参考其他画面,因此无法得到消除时间上冗余的好处,因此压缩率较差。

P影格和B影格图像采用影格间编码方式,即同时利用了空间和时间上的相关性。P影格图像会使用参考画面(Reference Picture),这些参考画面可为该影格前面最近的I影格或P影格。编码时,在P影格中的大区块,若能在参考画面上找到相对应的大区块,则用动态补偿方式做预测编码(Predictive Coding);若找不到,则以Intra模式做编码。由于加入消除时间上冗余的技术,因此其编码效率较高。

B影格图像采用双向时间预测,会使用到前面及后面两个方向参考画面的资料。如同P影格一样,可以大大提高压缩倍数。值得注意的是,由于B影格图像采用了未来影格作为参考,因此MPEG-2编码码流中图像影格的传输顺序和显示顺序是不同的。 B影格拥有最高的编码效率,然画质最差,故本身不再做为其他预测编码用。

MPEG-2的编码码流分为六个层次。为更好地表示编码资料,MPEG-2用句法规定了一个层次性结构。它分为六层,从上至下依次为:视讯序列层(Sequence),图像组层(GOP: Group of Picture),图像层(Picture),像条层(Slice),大区块层(Macro Block)和像块层(Block)。可以看到,除大区块层和像块层外,上面四层中都有相应的起始码(Start Code,SC),可用于因误码或其它原因收发两端失步时,解码器重新捕捉同步。因此一次失步将至少遗失一个像条的资料。

一般来说输入视讯格式是25(CCIR标准)或者29.97(FCC)影格/秒。

MPEG-2支援隔行扫描逐行扫描。在逐行扫描模式下,编码的基本单元是影格。在隔行扫描模式下,基本编码可以是影格,也可以是(field)。

原始输入图像首先被转换到YCbCr色彩空间。其中Y是亮度,Cb和Cr是两个色度通道。对于每一通道,首先采用块分割,然后形成「大区块」(macroblocks),大区块构成了编码的基本单元。每一个大区块再分割成8x8的小块。色度通道分割成小块的数目取决于初始参数设定。例如,在常用的4:2:0格式下,每个色度大区块只采样出一个小块,所以三个通道大区块能够分割成的小块数目是4+1+1=6个。

对于I-影格,整幅图像直接进入编码过程。对于P-影格和B-影格,首先做运动补偿。通常来说,由于相邻影格之间的相关性很强,大区块可以在前影格和后影格中对应相近的位置找到相似的区域匹配的比较好,这个偏移量作为运动向量被记录下来,运动估计重构的区域的误差被送到编码器中编码。

对于每一个8×8小块,离散余弦变换把图像从空间域转换到频域。得到的变换系数被量化并重新组织排列顺序,从而增加长零的可能性。之后做游程编码(run-length code)。最后作哈夫曼编码(Huffman Encoding)。

I影格编码是为了减少空间域冗余,P影格和B影格是为了减少时间域冗余。

GOP是由固定模式的一系列I影格、P影格、B影格组成。常用的结构由15个影格组成,具有以下形式IBBPBBPBBPBBPBB。GOP中各个影格的比例的选取和频宽、图像的品质要求有一定关系。例如因为B影格的压缩时间可能是I影格的三倍,所以对于计算能力不强的某些即时系统,可能需要减少B影格的比例。

MPEG-2输出的位元流可以是匀速或者变速的。最大位元速率,例如在DVD应用上,可达10.4 Mbit/s。如果要使用固定位元速率,量化尺度就需要不断的调节以产生匀速的位元流。但是,提高量化尺度可能带来可视的失真效果。比如马赛克现象。

音讯编码

MPEG-2的音讯编码包括:

  • 使用一半的取样速率处理低位元速率的音讯。
  • 多通道编码达到5.1个通道
  • 提供MPEG-2 AAC,且不能向下相容。

MPEG-2在DVD上的应用

DVD中采用了MPEG-2标准并引入如下技术参数限制:

  • 解析度
  • 纵横比
    • 4:3
    • 16:9
  • 影格率(影格播放速度)
    • 59.94场/秒,23.976影格/秒,29.97影格/秒(NTSC)
    • 50场/秒,25影格/秒(PAL)
  • 视讯+音讯位元速率
    • 平均最大缓冲区9.8 Mbit/s
    • 峰值15 Mbit/s
    • 最小值300 Kbit/s
  • YUV 4:2:0
  • 字幕支援
  • 内嵌字幕支援(NTSC only)
  • 音讯
    • LPCM编码:48kHz或96kHz;16或24-bit;最多可达6声道
    • MPEG Layer 2(MP2):48 kHz,可达5.1声道
    • 杜比数位-Dolby Digital(DD,也称为AC-3):48 kHz,32-448 kbit/s,可达5.1声道
    • 数位家庭影院系统-Digital Theater Systems(DTS):754 kbit/s或1510 kbit/s
    • NTSC格式DVD必须包含至少一道LPCM或Dolby Digital
    • PAL格式DVD必须包含至少一道MPEG Layer 2、LPCM或者Dolby Digital
  • GOP结构
    • 必须为GOP提供序列的头资讯
    • GOP最大可含影格数目:18(NTSC)/15(PAL)

MPEG-2在DVB下应用

DVB-MPEG相关技术参数:

  • 标准画质电视(SDTV)必须符合以下一种解析度:
    • 720×480像素,24/1.001,24,30/1.001或30影格/秒
    • 640×480像素,24/1.001,24,30/1.001或30影格/秒
    • 544×480像素,24/1.001,24,30/1.001或30影格/秒
    • 480×480像素,24/1.001,24,30/1.001或30影格/秒
    • 352×480像素,24/1.001,24,30/1.001或30影格/秒
    • 352×240像素,24/1.001,24,30/1.001或30影格/秒
    • 720×576像素,25影格/秒
    • 544×576像素,25影格/秒
    • 480×576像素,25影格/秒
    • 352×576像素,25影格/秒
    • 352×288像素,25影格/秒
  • 高画质电视(HDTV)必须符合以下一种解析度:
    • 720×576×50影格/秒逐行扫描(576p50)
    • 1280×720×25或50影格/秒逐行扫描(720p50)
    • 1440或1920×1080×25影格/秒逐行扫描(1080p25 = 电影模式)
    • 1440或1920×1080×25影格/秒隔行扫描(1080i50)

MPEG-2和ATSC

  • 必须符合以下一种解析度:
    • 1920 × 1080像素,最多60影格/秒(1080i
    • 1280 × 720像素,最多60影格/秒(720p
    • 720 × 576像素,最多50影格/秒,25影格/秒(576i,576p)
    • 720 × 480像素,最多60影格/秒,30影格/秒(480i480p
    • 640 × 480像素,最多60影格/秒

注:1080i按1920×1080像素编码,但是最后8行在显示时抛弃。

MPEG-2标准文件号码

  • ISO/IEC 13818-1:系统-描述视讯和音讯的同步和多路技术
  • ISO/IEC 13818-2:视讯-视讯压缩
  • ISO/IEC 13818-3:音讯-音讯压缩,包括多通道的MP3扩充。
  • ISO/IEC 13818-4:测试规范
  • ISO/IEC 13818-5:仿真软体
  • ISO/IEC 13818-6:DSM-CC(Digital Storage Media Command and Control)扩充
  • ISO/IEC 13818-7:Advanced Audio Coding(AAC)
  • ISO/IEC 13818-9:即时介面扩充
  • ISO/IEC 13818-10:DSM-CC规范
  • ISO/IEC 13818-11: IPMP on MPEG-2 systems

专利持有者

参见

参考资料

  1. ^ ISO/IEC 13818-1:2000 - Information technology -- Generic coding of moving pictures and associated audio information: Systems. www.iso.org. [4 May 2018]. (原始内容存档于2007-05-20). 

#