脉冲编码调变
脉波编码调变(英语:Pulse-code modulation,缩写:PCM)是一种类比讯号的数位化方法。PCM将讯号的强度依照同样的间距分成数段,然后用独特的数位记号(通常是二进位)来量化。PCM常用于数位电信系统上,也是电脑和红皮书中的标准形式。在数位视讯中它也是标准,例如使用 ITU-R BT.601。但是PCM并不流行于诸如DVD或DVR的消费性商品上,因为它需要相当大的位元率(DVD格式虽然支援PCM,不过很少使用);与之相较,压缩过的音讯较符合效率。不过,许多蓝光光碟使用PCM作音讯编码。非常频繁地,PCM编码以一种序列通讯的形式,使数位传讯由一点至下一点变得更容易——不论在已给定的系统内,或物理位置。
调变
在图示中,一个正弦波(红色曲线)取样和量化为PCM。正弦波在每段固定时间内得到取一次样,即x轴的刻度。而每一个样本则依照某种运演算法(在这个例子中是ceiling function),选定它们在y轴上的位置。这样便产生完全离散的输入讯号的替代物,很容易编码成为数位资料,以作储存或操纵。以右图为例,很清楚看出样本为8、9、11、12、13、14、15、15、15、14…等,将它们以二进位编码,就得到一组一组的数字:1000、1001、1011、1100、1101、1110、1111、1111、1111、1110…等,这些数位资料之后就可以由特定用途的DSP或者一般的CPU所处理。有一些PCM资料流可以和较大的聚合资料流作多工传输(multiplex),通常在物理层传输资料时都会这么做。这个技术称作 「分时多路复用(Time-Division Multiplexing,TDM)」 (或 「分时多工」,「分时复用」),非常广泛地使用,例如现代的公共电话系统。
有许多方法可以内建一个处理调变的真实装置。在真实系统中,这种装置一般获放在单一个晶片中,并搭配一个振荡器,称作「类比至数位转换器(analog-to-digital converter,ADC)」。这些装置透过振荡器触动输入讯号的接受,并且输出数位化的讯号至某种处理器。 差分脉波编码调变(DPCM) 波形编码器的一个重要分支称为差分编码器。这一类编码器包括增量调变(DM)和差分脉波编码调变(DPCM)。差分编码器的工作原理就是消除冗余和减熵。消除冗余是对输入样本与预测值之差进行量化,达到一定的幅值水平。因此,差分编码器的两个重要组成部分就是预测器和量化器。 DPCM的工作原理以时刻k-1的输出值为基础预测时刻 k的预测值。记为 ŝ (k|k-1),从时刻k的输入讯号s(k)中减去预测值,得到预测误差讯号e(k),量化预测误差,然后对量化的预测误差eq(k)进行编码,传送到接收端。eq(k)加上同样编码后的ŝ(k|k-1)就得到了输入样本重构值ŝ (k)。假定不存在频道误差,接收端可准确完成重构。在传送端和接收端,均能以时间k的重构值为基础预测时刻k+1的预测值,然后重复以上的过程。 DPCM系统的主要成分是量化器、二进位编码器/解码器和预测器。 嵌入式差分脉波编码调变 在通讯和电脑网路中,不论何时出现通讯繁忙的情况,都允许网路减轻负载,这有时是一个优势。如果允许在传送资料时丢掉最不重要的位,而且信源也不用重新编码,这样就可以实现前面的设想,可是,并不是所有信源的资料表示都可以这样做而不引起重构信源的较大误差,实际上,大多数压缩资料都不能这样简单地丢弃一个位,在这些情况下(Goodman1980)用嵌入编码的压缩方法来处理。 多脉波线性预测编码(MPLPC) 多脉波线性预测编码具有 LPC(线性预测编码)和 ADPCM(自适应差分脉波编码调变)的预测编码结构,它与这些系统的不同之处在于它是一个分析-综合编码器,并采用感知权重设定。 MPLPC试图通过改进激励模型提高LPC的效能,但是不希望像 ADPCM和其他一些波码器那样直接量化、传送预测误差。为达到这一点,MPLPC采用几个脉波作为一个语音影格的合成滤波器激励。脉波数量事先选好,但需要考虑复杂性和语音品质。一般看来,MPLPC需要防止提取脉波间隔。对于16kbit/s以下的高品质语音,其激励搜寻的复杂度是可以容忍的,需要一个间隔预测回圈。
码激励线性预测编码
码激励线性预测编码(CELP)是在9.6kbit/s以下速率中广泛应用的语音编码。其目的是将多脉波 LPC中使用的分析-综合方法扩充到低位元速率范围。指导思想是用有限数量的储存序列替代多脉波激励。这个序列为码本。 CELP中的码本编码方法基于下面两个事实。
(1) 用长时或短时预测清除语音讯号的冗余之后,剩余讯号序列相互独立可用,具有相同概率分布的随机变序列所精确类比,这个序列称为更新序列或激励序列。
(2)为了编码,可以找出有限数量的序列近似在语音片段中出现的重要激励序列。这个激励序列称为码本。 由于这两个因素,先要找出给定块的语音编码最好的长时和短时预测器,用各种可能的激励作用于它们,然后找出码本中的序列,生成与输入语音最相似的合成语音讯号。长时和短时预测器资讯和从码本中选出的激励序列的二进位数全都送入接收端进行合成。 Atal和 Schroeder(1984)首次成功地证明了码激励方法的有效性。
通常,在考虑频谱的精细结构时,语音过程可由长时预测器建模。在考虑频谱范围和共振时可由短时预测器来给出基音。 在随机编码的研究中,级联预测器的激励是一个 Gaussian分布的白杂讯序列。为了用这个结构对语音编码,每5~25ms就要用 LPC中的技术对长时和短时预测器编码。随机编码或 CELP的目标是提高LPC品质,提供一种对基音提取不敏感并且不依赖于清/浊音分类的方法,这和 LPC有所不同。
在随机码本中,只需要较少码字就可以产生良好的效能,Atal和 Schroeder的研究可以使1 024个码表示40个样本,尽管1 024看起来很大,如果我们用一个独立的二进位数表示这40个语音样本中的每一个时,我们将有2=10种可能的序列。由此看来,1 024相对要小多了。甚至有些系统的码本只有256个。 除了随机码本,研究者还研究了卷积码,向量量化,置换码和经验设计码本,这些在语音编码中都可以应用,有些码本对一些说话者的语音来说比其他码本要好,当然,码本中包含较多序列可以提高效能,也使复杂度和资料速率增加。 激励码本的离线训练可以提高合成语音的品质,这似乎是一个规律。然而,最近的研究可以使码本中所有脉波具有同样的幅值水平,合成语音品质不受影响,如果找到一种方法能高效地搜寻激励脉波位置,那么编码综合分析搜寻就可以大大简化。
E1是PCM其中一个标准(表现形式)。由PCM脉码调变编码中E1的时槽特征可知,E1共分32个时槽TS0-TS31。每个时槽为64K,其中TS0为被影格同步化码,Si,Sa4,Sa5,Sa6,Sa7,A位元占用,若系统运用了CRC校验,则Si位元位置改传CRC校验码。TS16为信令时槽,当使用到信令(共路信令或随路信令)时,该时槽用来传输信令,使用者不可用来传输资料。所以2M的PCM码型有 (1)PCM30:PCM30使用者可用时槽为30个,TS1-TS15,TS17-TS31。TS16传送信令,无CRC校验。 (2)PCM31:PCM30使用者可用时槽为31个,S1-TS15,TS16-TS31。TS16不传送信令,无CRC校验。 (3)PCM30C:PCM30使用者可用时槽为30个,TS1-TS15,TS17-TS31。TS16传送信令,有CRC校验。 (4)PCM31C:PCM30使用者可用时槽为31个,TS1-TS15,TS16-TS31。TS16不传送信令,有CRC校验。 CE1,就是把2M的传输分成了30个64K的时槽,一般写成N*64, CE1----最多可有31个频道承载资料timeslots1----31timeslots0传同步
PCME1形式结构 在PCME1形式频道中,8bit组成一个时槽(TS),由32个时槽组成了一个影格(F),16个影格组成一个复影格(MF)。在一个影格中,TS0主要用于传送影格。定位讯号(FAS):CRC-4(回圈冗余校验)和对端告警指示,TS16主要传送随路信令(CAS)、复影格定位讯号和复影格对端告警指示,TS1至TS15和TS17至TS31共30个时槽传送话音或资料等资讯。称TS1至TS15和TS17至TS31为净荷,TS0和TS16为开销。如果采用带外公共频道信令(CCS),TS16就失去了传送信令的用途,该时槽也可用来传送资讯讯号,这时影格结构的净荷为TS1至TS31,开销只有TS0。 PCME1形式介面 G703非平衡的75ohm,平衡的120ohm2种介面 [2] 。
PCME1的三种方法 (1)将整个2M用作一条链路,如DDN2M; (2)将2M用作若干个64k及其组合,如128K,256K等,这就是CE1; (3)在用作语音交换机的数位中继时,这也是E1最本来的用途,是把一条E1作为32个64K来用,但是时槽0和时槽15是用作signaling即信令的,所以一条E1可以传30路话音。PRI就是其中的最常用的一种接入方式,标准叫PRA信令。用2611等的广域网路介面卡,经V.35-G.703转换器接E1线。这样的成本比E1卡低,DDN的2M速率线路是经HDSL线路拉至使用者侧。E1可由传输装置出的光纤拉至使用者侧的光端机提供E1服务。
PCME1形式使用注意事项
PCME1形式介面对接时,双方的E1不能有讯号遗失/影格失步/复影格失步/滑码告警,但是双方在E1介面参数上必须完全一致,因为个别特性参数的不一致,不会在指示灯或者告警台上有任何告警,但是会造成资料通道的不通/误码/滑码/失步等情况。这些特性参数主要有;阻抗/影格结构/CRC4校验 PCME1形式阻值有75ohm和120ohm两种,PCME1形式影格结构有PCM31/PCM30/不成影格三种。
PCME1形式和PCME2形式区别 (1)PCMT1形式是高速传输的另一种标准。一条PCMT1形式可以同时有多个并行频道,每个频道都是一个独立的连接。在美国的标准PCMT1形式服务提供24个频道,每个频道的速率是56K。PCMT1形式服务与其相应的装置ISDN和普通电话相比都更加昂贵。而PCME2形式相对费却较少。 (2)PCMT1形式通常用于需要在远端站点间进高频宽高速率传输的大型组织。64K专用资料线(DDL)作为T1服务的一个变种或一个分支服务,也提供此类服务。而一条PCME1形式线,只要有ProxyServer提供的缓冲功能,在同等传输下,比PCMT1形式可以有效地节省频宽。 (3)PCMT1形式提供23个B频道和一个D频道,即23B+D.1.544Mbps;PCME1形式提供30个B频道和一个D频道,即30B+D.2.048Mbps (4)PCMT1形式表示具有高品质的通话和资料传送介面,北美使用T1标准,能够支援Max的24位元使用者同时拔号,而欧洲使用E1标准,可以支援30位使用者,PCMT1形式仅是MAX的简单介面。
分时多工编辑 所谓分时多工,是将某一频道按时间加以分割,各路讯号的抽样。值依一定的顺序占用某一时间间隔(也成时槽),即多路讯号利用同一频道在不同的时间进行各自独立的传输。
分时多工的特点: 1、复用装置内部各通路的部件基本通用 2、要求收、发两端同时工作,要求有良好的同步系统。 分时多工的目的:一个频道传输多路讯号,即若干路讯号可以采用分时多工方式以一定的 结构形式复接成一路高速率的复合数位讯号-群路讯号。 数位复接包括bit复接和码组复接。 PCM-30/32路通讯装置是采用码组复接的分时多工系统。 在30/32路PCM系统中,影格结构中第一个时槽TS0用于传送影格同步化讯号,TS16用于传送话路信令,故只有30个时槽用于传送话音讯号,所以只能提供30个话路。当采用共路信令传送方式时,必须将16影格再构成一个更大的影格,称为复影格。复影格的重复频率为500Hz,周期为2ms。 数位电话都采用PCM方式。对PCM系统,国际上采用PDH(准同步)复接技术。此技术有两种格式,一种是北美和日本采用的24路话音讯号复接成一个基群的T制,速率是1554kbit/s;一种是欧洲和我国采用的30/32路话音讯号复接成一个基群的E制,速率为2048kbit/s。为了进一步提高频道利用率,国际电联规定四个基群复接成一个二次群,四个二次群复接成一个三次群,四个三次群复接成一个四次群 [3]
解调
从数位讯号回制成类比讯号的过程,就如同把调变的过程逆转一样,称作解调变(demodulation)。在理想的系统上,每经过取样的固定时间而读取新的资料时,输出会即时改变到该强度。经过这样的即时转换,离散的讯号本质上会有大量的高频率能量,出现与取样频率的倍数相关的谐波(见方波)。要消灭这些谐波并使讯号流畅,讯号必须通过一些类比滤波器,压制任何在预期频域外的能量(例如大于的频域,这是理论上最高的解析度)。有些系统使用数位滤波器来移除最低和最高的谐波,而在有些系统中不使用任何外部的滤波器,因为不可能有系统重制出无限大的频宽,系统本身的不足补足了讯号重制上的瑕疵,或者该系统根本就不要求准确度。取样原理说明,任何一种PCM装置,只要提供相对于输入讯号足够大的取样频率,在期望频域中就不会有显著的失真因素。
从离散的资料重制回类比讯号所使用的电子学,与从类比至数位是相似的。这些装置称作「数位至类比转换器(digital-to-analog converters, DAC)」,与ADC的运作相似。它们依照输入的数位讯号,输出电压或电流(看情况则种类不同),这个输出然后经过滤波器和放大器,达成回放。
限制
可注意的是,在任何PCM系统中,本质上有两种损害的来源:
- 在量化时,取样必须迫于选择接近哪一个整数值(即量化误差)。
- 在样本与样本之间没有任何资料,根据取样原理,这代表任何频率大于或等于(fs即取样频率)的讯号,会产生失真,或者完全消失(aliasing error)。这又称作奈奎斯特频率(Nyquist frequency)。
由于所有样本都依据时间取样,重制时至关重要的便是一个准确的振荡器。如果编码或解码时,任何一方的振荡器不稳定,频率漂移就会使输出装置的品质降低。如果两方的频率具有些微的差异,稳定的误差对于品质而言并非巨大的问题。但一旦振荡器并非稳定的(即脉动的间距不相等),不论是音讯或者视讯上,都将造成巨大的失真。
数位化
在一般的PCM中,类比讯号在数位化之前会经过一些处理(如振幅压缩)。一旦经数位化,PCM讯号通常会再进一步处理(如数位资料压缩)。
有些形式的PCM把讯号处理结合在编码过程中。老一点的系统会把讯号的处理放在类比回路中,当作类比至数位转换(A/D)的一部分,新的系统则放在数位回路中。不过由于现代基础于转换的音讯压缩技术,这些简单的技术大部分已被认为过时。
- Differential(差异)或Delta PCM(DPCM)纪录的是目前的值与前一个值的差异值。与相等的PCM比较,这种编码只需要25%的位元数。
- Adaptive DPCM(ADPCM)是DPCM的变形,给定一个噪讯比,以节省量化密度的方式,允许更大程度的节省频宽。
在电话学中,电话的声音讯号编码标准是每秒8000个类比样本,每个样本8位元,总共每秒64 kbit的数位讯号,即DS0。DS0预设的讯号压缩法若非μ-law (mu-law) PCM(美国和日本),就是a-law PCM(欧洲和世界剩余地方),这些对数压缩系统能将12或13位元的线性PCM转换成8位元的值。这个系统获描述于国际标准G.711中。另外,曾有使用浮点数的企图,以5位元的尾数搭配3位元的基数,不过已经放弃。
当电路的成本过高、或者可接受损失音质的情况下,将声音讯号更进一步压缩将会较有效率。有一种ADPCM运演算法是用来把8位元的PCM讯号转换成4位元的ADPCM讯号,这样电线的频宽将能倍增。这个技术详细地描述于G.726标准中。
稍后又发现可能进一步压缩,并开发新一代的标准格式。在这些描述新系统或新概念的国际标准当中,有些属于私人的专利技术,要使用它们必须付费。
有些ADPCM技术用于Voice over IP通讯当中。
传输的编码
PCM的纪录方式可以是「归零式(return-to-zero, RZ)」的,也可以是「非归零式(non-return-to-zero, NRZ)」的。若要使用频宽内的资讯让一个NRZ系统达到同步,则必定不能有长串的相同符号出现,例如连续的1或连续的0。对于二进位PCM系统来说,「1」符号的密度称作「ones-density」。
ones-density可以透过诸如Run Length Limited的预编码方式控制,编码后的PCM代码会稍微长一些,这样可以保证在写入音轨之前,ones-density在一定阈值以下。在另一些情况中,会写入额外的「framing」位元,来保证在一段时间内,1或0至少会改变一次。
另外一个控制ones-density的方法是使用「scrambler」多项式,通过函式运算让原本的资料变成看起来如伪乱数般的排列,而要回复原本的资料只需要倒转该多项式的效果就可以。在这种技巧中,一连串的1或0仍然可能发生在输出中,但在一般的工程容忍度上,已经不太可能发生错误。
另外,讯号的直流输出的稳定性十分重要,因为逐渐累积的直流输出误差(offset)会导致侦测回路的运作超出范围。在这种情况下,必须作特殊的测量来计算直流输出的累积误差,并且在必要时改变电压大小来让误差永远趋向零。
许多的这些代码都是两极的,脉波要不是正就是负,或者完全没有。在典型的alternate mark inversion代码中,非0脉波在正和负之间转变。不过这些规则有可能因为必须置入「framing」或者其他特殊用途的代码而遭到违反。
- 见 T-carrier
PCM的历史
评价上,PCM就像其他伟大的发明一样简单而明了。在电子通讯的历史中,采用讯号取样的最早理由,是为了使不同的电报系统能够使用同一条电缆线互通有无。电报分时多工TDM(time-division multiplexing)的概念在1853年首次由美国发明家 M.B. Farmer 提出。在1903年,电技师 W.M. Miner 使用一种电力驱动的机械交换器真正达成分时多工 (TDM),让一条线负载许多电报讯号,并将其应用于电话机上。他并使用以 3500 至 4300 赫兹频率取样的话机,发表一段清晰的谈话:「below this was unsatisfactory.」(指取样频率)。但这只是TDM,使用的编码是脉波振幅调变(pulse-amplitude modulation, PAM)而非 PCM。
1920年Bartlane电缆图像传输系统首次利用类比讯号横跨大西洋传送了一张5级灰度图片。西方电子(Western Electric,后来成为 AT&T)的 Paul M. Rainey,在 1926 年注册了一台传真机的专利,它使用了光学机械ADC。但这台机器并未量产。英国工程师 Alec Reeves 并不知道这项发明,相反地,1937 年他在为法国的 ITT(International Telephone and Telegraph)工作时,发现了 PCM 在声音传讯上的用处。他写出了它的理论以及优点,但并未付诸实现。在 1938 年他为此申请了专利,而美国的专利则在 1943 年批准。
第一次的数位音讯传输发生于二次大战间的 1943 年,使用了 SIGSALY 声音编码装置。它获盟军用来传输高音质的讯息。
在 1943 未过一半以前,设计 SIGSALY 系统的贝尔实验室同样发现了 Alec Reeves 所发现的 PCM 的那种妙用。
在 1950 年代,PCM 必须使用阴极射线管加上一个有孔的极板网栅。如同在示波器上见到的那样,电波以取样频率水平地扫过,而垂直偏向则由输入的类比讯号来控制,最终让电波通过在极板上高低不一的孔。极板截断了电波,产生二进位代码形式的电流。与真正的二进位数不同,这个极板设计成可以产生格雷码(Gray code),避免两极转换时出现干扰。
PCM的命名
「脉波」一词用在「脉波编码调变」中似乎显得令人困惑,因为除了在电线中的电力以外,并没有任何明显可见的「脉波」。但由于这项技术发展自另外两个类比技术,脉波宽度调变和脉波位置调变,这样的结果则显得自然。在这两项技术中,资讯实际上就是依照离散讯号脉波的不同宽度或位置来作编码的。由这点来说,PCM、PWM 和 PPM 除了三者都能用于 TDM 上,以及 PCM 的确将它的代码表回脉波以外,PCM 和它的前辈们确实很不相像。在电话的电路中,用于编码和解码功能的装置称作codec(Coder+Decoder 的合称)。
参考资料
- Franklin S. Cooper; Ignatius Mattingly. Computer-controlled PCM system for investigation of dichotic speech perception. Journal of the Acoustical Society of America. 1969, 46: 115.
- Ken C. Pohlmann. Principles of Digital Audio 2nd ed. Carmel, Indiana: Sams/Prentice-Hall Computer Publishing. 1985. ISBN 978-0-672-22634-2.
- D. H. Whalen, E. R. Wiley, Philip E. Rubin, and Franklin S. Cooper. The Haskins Laboratories pulse code modulation (PCM) system. Behavior Research Methods, Instruments, and Computers. 1990, 22: 550–559.
- Bill Waggener. Pulse Code Modulation Techniques 1st ed. New York, NY: Van Nostrand Reinhold. 1995. ISBN 978-0-442-01436-0.
- William N. Waggener. Pulse Code Modulation Systems Design 1st ed. Boston, MA: Artech House. 1999. ISBN 978-0-89006-776-5.
参见
- CDDA:红皮书所规定的音讯CD使用16-bit PCM
- 丽音广播:使用14-bit PCM
- Equivalent pulse code modulation noise
- G.711:ITU-T用于音讯companding的标准,最主要用于电话上
- 线性PCM
- Nyquist–Shannon 取样定理
- 脉波宽度调变
- 量化 (讯号处理)
- 取样 (讯号处理)
- SQNR:侦测量化失误的方法之一
外部连结
- Ralph Miller and Bob Badgley invented multi-level PCM independently in their work at Bell Labs on SIGSALY: 美国专利第3,912,868号: N-ary Pulse Code Modulation.
- According to the Inventors Hall of Fame, B.M Oliver and Claude Shannon are the inventors of PCM as described in 'Communication System Employing Pulse Code Modulation,' 美国专利第2,801,281号 filed in 1946 and 1952, granted in 1956.
- Information about PCM (页面存档备份,存于网际网路档案馆): A description of PCM with links to information about subtypes of this format (for example Linear Pulse Code Modulation), and references to their specifications.