预测编码
名词解释
预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。
预测编码中典型的压缩方法有脉冲编码调制(PCM,Pulse Code Modulation)、差分脉冲编码调制(DPCM,Differential Pulse Code Modulation)、自适应差分脉冲编码调制(ADPCM,Adaptive Differential Pulse Code Modulation)等。
概述
它们较适合于声音、图像数据的压缩,因为这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。
性能
预测编码的性能决定于预测器的性能,所谓最佳预测器就是在某一准则下使预测编码的性能达到最佳的预测器。常用的一些准则有:误差均方值最小准则,零(无)误差概率最大准则、误差平均分布熵最小准则等。最佳预测器的结构不但与准则有关,而且与信源的统计特性有关。在平稳高斯信源时,上述三种准则等价,而且最佳预测器是线性预测器。在非高斯信源时,已经证明非线性预测器可以提供更好的性能,但是寻找和实现最佳的非线性预测器比较困难。
应用
预测编码的局限性在于它把样本之间的统计依存关系看成是仅仅影响样本分布的均值而不影响分布的形状。从理论上讲,这一条件除了高斯信源外,一般信源都是不能满足的。预测编码的最大优点在于它实现方便,且对大部分实际信源相当有效,所以预测编码在实际中有广泛应用。增量调制和差分脉码调制就是两种很好的例子。自适应的差分脉码调制还在CCITT的G.721建议中被确定为语音编码的一种国际标准。
PCM
背景
脉冲编码调制(PCM,pulse code modulation)是概念上最简单、理论上最完善的编码系统。它是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。
PCM的编码原理比较直观和简单,如(1)所示。它的输入是模拟信号,首先经过时间采样,然后对每一样值都进行量化,作为数字信号的输出,即PCM样本序列x(0),x(1),…,x(n)。图中的“量化,编码”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。
量化
量化有多种方法。最简单的是只应用于数值,称为标量量化,另一种是对矢量(又称为向量)量化。标量量化可归纳成两类:一类称为均匀量化,另一类称为非均匀量化。理论上,标量量化也是矢量量化的一种特殊形式。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法。
标量量化
均匀量化
如果采用相等的量化间隔处理采样得到的信号值,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如(2)所示。量化后的样本值Y和原始值X的差 E=Y-X 称为量化误差或量化噪声。
参考文献
- ↑ 中国汉字是怎样起源的?源始于殷商?文字有600年的历史?,搜狐,2022-09-15
- ↑ 揭秘中国最古老的文字是来源图画还是记号?,搜狐,2017-06-05