預測編碼檢視原始碼討論檢視歷史
預測編碼是全國科學技術名詞審定委員會審定、公布的科技類名詞。
關於中國文字的起源[1]主要有兩種觀點:起源於刻畫符號和「圖畫文字」起源說[2]。我們現在已知的最早的文字是安陽殷墟出土的甲骨文。
名詞解釋
預測編碼是根據離散信號之間存在着一定關聯性的特點,利用前面一個或多個信號預測下一個信號進行,然後對實際值和預測值的差(預測誤差)進行編碼。如果預測比較準確,誤差就會很小。在同等精度要求的條件下,就可以用比較少的比特進行編碼,達到壓縮數據的目的。
預測編碼中典型的壓縮方法有脈衝編碼調製(PCM,Pulse Code Modulation)、差分脈衝編碼調製(DPCM,Differential Pulse Code Modulation)、自適應差分脈衝編碼調製(ADPCM,Adaptive Differential Pulse Code Modulation)等。
概述
它們較適合於聲音、圖像數據的壓縮,因為這些數據由採樣得到,相鄰樣值之間的差相差不會很大,可以用較少位來表示。
性能
預測編碼的性能決定於預測器的性能,所謂最佳預測器就是在某一準則下使預測編碼的性能達到最佳的預測器。常用的一些準則有:誤差均方值最小準則,零(無)誤差概率最大準則、誤差平均分布熵最小準則等。最佳預測器的結構不但與準則有關,而且與信源的統計特性有關。在平穩高斯信源時,上述三種準則等價,而且最佳預測器是線性預測器。在非高斯信源時,已經證明非線性預測器可以提供更好的性能,但是尋找和實現最佳的非線性預測器比較困難。
應用
預測編碼的局限性在於它把樣本之間的統計依存關係看成是僅僅影響樣本分布的均值而不影響分布的形狀。從理論上講,這一條件除了高斯信源外,一般信源都是不能滿足的。預測編碼的最大優點在於它實現方便,且對大部分實際信源相當有效,所以預測編碼在實際中有廣泛應用。增量調製和差分脈碼調製就是兩種很好的例子。自適應的差分脈碼調製還在CCITT的G.721建議中被確定為語音編碼的一種國際標準。
PCM
背景
脈衝編碼調製(PCM,pulse code modulation)是概念上最簡單、理論上最完善的編碼系統。它是最早研製成功、使用最為廣泛的編碼系統,但也是數據量最大的編碼系統。
PCM的編碼原理比較直觀和簡單,如(1)所示。它的輸入是模擬信號,首先經過時間採樣,然後對每一樣值都進行量化,作為數字信號的輸出,即PCM樣本序列x(0),x(1),…,x(n)。圖中的「量化,編碼」可理解為「量化階大小(step-size)」生成器或者稱為「量化間隔」生成器。
量化
量化有多種方法。最簡單的是只應用於數值,稱為標量量化,另一種是對矢量(又稱為向量)量化。標量量化可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。理論上,標量量化也是矢量量化的一種特殊形式。採用的量化方法不同,量化後的數據量也就不同。因此,可以說量化也是一種壓縮數據的方法。
標量量化
均勻量化
如果採用相等的量化間隔處理採樣得到的信號值,那麼這種量化稱為均勻量化。均勻量化就是採用相同的「等分尺」來度量採樣得到的幅度,也稱為線性量化,如(2)所示。量化後的樣本值Y和原始值X的差 E=Y-X 稱為量化誤差或量化噪聲。
參考文獻
- ↑ 中國漢字是怎樣起源的?源始於殷商?文字有600年的歷史?,搜狐,2022-09-15
- ↑ 揭秘中國最古老的文字是來源圖畫還是記號?,搜狐,2017-06-05