立體視覺

來自孔夫子舊書網的圖片

立體視覺是全國科學技術名詞審定委員會審定、公布的科技類名詞。

關於漢字的起源^[1]，中國古代文獻上有種種說法，如「結繩」、「八卦」、「圖畫」、「書契」等，古書上還普遍記載有黃帝史官倉頡造字的傳說。現代學者認為，成系統的文字工具不可能完全由一個人創造出來，倉頡^[2]如果確有其人，應該是文字整理者或頒布者。最早刻劃符號距今8000多年。

名詞解釋

立體視覺是計算機視覺領域的一個重要課題，它的目的在於重構場景的三維幾何信息。立體視覺的研究具有重要的應用價值，其應用包括移動機器人的自主導航系統，航空及遙感測量，工業自動化系統等。

研究方法

一般而言，立體視覺的研究有如下三類方法:

(1) 直接利用測距器（如激光測距儀）獲得程距（range data）信息，建立三維描述的方法;

(2) 僅利用一幅圖象所提供的信息推斷三維形狀的方法;

(3) 利用不同視點上的，也許是不同時間拍攝的，兩幅或更多幅圖象提供的信息重構三維結構的方法。

第一類方法，也就是程距法 (range data method)，根據已知的深度圖，用數值逼近的方法重建表面信息，根據模型建立場景中的物體描述，實現圖象理解功能。這是一種主動方式的立體視覺方法，其深度圖是由測距器(range finders)獲得的，如結構光(structured light)、激光測距器(laser range finders) 等其他主動傳感技術 (active sensing techniques)。這類方法適用於嚴格控制下的環境(tightlycontrolled domains)，如工業自動化的應用方面。

第二類方法，依據光學成象的透視原理及統計假設，根據場景中灰度變化導出物體輪廓及表面，由影到形(shape from shading)，從而推斷場景中的物體。線條圖的理解就是這樣的一個典型問題，曾經引起了普遍的重視而成為計算機視覺研究領域的一個焦點，由此產生了各種各樣的線條標註法。這種方法的結果是定性的，不能確定位置等定量信息，該方法由於受到單一圖象所能提供信息的局限性，存在難以克服的困難。

第三類方法，利用多幅圖象來恢復三維信息的方法，它是被動方式的。根據圖象獲取方式的區別又可以劃分成普通立體視覺和通常所稱的光流(optical flow)兩大類。普通立體視覺研究的是由兩攝像機同時拍攝下的兩幅圖象，而光流法中研究的是單個攝像機沿任一軌道運動時順序拍下的兩幅或更多幅圖象。前者可以看作後者的一個特例，它們具有相同的幾何構形，研究方法具有共同點。雙目立體視覺是它的一個特例。

組成部分

立體視覺的研究由如下幾部分組成:

(1) 圖象獲取 (image acquisition),

用作立體視覺研究的圖象的獲取方法是多種多樣的，在時間、視點、方向上有很大的變動範圍，直接受所應用領域的影響。立體視覺的研究主要集中在三個應用領域中，即自動測繪中的航空圖片的解釋，自主車的導引及避障，人類立體視覺的功能模擬。不同的應用領域涉及不同類的景物，就場景特徵的區別來分，可以劃分成兩大類，一類是含有文明特徵(cultural features)的景物，如建築、道路等; 另一類是含有自然特徵的景物和表面(natural objects and surfaces)，如山、水、平原及樹木等。不同類的景物的圖象處理方法大不相同，各有其特殊性。

參考文獻

↑ 中國「漢字」從何而來？每個漢字，都是倉頡造出來的嗎？，搜狐，2022-10-01
↑ 造字的倉頡，為何叫「倉頡」？甲骨文揭開了顛覆性的一幕，搜狐，2022-09-12

[1] 中國「漢字」從何而來？每個漢字，都是倉頡造出來的嗎？，搜狐，2022-10-01

[2] 造字的倉頡，為何叫「倉頡」？甲骨文揭開了顛覆性的一幕，搜狐，2022-09-12

[1]

[2]

求真百科

立體視覺

目錄

名詞解釋

參考文獻