與機器視覺有關的學科有許多.本節主要討論一些與機器視覺密切相關的領域.關于機器視覺與其它學科的關系,我們不作詳盡的討論.
圖像處理是一個發展比較成熟的領域.圖像處理技術通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統的輸入是圖像,輸出仍然是圖像,信息恢復任務則留給人來完成.圖像處理包括圖像增強、圖像壓縮和模糊校正與非聚焦圖像等課題.機器視覺系統把圖像作為輸入,產生的輸出為另一種形式,比如圖像中物體輪廓的表示.因此,機器視覺的重點是在人的最小干預下,由計算機自動恢復場景信息.圖像處理算法在機器視覺系統的早期階段起著很大的作用,它們通常被用來增強特定信息并抑制噪聲.
計算機圖形學是通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化(Visualization)和虛擬現實(Virtual Reality)中起著很重要的作用.機器視覺正好是解決相反的問題,即從圖像中估計幾何基元和其它特征.因此,計算機圖形學屬于圖像綜合,機器視覺屬于圖像分析.這兩個領域在其發展的早期階段是沒有什么聯系的,但是近十幾年來發展的越來越相近了.機器視覺使用了計算機圖形學中的曲線和曲面表示方法以及其它的一些技術,而計算機圖形學也使用機器視覺技術,以便在計算機中建立逼真的圖像模型.可視化和虛擬現實把這兩個領域緊密地聯系在一起.
模式識別主要用于識別各種符號、圖畫等平面圖形.模式一般指一類事物區別于其它事物所具有的共同特征。模式識別方法主要有統計方法和句法方法兩種,統計方法是指從模式抽取一組特征值,并以劃分特征空間的方法來識別每一個模式。句法方法是指利用一組簡單的子模式(模式基元)通過文法規則來描述復雜的模式。模式識別方法是機器視覺識別物體的重要基礎之一.機器視覺識別物體還經常需要其它的技術.我們將在物體識別部分簡要地討論統計模式識別的主要內容.
人工智能(artificial intelligent, AI)涉及到智能系統的設計和智能計算的研究.在經過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進行表示,并分析和理解場景.人工智能有三個過程:感知、認知和行動.感知把反應現實世界的信息轉換成信號,并表示成符號,認知是對符號進行各種操作,行動則把符號轉換成影響周圍環境的信號.人工智能的許多技術在機器視覺的各個方面起著重要作用.事實上,機器視覺通常被視為人工智能的一個分支.
人工神經網絡(artificial neural networks, ANNs)是一種信息處理系統,它是由大量簡單的處理單元(稱為神經元)通過具有強度的連接(connection)相互聯系起來,實現并行分布式處理(parallel distribution processing, PDP).人工神經網絡的最大特點是可以通過改變連接強度來調整系統,使之適應復雜的環境,實現類似人的學習、歸納和分類等功能.人工神經網絡已經在許多工程技術領域得到了廣泛的應用.神經網絡作為一種方法和機制將用于解決機器視覺中的許多問題.
神經物理學與認知科學長期將人類視覺作為主要的研究對象.機器視覺中已有的許多方法與人類視覺極為相似.目前,許多機器視覺研究者對研究人類視覺計算模型比研究機器視覺系統更感興趣,希望機器視覺更加自然化,更加接近生物視覺。我們在第二章介紹人類視覺的一些研究成果,使讀者在研究機器視覺時或多或少能從生物視覺機理中得到啟發.不過,我們的重點在于研究機器視覺系統,因此,不討論機器視覺與神經物理學或認知科學的聯系.
|