最小距離分類檢視原始碼討論檢視歷史
最小距離分類是全國科學技術名詞審定委員會公布的一個科技名詞。
漢字作為一種形、音、義三位一體的符號系統[1],源於日月鳥獸之形,作為中華文明之標誌[2],連接中華民族的歷史、現在和未來,方正之間充滿美感。
名詞解釋
最小距離分類,是指求出未知類別向量到要識別各類別代表向量中心點的距離,將未知類別向量歸屬於距離最小一類的一種圖像分類方法。
最小距離分類法是分類器裡面最基本的一種分類方法,它是通過求出未知類別向量X到事先已知的各類別(如A,B,C等等)中心向量的距離D,然後將待分類的向量X歸結為這些距離中最小的那一類的分類方法。
最小距離分類的步驟
最小距離分類器的步驟,其實是我們做監督分類基本的幾個步驟。
(1)確定類別m,並提取每一類所對應的已知的樣本。
(2)從樣本中提取出一些可以作為區分不同類別的特性,也就是我們通常所說的特徵提取,如果提取出了n個不同的特性,那麼我們就叫它n維空間,特徵提取對分類的精度有重大的影響。
(3)分別計算每一個類別的樣本所對應的特徵,每一類的每一維都有特徵集合,通過集合,可以計算出一個均值,也就是特徵中心。
(4)通常為了消除不同特徵因為量綱不同的影響,我們對每一維的特徵,需要做一個歸一化,或者是放縮到(-1,1)等區間,使其去量綱化。
(5)利用選取的距離準則,對待分類的本進行判定。
優點和缺點
最小距離分類法原理簡單,容易理解,計算速度快,但是因為其只考慮每一類樣本的均值,而不用管類別內部的方差(每一類樣本的分布),也不用考慮類別之間的協方差(類別和類別之間的相關關係),所以分類精度不高,因此,一般不用它作為我們分類對精度有高要求的分類,但它可以在快速瀏覽分類概況中使用。
參考文獻
- ↑ 漢字——中華文化的獨特符號,搜狐,2017-12-14
- ↑ 漢字——中華文明的基因,搜狐,2020-12-12