最小距离分类
最小距离分类是全国科学技术名词审定委员会公布的一个科技名词。
汉字作为一种形、音、义三位一体的符号系统[1],源于日月鸟兽之形,作为中华文明之标志[2],连接中华民族的历史、现在和未来,方正之间充满美感。
目录
名词解释
最小距离分类,是指求出未知类别向量到要识别各类别代表向量中心点的距离,将未知类别向量归属于距离最小一类的一种图像分类方法。
最小距离分类法是分类器里面最基本的一种分类方法,它是通过求出未知类别向量X到事先已知的各类别(如A,B,C等等)中心向量的距离D,然后将待分类的向量X归结为这些距离中最小的那一类的分类方法。
最小距离分类的步骤
最小距离分类器的步骤,其实是我们做监督分类基本的几个步骤。
(1)确定类别m,并提取每一类所对应的已知的样本。
(2)从样本中提取出一些可以作为区分不同类别的特性,也就是我们通常所说的特征提取,如果提取出了n个不同的特性,那么我们就叫它n维空间,特征提取对分类的精度有重大的影响。
(3)分别计算每一个类别的样本所对应的特征,每一类的每一维都有特征集合,通过集合,可以计算出一个均值,也就是特征中心。
(4)通常为了消除不同特征因为量纲不同的影响,我们对每一维的特征,需要做一个归一化,或者是放缩到(-1,1)等区间,使其去量纲化。
(5)利用选取的距离准则,对待分类的本进行判定。
优点和缺点
最小距离分类法原理简单,容易理解,计算速度快,但是因为其只考虑每一类样本的均值,而不用管类别内部的方差(每一类样本的分布),也不用考虑类别之间的协方差(类别和类别之间的相关关系),所以分类精度不高,因此,一般不用它作为我们分类对精度有高要求的分类,但它可以在快速浏览分类概况中使用。
参考文献
- ↑ 汉字——中华文化的独特符号,搜狐,2017-12-14
- ↑ 汉字——中华文明的基因,搜狐,2020-12-12