Classifier Based on Inverted Indexes of Neighbors
Jiřina, Marcel - Jiřina jr., M.
Classifier Based on Inverted Indexes of Neighbors.
[Klasifikátor založený na inverzních hodnotách indexů.]
Prague: ICS AS CR, 2008. 11 s. Technical Report, V-1034.
Klíčová slova: multivariate data * correlation dimension * correlation integral * decomposition * probability density estimation * harmonic series * classification
A new method for the classification of data into classes is presented. The method is based on the sum of reciprocals of neighbors' indexes. We show that neighbors' indexes are in close relation to the polynomial transform of the neighbors' distances. The sum of the reciprocals of indexes for all neighbors forms truncated harmonic series due to a finite number of its elements. For the neighbors of one class there is a sum of the selected elements of this truncated series. It is proved that the ratio of these sums gives just the probability that the point to be classified -- the query point -- is of that class. The classification ability is demonstrated on real-life data from the Machine Learning Repository and the results are compared with published results obtained through other methods.
Je prezentována teorie nové metody pro klasifikaci dat do tříd. Metoda je založena na součtech reciprokých hodnot indexů sousedů. Ukazuje se, že indexy sousedů jsou v úzkém vztahu k přibližné polynomiální aproximaci transformace vzdáleností sousedů. Součet těchto převrácených hodnot tvoří useknutou harmonickou řadu v důsledku konečného počtu pvků. Pro sousedy jedné třídy se vytváří součet vybraných prvků této řady. Dokazuje se, že poměr těchto součtů dává právě odhad pravděpodobnosti, že dotazový bod patří do právě té třídy. Schopnosti klasifikace jsou ukázány na praktických datech z UCI MLR a výsledky jsou porovnány s publikovanými výsledky jiných metod.
