Počet záznamů: 1

A New Measure of Feature Selection Algorithms’ Stability

  1. 1.
    0337780 - UTIA-B 2010 RIV US eng C - Konferenční příspěvek (zahraniční konf.)
    Novovičová, Jana - Somol, Petr - Pudil, Pavel
    A New Measure of Feature Selection Algorithms’ Stability.
    [Nová míra stability algoritmů výběru příznaků.]
    ICDMW '09: Proceedings of the 2009 IEEE International Conference on Data Mining Workshops. Washington, DC, USA: IEEE Computer Society, 2009, s. 382-387. ISBN 978-0-7695-3902-7.
    [ICDMW '09: International Conference on Data Mining Workshops. Miami, Florida (US), 06.12.2009-09.12.2009]
    Grant CEP: GA MŠk 1M0572; GA ČR GA102/07/1594; GA ČR GA102/08/0593
    Grant ostatní: GA MŠk(CZ) 2C06019
    Výzkumný záměr: CEZ:AV0Z10750506
    Klíčová slova: feature selection * stability * measure
    Kód oboru RIV: BD - Teorie informace

    Stability or robustness of feature selection methods is a topic of recent interest. A new stability measure based on the Shannon entropy is proposed in this paper to evaluate the overall occurrence of individual features in selected subsets of possibly varying cardinality. We compare the new measure to stability measures proposed recently by Somol et al. The new measure is computationally very efficient and adds another type of insight into the stability problem. All considered measures have been used to compare the stability of several feature selection methods (individually best ranking, sequential forward selection, sequential forward floating selection and dynamic oscillating search) on a set of examples.

    Stabilita (robustnost) metod výběru příznaků je předmětem aktuálního zájmu. V této práci je prezentovaná nová míra stability založená na Shannonovské entropii, zaměřená na vyhodnocování celkového výskytu příznaků ve vybraných podmnožinách různorodé kardinality. Porovnáváme tuto novou míru s mírami publikovanými nedávno v práci Somol et al. Nová míra je výpočetně velmi efektivní a přidává nový typ pohledu na problém stability. Všechny uvažované míry byly použity pro porovnání stability několika metod výběru příznaků (individuální řazení, sekvenční dopředné vyhledávání, sekvenční dopředné plovoucí vyhledávání a dynamické oscilační vyhledávání) na sérii příkladů.
    Trvalý link: http://hdl.handle.net/11104/0181702