Počet záznamů: 1  

Text document classification based on mixture models

  1. 1.
    0106330 - UTIA-B 20040142 RIV CZ eng J - Článek v odborném periodiku
    Novovičová, Jana - Malík, Antonín
    Text document classification based on mixture models.
    [Klasifikace textových dokumentů použitím směsových modelů.]
    Kybernetika. Roč. 40, č. 3 (2004), s. 293-304. ISSN 0023-5954
    Grant CEP: GA AV ČR IAA2075302; GA ČR GA102/03/0049; GA AV ČR KSK1019101
    Výzkumný záměr: CEZ:AV0Z1075907
    Klíčová slova: text classification * text categorization * multinomial mixture model
    Kód oboru RIV: BB - Aplikovaná statistika, operační výzkum
    Impakt faktor: 0.224, rok: 2004

    Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. This paper, using bag-of-words vector document representation, explores the use of the mixture of multinomial distributions as a model for class-conditional distribution for multiclass text document classification task. Experimental comparison of the proposed models was performed using Reuters-21578 and Newsgroups data sets.

    Použití směsi multinomických rozdělení jako modelu pro podmíněná rozdělení pravděpodobností pro Bayesův klasifikátor je uvedeno. Výsledky experimentů s použitím Reuters 21578 a Newsgroups datových souborů indikují efektivnost použitého multinomického směsového modelu v otázkách klasifikace textových dokumentů. Bylo ukázáno, že přesnost Bayesova klasifikátoru může být zvýšena při použití navrženého modelu v porovnání s Bayesovým klasifikátorem založeným jednak na standardních modelech (vícerozměrný Bernoulliho model, multinomický model), jednak na směsovém Bernoulliho modelu
    Trvalý link: http://hdl.handle.net/11104/0013512

     
    Název souboruStaženoVelikostKomentářVerzePřístup
    0106330.pdf51.8 MBVydavatelský postprintpovolen
     

Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.