Text document classification based on mixture models
1.
SYSNO ASEP
0106330
Druh ASEP
J - Článek v odborném periodiku
Zařazení RIV
J - Článek v odborném periodiku
Poddruh J
Ostatní články
Název
Text document classification based on mixture models
Překlad názvu
Klasifikace textových dokumentů použitím směsových modelů
Tvůrce(i)
Novovičová, Jana (UTIA-B) Malík, Antonín (UTIA-B)
Zdroj.dok.
Kybernetika. - : Ústav teorie informace a automatizace AV ČR, v. v. i.
- ISSN 0023-5954
Roč. 40, č. 3 (2004), s. 293-304
Poč.str.
12 s.
Jazyk dok.
eng - angličtina
Země vyd.
CZ - Česká republika
Klíč. slova
text classification ; text categorization ; multinomial mixture model
Vědní obor RIV
BB - Aplikovaná statistika, operační výzkum
CEP
IAA2075302 GA AV ČR - Akademie věd
GA102/03/0049 GA ČR - Grantová agentura ČR
KSK1019101 GA AV ČR - Akademie věd
CEZ
AV0Z1075907 - UTIA-B
Anotace
Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. This paper, using bag-of-words vector document representation, explores the use of the mixture of multinomial distributions as a model for class-conditional distribution for multiclass text document classification task. Experimental comparison of the proposed models was performed using Reuters-21578 and Newsgroups data sets.