Počet záznamů: 1

Text document classification based on mixture models

Do košíku
RIV
Bookmark
1.
0106330 - UTIA-B 20040142 RIV CZ eng J - Článek v odborném periodiku
Novovičová, Jana - Malík, Antonín
Text document classification based on mixture models.
[Klasifikace textových dokumentů použitím směsových modelů.]
Kybernetika. Roč. 40, č. 3 (2004), s. 293-304. ISSN 0023-5954
Grant CEP: GA AV ČR IAA2075302; GA ČR GA102/03/0049; GA AV ČR KSK1019101
Výzkumný záměr: CEZ:AV0Z1075907
Klíčová slova: text classification * text categorization * multinomial mixture model
Kód oboru RIV: BB - Aplikovaná statistika, operační výzkum
Impakt faktor: 0.224, rok: 2004

Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. This paper, using bag-of-words vector document representation, explores the use of the mixture of multinomial distributions as a model for class-conditional distribution for multiclass text document classification task. Experimental comparison of the proposed models was performed using Reuters-21578 and Newsgroups data sets.

Použití směsi multinomických rozdělení jako modelu pro podmíněná rozdělení pravděpodobností pro Bayesův klasifikátor je uvedeno. Výsledky experimentů s použitím Reuters 21578 a Newsgroups datových souborů indikují efektivnost použitého multinomického směsového modelu v otázkách klasifikace textových dokumentů. Bylo ukázáno, že přesnost Bayesova klasifikátoru může být zvýšena při použití navrženého modelu v porovnání s Bayesovým klasifikátorem založeným jednak na standardních modelech (vícerozměrný Bernoulliho model, multinomický model), jednak na směsovém Bernoulliho modelu
Trvalý link: http://hdl.handle.net/11104/0013512
Název souboru Staženo Velikost Komentář Verze Přístup

0106330.pdf 5 1.8 MB Vydavatelský postprint povolen

	Název souboru	Staženo	Velikost	Komentář	Verze	Přístup
	0106330.pdf	5	1.8 MB		Vydavatelský postprint	povolen

Počet záznamů: 1