Počet záznamů: 1
Text document classification
- 1.0411407 - UTIA-B 20050137 RIV FR eng J - Článek v odborném periodiku
Novovičová, Jana
Text document classification.
[Klasifikace textových dokumentů.]
ERCIM News. č. 62 (2005), s. 53-54. ISSN 0926-4981. E-ISSN 1564-0094
Grant CEP: GA AV ČR IAA2075302; GA AV ČR KSK1019101; GA MŠMT 1M0572
Výzkumný záměr: CEZ:AV0Z10750506
Klíčová slova: document representation * categorization * classification
Kód oboru RIV: BD - Teorie informace
During the last twenty years the number of text documents in digital form is enormously growing in size. As a consequence the need to automatically organize and classify documents is of great practical importance. Text classification aims for partition of an unstructured set of documents into groups that describe the contents of the document. There are two main variants of text classification: text clustering and text categorization. A major characteristic of the problem is the high dimension of text data.
V minulých dvaceti letech značně vzrostl počet textových dokumentů v elektronické formě. V důsledku toho je velice žádoucí automaticky organizovat a klasifikovat dokumenty. Výzkum v oblasti klasifikace textů je zaměřen na třídění dokumentů do skupin založených na obsahu dokumentů. Existují dvě hlavní varianty klasifikace textů: shlukování textů (nalezení skrytých skupin v množině dokumentů) a kategorizace textů (zařazení dokumentů do předem definovaných skupin).
Trvalý link: http://hdl.handle.net/11104/0131489
Počet záznamů: 1