Počet záznamů: 1
K efektivitě manuální a poloautomatické excerpce neologismů
- 1.
SYSNO ASEP 0504724 Druh ASEP J - Článek v odborném periodiku Zařazení RIV J - Článek v odborném periodiku Poddruh J Ostatní články Název K efektivitě manuální a poloautomatické excerpce neologismů Překlad názvu On the efficiency of manual and semi-automatic detection of neologisms Tvůrce(i) Sláma, Jakub (UJC-A) ORCID Zdroj.dok. Naše řeč. - : Ústav pro jazyk český AV ČR, v. v. i. - ISSN 0027-8203
Roč. 102, 1/2 (2019), s. 64-75Poč.str. 12 s. Forma vydání Tištěná - P Jazyk dok. cze - čeština Země vyd. CZ - Česká republika Klíč. slova data collection ; manual detection of neologisms ; neologisms ; Python ; semi-automatic detection of neologisms Vědní obor RIV AI - Jazykověda Obor OECD Linguistics Způsob publikování Omezený přístup Institucionální podpora UJC-A - RVO:68378092 Anotace Text představuje jednoduchou proceduru pro poloautomatické vyhledávání neologismů v textech: jednoduchý skript v jazyce Python zpracuje textový soubor s použitím morfologického taggeru a vyextrahuje všechna slova, která tagger nepoznal, jakožto potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně. Tato metoda poloautomatické excerpce byla použita na soubor textů, které byly zpracovány i tradiční, ruční excerpcí. Srovnání ruční a poloautomatické excerpce ukázalo, že poloautomatická procedura je výrazně rychlejší, efektivnější a úspěšnější než ruční excerpce. Překlad anotace The paper presents a simple semi-automatic neologism detection procedure: a trivial Python script processes a text file, making use of a Czech morphological tagger, and extracts all words unrecognized by the tagger as potential neologisms. The list of these candidates has to be checked by a human (hence the label semi-automatic). This method was applied to a set of texts that were also analyzed in a more traditional way, by the “reading and marking” technique (i.e. the current practice). The comparison of the two methods has revealed that the semi-automatic procedure clearly outperforms the current practice both in speed and in efficiency. Pracoviště Ústav pro jazyk český Kontakt Yvona Tesařová, tesarova@ujc.cas.cz, Tel.: 225 391 406 ; Marie Chybová, m.chybova@ujc.cas.cz, Tel.: 532 290 515 ; Helena Svobodová, knihovna.dial.brno@ujc.cas.cz, Tel.: 532 290 266 Rok sběru 2020 Elektronická adresa https://www.ceeol.com/search/article-detail?id=761574
Počet záznamů: 1