Počet záznamů: 1  

K efektivitě manuální a poloautomatické excerpce neologismů

  1. 1.
    SYSNO ASEP0504724
    Druh ASEPJ - Článek v odborném periodiku
    Zařazení RIVJ - Článek v odborném periodiku
    Poddruh JOstatní články
    NázevK efektivitě manuální a poloautomatické excerpce neologismů
    Překlad názvuOn the efficiency of manual and semi-automatic detection of neologisms
    Tvůrce(i) Sláma, Jakub (UJC-A) ORCID
    Zdroj.dok.Naše řeč. - : Ústav pro jazyk český AV ČR, v. v. i. - ISSN 0027-8203
    Roč. 102, 1/2 (2019), s. 64-75
    Poč.str.12 s.
    Forma vydáníTištěná - P
    Jazyk dok.cze - čeština
    Země vyd.CZ - Česká republika
    Klíč. slovadata collection ; manual detection of neologisms ; neologisms ; Python ; semi-automatic detection of neologisms
    Vědní obor RIVAI - Jazykověda
    Obor OECDLinguistics
    Způsob publikováníOmezený přístup
    Institucionální podporaUJC-A - RVO:68378092
    AnotaceText představuje jednoduchou proceduru pro poloautomatické vyhledávání neologismů v textech: jednoduchý skript v jazyce Python zpracuje textový soubor s použitím morfologického taggeru a vyextrahuje všechna slova, která tagger nepoznal, jakožto potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně. Tato metoda poloautomatické excerpce byla použita na soubor textů, které byly zpracovány i tradiční, ruční excerpcí. Srovnání ruční a poloautomatické excerpce ukázalo, že poloautomatická procedura je výrazně rychlejší, efektivnější a úspěšnější než ruční excerpce.
    Překlad anotaceThe paper presents a simple semi-automatic neologism detection procedure: a trivial Python script processes a text file, making use of a Czech morphological tagger, and extracts all words unrecognized by the tagger as potential neologisms. The list of these candidates has to be checked by a human (hence the label semi-automatic). This method was applied to a set of texts that were also analyzed in a more traditional way, by the “reading and marking” technique (i.e. the current practice). The comparison of the two methods has revealed that the semi-automatic procedure clearly outperforms the current practice both in speed and in efficiency.
    PracovištěÚstav pro jazyk český
    KontaktYvona Tesařová, tesarova@ujc.cas.cz, Tel.: 225 391 406 ; Marie Chybová, m.chybova@ujc.cas.cz, Tel.: 532 290 515 ; Helena Svobodová, knihovna.dial.brno@ujc.cas.cz, Tel.: 532 290 266
    Rok sběru2020
    Elektronická adresahttps://www.ceeol.com/search/article-detail?id=761574
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.