Number of the records: 1  

K efektivitě manuální a poloautomatické excerpce neologismů

  1. 1.
    0504724 - ÚJČ 2020 RIV CZ cze J - Journal Article
    Sláma, Jakub
    K efektivitě manuální a poloautomatické excerpce neologismů.
    [On the efficiency of manual and semi-automatic detection of neologisms.]
    Naše řeč. Roč. 102, 1/2 (2019), s. 64-75. ISSN 0027-8203
    Institutional support: RVO:68378092
    Keywords : data collection * manual detection of neologisms * neologisms * Python * semi-automatic detection of neologisms
    OECD category: Linguistics
    Method of publishing: Limited access
    https://www.ceeol.com/search/article-detail?id=761574

    Text představuje jednoduchou proceduru pro poloautomatické vyhledávání neologismů v textech: jednoduchý skript v jazyce Python zpracuje textový soubor s použitím morfologického taggeru a vyextrahuje všechna slova, která tagger nepoznal, jakožto potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně. Tato metoda poloautomatické excerpce byla použita na soubor textů, které byly zpracovány i tradiční, ruční excerpcí. Srovnání ruční a poloautomatické excerpce ukázalo, že poloautomatická procedura je výrazně rychlejší, efektivnější a úspěšnější než ruční excerpce.

    The paper presents a simple semi-automatic neologism detection procedure: a trivial Python script processes a text file, making use of a Czech morphological tagger, and extracts all words unrecognized by the tagger as potential neologisms. The list of these candidates has to be checked by a human (hence the label semi-automatic). This method was applied to a set of texts that were also analyzed in a more traditional way, by the “reading and marking” technique (i.e. the current practice). The comparison of the two methods has revealed that the semi-automatic procedure clearly outperforms the current practice both in speed and in efficiency.
    Permanent Link: http://hdl.handle.net/11104/0296940

     
     
Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.