Počet záznamů: 1  

Staročeská a středněčeská textová banka 1.1.11.1

  1. 1.
    0521744 - ÚJČ 2020 RIV CZ cze L5 - Specializovaná veřejná databáze
    Lehečka, Boris - Černá, Alena M. (ed.) - Svoboda, Ondřej
    Staročeská a středněčeská textová banka 1.1.11.1.
    [Old Czech and Middle Czech Text Bank 1.1.11.1.]
    2019
    Grant CEP: GA MŠMT(CZ) LM2015081
    Institucionální podpora: RVO:68378092
    Klíčová slova: Old Czech * Middle Czech * language corpus
    Obor OECD: Linguistics
    https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.11.1

    Kolekce transkribovaných textů staročeských a středněčeských literárních památek z období přibližně mezi lety 1300 až 1800 s částečnou nejednoznačnou (hyper)lemmatizací a morfologickým značkováním bez disambiguace. Změny proti předchozí verzi: nevyvážený korpus obsahuje 312 pramenů, celkem 6 695 241 pozic, lemmata jsou přiřazena asi 63 % tokenů, značkování pomocí aktuální staročeské morfologické databáze (nově slovesa 5. třídy „dělati“).

    A collection of transcribed historical Old Czech and Middle Czech texts from the period of ca. 1300–1800 with partial (hyper-)lemmatisation and morphological tagging without disambiguation. Changes from the previous version: the unbalanced corpus contains 312 historical sources and a total of 6,695,241 positions, 63% of the tokens are matched with lemmas, tagging is done using the current Old Czech morphological database (class V – “dělati” – verbs added).
    Trvalý link: http://hdl.handle.net/11104/0306469

     
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.