Počet záznamů: 1  

Staročeská a středněčeská textová banka 1.1.10.1

  1. 1.
    0521743 - ÚJČ 2020 RIV CZ cze L5 - Specializovaná veřejná databáze
    Lehečka, Boris - Černá, Alena M. (ed.) - Svoboda, Ondřej
    Staročeská a středněčeská textová banka 1.1.10.1.
    [Old Czech and Middle Czech Text Bank 1.1.10.1.]
    2019
    Grant CEP: GA MŠMT(CZ) LM2015081
    Institucionální podpora: RVO:68378092
    Klíčová slova: Old Czech * Middle Czech * language corpus
    Obor OECD: Linguistics
    https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.10.1

    Kolekce transkribovaných textů staročeských a středněčeských literárních památek z období přibližně mezi lety 1300 až 1800 s částečnou (hyper)lemmatizací a morfologickým značkováním bez disambiguace. Změny proti předchozí verzi: nevyvážený korpus obsahuje 307 pramenů, celkem 6 377 346 pozic, lemmata jsou přiřazena asi 62 % tokenů, část pramenů byly formálně a věcně opravena, vylepšená tokenizace, doplněno morfologické značkování forem slovesa „býti“.

    A collection of transcribed historical Old Czech and Middle Czech texts from the period of ca. 1300–1800 with partial (hyper-)lemmatisation and morphological tagging without disambiguation. Changes from the previous version: the unbalanced corpus contains 307 historical sources and a total of 6,377,346 position, 62% of the tokens are matched with lemmas, some of the historical texts were corrected formally and factually, tokenisation was improved, morphological tags were added for the verb “býti” (to be) and its forms.
    Trvalý link: http://hdl.handle.net/11104/0306470

     
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.