Počet záznamů: 1
Staročeská a středněčeská textová banka 1.1.10.1
- 1.0521743 - ÚJČ 2020 RIV CZ cze L5 - Specializovaná veřejná databáze
Lehečka, Boris - Černá, Alena M. (ed.) - Svoboda, Ondřej
Staročeská a středněčeská textová banka 1.1.10.1.
[Old Czech and Middle Czech Text Bank 1.1.10.1.]
2019
Grant CEP: GA MŠMT(CZ) LM2015081
Institucionální podpora: RVO:68378092
Klíčová slova: Old Czech * Middle Czech * language corpus
Obor OECD: Linguistics
https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.10.1
Kolekce transkribovaných textů staročeských a středněčeských literárních památek z období přibližně mezi lety 1300 až 1800 s částečnou (hyper)lemmatizací a morfologickým značkováním bez disambiguace. Změny proti předchozí verzi: nevyvážený korpus obsahuje 307 pramenů, celkem 6 377 346 pozic, lemmata jsou přiřazena asi 62 % tokenů, část pramenů byly formálně a věcně opravena, vylepšená tokenizace, doplněno morfologické značkování forem slovesa „býti“.
A collection of transcribed historical Old Czech and Middle Czech texts from the period of ca. 1300–1800 with partial (hyper-)lemmatisation and morphological tagging without disambiguation. Changes from the previous version: the unbalanced corpus contains 307 historical sources and a total of 6,377,346 position, 62% of the tokens are matched with lemmas, some of the historical texts were corrected formally and factually, tokenisation was improved, morphological tags were added for the verb “býti” (to be) and its forms.
Trvalý link: http://hdl.handle.net/11104/0306470
Počet záznamů: 1