Počet záznamů: 1
Staročeská a středněčeská textová banka 1.1.11.1
- 1.0521744 - ÚJČ 2020 RIV CZ cze L5 - Specializovaná veřejná databáze
Lehečka, Boris - Černá, Alena M. (ed.) - Svoboda, Ondřej
Staročeská a středněčeská textová banka 1.1.11.1.
[Old Czech and Middle Czech Text Bank 1.1.11.1.]
2019
Grant CEP: GA MŠMT(CZ) LM2015081
Institucionální podpora: RVO:68378092
Klíčová slova: Old Czech * Middle Czech * language corpus
Obor OECD: Linguistics
https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.11.1
Kolekce transkribovaných textů staročeských a středněčeských literárních památek z období přibližně mezi lety 1300 až 1800 s částečnou nejednoznačnou (hyper)lemmatizací a morfologickým značkováním bez disambiguace. Změny proti předchozí verzi: nevyvážený korpus obsahuje 312 pramenů, celkem 6 695 241 pozic, lemmata jsou přiřazena asi 63 % tokenů, značkování pomocí aktuální staročeské morfologické databáze (nově slovesa 5. třídy „dělati“).
A collection of transcribed historical Old Czech and Middle Czech texts from the period of ca. 1300–1800 with partial (hyper-)lemmatisation and morphological tagging without disambiguation. Changes from the previous version: the unbalanced corpus contains 312 historical sources and a total of 6,695,241 positions, 63% of the tokens are matched with lemmas, tagging is done using the current Old Czech morphological database (class V – “dělati” – verbs added).
Trvalý link: http://hdl.handle.net/11104/0306469
Počet záznamů: 1