Počet záznamů: 1
DIALOG 0.2
- 1.0324995 - ÚJČ 2009 RIV CZ cze E - Elektronický dokument
Kaderka, Petr - Peterek, Nino - Svobodová, Zdeňka - Kubáčková, Patricie - Klímová, Jana - Havlová, Eva K. - Havlík, Martin
DIALOG 0.2.
[The DIALOG 0.2 Corpus.]
[datový soubor]. - Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008, on-line
Grant CEP: GA AV ČR KJB900610701
Výzkumný záměr: CEZ:AV0Z90610518
Klíčová slova: spoken language corpus * multimodal corpus * spoken Czech * television discussion programs * transcription
Kód oboru RIV: AI - Jazykověda
Korpus DIALOG 0.2 obsahuje 40 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 361 000 textových slov. Přepisy jsou prozodicky a morfologicky anotovány a lematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný přes internet, a to pouze pro registrované uživatele.
The DIALOG 0.2 corpus contains 40 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. It is comprised of a total of 361 000 words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only.
Trvalý link: http://hdl.handle.net/11104/0172562
Počet záznamů: 1