Počet záznamů: 1
DIALOG 0.3
- 1.0336652 - ÚJČ 2010 RIV CZ cze E - Elektronický dokument
Kaderka, Petr - Peterek, Nino - Wagnerová, Jana - Kubáčková, Patricie - Klímová, Jana - Havlová, Eva K. - Havlík, Martin
DIALOG 0.3.
[The DIALOG 0.3 Corpus.]
[datový soubor]. - Praha: Ústav pro jazyk český AV ČR, 2009, 10.4 GB
Grant CEP: GA AV ČR KJB900610701
Výzkumný záměr: CEZ:AV0Z90610518
Klíčová slova: spoken language corpus * multimodal corpus * spoken Czech * television discussion programs * transcription
Kód oboru RIV: AI - Jazykověda
http://ujc.dialogy.cz/
Korpus DIALOG 0.3 obsahuje 70 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 493 089 textových slov. Počet mluvčích je 487, z toho 100 mluvčích vysloví více než 1000 slov. Přepisy jsou prozodicky a morfologicky anotovány a lematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný na internetu, a to pouze pro registrované uživatele.
The DIALOG 0.3 corpus contains 70 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. The corpus contains a total of 493 089 words. There are a total of 487 speakers, 100 of which uttered more than 1000 words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only
Trvalý link: http://hdl.handle.net/11104/0180841
Počet záznamů: 1