Počet záznamů: 1  

DIALOG 1.1: Multimediální korpus mluvené češtiny

  1. 1.
    0423555 - ÚJČ 2014 RIV CZ cze E - Elektronický dokument
    Kaderka, Petr - Peterek, Nino - Kubáčková, Patricie - Havlík, Martin - Havlová, Eva K. - Jílková, Lucie
    DIALOG 1.1: Multimediální korpus mluvené češtiny.
    [DIALOG 1.1: A multimodal corpus of spoken Czech.]
    [datový soubor]. - Praha: Ústav pro jazyk český AV ČR, v. v. i, 2012, 19, GB
    Institucionální podpora: RVO:68378092
    Klíčová slova: spoken language corpus * multimodal corpus * television discussion programs * spoken Czech
    Kód oboru RIV: AI - Jazykověda
    http://ujc.dialogy.cz/

    Korpus DIALOG 1.1 obsahuje 150 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 932 373 textových slov. Počet mluvčích je 758, z toho 245 mluvčích vysloví více než 1000 slov. Přepisy jsou prozodicky a morfologicky anotovány a lematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný na internetu, a to pouze pro registrované uživatele.

    The DIALOG 1.1 corpus contains 150 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. The corpus contains a total of 932 373 words. There are a total of 758 speakers, 245 of which uttered more than 1000 words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only.
    Trvalý link: http://hdl.handle.net/11104/0229694

     
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.