Number of the records: 1  

DIALOG 1.0: Multimediální korpus mluvené češtiny

  1. 1.
    0336657 - ÚJČ 2010 RIV CZ cze E - Electronic Document
    Kaderka, Petr - Peterek, Nino - Wagnerová, Jana - Kubáčková, Patricie - Klímová, Jana - Havlová, Eva K. - Havlík, Martin
    DIALOG 1.0: Multimediální korpus mluvené češtiny.
    [DIALOG 1.0: A multimodal corpus of spoken Czech.]
    [datový soubor]. - Praha: Ústav pro jazyk český AV ČR, 2009, 14 GB
    R&D Projects: GA AV ČR KJB900610701
    Institutional research plan: CEZ:AV0Z90610518
    Keywords : spoken language corpus * multimodal corpus * spoken Czech * television discussion programs * transcription
    Subject RIV: AI - Linguistics
    http://ujc.dialogy.cz/

    Korpus DIALOG 1.0 obsahuje 100 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 666 695 textových slov. Počet mluvčích je 618, z toho 159 mluvčích vysloví více než 1000 slov. Přepisy jsou prozodicky a morfologicky anotovány a lematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný na internetu, a to pouze pro registrované uživatele.

    The DIALOG 1.0 corpus contains 100 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. The corpus contains a total of 666 695 words. There are a total of 618 speakers, 159 of which uttered more than 1000 words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only.
    Permanent Link: http://hdl.handle.net/11104/0180846

     
     
Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.