Number of the records: 1  

DIALOG 0.1m

  1. 1.
    0324955 - ÚJČ 2009 RIV CZ cze E - Electronic Document
    Kaderka, Petr - Peterek, Nino - Kubáčková, Patricie - Svobodová, Zdeňka - Klímová, Jana - Havlová, Eva K. - Havlík, Martin
    DIALOG 0.1m.
    [The DIALOG 0.1m Corpus.]
    [datový soubor]. - Praha: Ústav pro jazyk český AV ČR, v. v. i, 2008, on-line
    R&D Projects: GA AV ČR KJB900610701
    Institutional research plan: CEZ:AV0Z90610518
    Keywords : spoken language corpus * multimodal corpus * spoken Czech * television discussion programs * transcription
    Subject RIV: AI - Linguistics

    Korpus DIALOG 0.1m obsahuje 10 nahrávek a přepisů televizního diskusního pořadu 7 čili Sedm dní / Sedmička. Celková velikost korpusu je 92 000 textových slov. Přepisy jsou prozodicky a morfologicky anotovány a lematizovány a spojeny s audiovizuální nahrávkou. Anotace a lematizace byla provedena manuálně. Korpus je přístupný přes internet, a to pouze pro registrované uživatele.

    The DIALOG 0.1m corpus contains 10 audio-visual recordings and transcripts of a Czech television discussion program. It is comprised of a total of 92 000 words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The annotation and lemmatization were processed manually. The corpus is available via Internet for registered users only.
    Permanent Link: http://hdl.handle.net/11104/0172529

     
     
Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.