Počet záznamů: 1  

Minulost, současnost a budoucnost korpusu DIALOG

  1. 1.
    0319394 - ÚJČ 2009 RIV CZ cze C - Konferenční příspěvek (zahraniční konf.)
    Kaderka, Petr - Havlík, Martin - Svobodová, Zdeňka - Peterek, Nino - Havlová, Eva K. - Klímová, Jana - Kubáčková, Patricie
    Minulost, současnost a budoucnost korpusu DIALOG.
    [The past, present, and future of the DIALOG corpus.]
    Gramatika a korpus 2007. Praha: Academia, 2008 - (Štícha, F.; Fried, M.), s. 181-189. ISBN 978-80-200-1634-8.
    [Gramatika a korpus 2007. Liblice (CZ), 25.09.2007-27.09.2007]
    Grant CEP: GA AV ČR KJB900610701
    Výzkumný záměr: CEZ:AV0Z90610518
    Klíčová slova: spoken language corpus * multimodal corpus * spoken Czech * television discussion programs
    Kód oboru RIV: AI - Jazykověda

    Korpus DIALOG je speciální korpus mluvené češtiny, v němž jsou shromažďovány audiovizuální nahrávky a přepisy televizních diskusních pořadů. Pracovní verze korpusu obsahuje více než 2 mil. textových slov. Článek se zabývá historií korpusu, popisuje jeho současný stav a věnuje se také výhledům do budoucnosti. Součástí článku je komentovaný přehled studií (témat a hlavních výsledků), které byly vytvořeny s využitím dat z korpusu DIALOG za celou jeho existenci.

    The DIALOG corpus is a special corpus of spoken Czech, consisting of video recordings and transcripts of television discussions. The working form of the corpus contains more than two million words. In the introductory section of this paper, we discuss the motivation that led the researchers from the Czech Language Institute, Academy of Sciences of the Czech Republic to collect and analyze dialogical speech, and we also present an overview of the publications based on work with the corpus. In the second section, we provide information about turning the collected material into an electronic linguistic corpus and about the basic characteristics of the working version of the DIALOG corpus and its first public version, known as DIALOG 0.1 (http://ujc.dialogy.cz). In the concluding section, we present the anticipated schedule for releasing the corpus for public access; we also indicate some currently relevant areas of research that can benefit from using the DIALOG corpus.
    Trvalý link: http://hdl.handle.net/11104/0168546

     
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.