Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník

Jirásek, Karel

Number of the records: 1

Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník

1.

SYSNO ASEP	0369190
Document Type	C - Proceedings Paper (int. conf.)
R&D Document Type	Conference Paper
Title	Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Title	The usage of an InterCorp parallel corpus to obtain equivalents for a Croatian-Czech dictionary
Author(s)	Jirásek, Karel (SLU-S)
Source Title	Korpusová lingvistika Praha 2011, 1 - InterCorp. - Praha : Nakladatelství Lidové noviny, 2011 / Čermák F. - ISBN 978-80-7422-114-9
Pages	s. 45-55
Number of pages	11 s.
Action	Korpusová lingvistika Praha 2011
Event date	22.09.2011-24.09.2011
VEvent location	Praha
Country	CZ - Czech Republic
Event type	EUR
Language	cze - Czech
Country	CZ - Czech Republic
Keywords	Intercorp ; dictionaries ; Croatian language ; Czech language ; lexicography
Subject RIV	AI - Linguistics
CEZ	AV0Z90920516 - SLU-S (2005-2011)
Annotation	Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazyků umožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.
Description in English	In the year 2010, the parallel Croatian-Czech corpus, which is part of the InterCorp project, exceeded 10 million tokens in both language versions and therefore it was possible to proceed to its practical use in finding equivalents for the Croatian-Czech dictionaries being prepared. The indicated size of the corpus has proved to be quite adequate for building a medium size dictionary, which should contain approximately 20 thousand entries. In the case of frequent entries, due to the confrontation of two languages, this corpus size is often adequate to capture the polysemy of words better than some existing explanatory or bilingual dictionaries. This is a great advantage, especially for the creation of bilingual dictionaries of two closely related languages.
Workplace	Institute of Slavonic Studies
Contact	Dana Pilátová, pilatova@slu.cas.cz, Tel.: 224 800 262
Year of Publishing	2012

Number of the records: 1