Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
1.
SYSNO ASEP
0369190
Document Type
C - Proceedings Paper (int. conf.)
R&D Document Type
Conference Paper
Title
Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Title
The usage of an InterCorp parallel corpus to obtain equivalents for a Croatian-Czech dictionary
Author(s)
Jirásek, Karel (SLU-S)
Source Title
Korpusová lingvistika Praha 2011, 1 - InterCorp. - Praha : Nakladatelství Lidové noviny, 2011 / Čermák F.
- ISBN 978-80-7422-114-9
Pages
s. 45-55
Number of pages
11 s.
Action
Korpusová lingvistika Praha 2011
Event date
22.09.2011-24.09.2011
VEvent location
Praha
Country
CZ - Czech Republic
Event type
EUR
Language
cze - Czech
Country
CZ - Czech Republic
Keywords
Intercorp ; dictionaries ; Croatian language ; Czech language ; lexicography
Subject RIV
AI - Linguistics
CEZ
AV0Z90920516 - SLU-S (2005-2011)
Annotation
Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazyků umožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.
Description in English
In the year 2010, the parallel Croatian-Czech corpus, which is part of the InterCorp project, exceeded 10 million tokens in both language versions and therefore it was possible to proceed to its practical use in finding equivalents for the Croatian-Czech dictionaries being prepared. The indicated size of the corpus has proved to be quite adequate for building a medium size dictionary, which should contain approximately 20 thousand entries. In the case of frequent entries, due to the confrontation of two languages, this corpus size is often adequate to capture the polysemy of words better than some existing explanatory or bilingual dictionaries. This is a great advantage, especially for the creation of bilingual dictionaries of two closely related languages.
Workplace
Institute of Slavonic Studies
Contact
Dana Pilátová, pilatova@slu.cas.cz, Tel.: 224 800 262
Year of Publishing
2012
Number of the records: 1
This site uses cookies to make them easier to browse. Learn more about
how we use cookies.