Počet záznamů: 1

Problem of Missing Data in Census - Who Are the Non-Response Respondents?

  1. 1.
    0331864 - UTIA-B 2010 RIV CZ eng C - Konferenční příspěvek (zahraniční konf.)
    Hora, Jan
    Problem of Missing Data in Census - Who Are the Non-Response Respondents?.
    [Problém chybějících dat při sčítání lidu - kteří respondenti neodpověděli.]
    Statistics - Investment in the future 2. Prague: Prague University of Economics, 2009, s. 1-15.
    [Statistics - Investment in the future 2. Praha (CZ), 14.09.2009-15.09.2009]
    Grant CEP: GA ČR GA102/07/1594; GA MŠk 1M0572
    Grant ostatní: GA MŠk(CZ) 2C06019
    Výzkumný záměr: CEZ:AV0Z10750506
    Klíčová slova: Census information * Statistical model * Missing data * Non-response substitution
    Kód oboru RIV: IN - Informatika
    http://library.utia.cas.cz/separaty/2009/RO/hora-problem of missing data in census who are the non response respondents.pdf http://library.utia.cas.cz/separaty/2009/RO/hora-problem of missing data in census who are the non response respondents.pdf

    The confidentiality of census data is known to be rather restrictive for economic and social research. To improve the availability of census information we have proposed recently a new method of interactive presentation of census results by means of statistical models. The method is based on estimation of the joint probability distribution of data records in the form of a distribution mixture. The estimated mixture model can be used as a knowledge base of a probabilistic expert system and in this way we can derive the statistical information from the distribution mixture without any further access to the original database. The statistical model does not contain the original data and therefore the final interactive software product can be made freely available via internet without any confidentiality concerns.

    Interaktivní reprodukce výsledků sčítání lidu pomocí statistického modelu nabízí v této souvislosti alternativní publikační možnost s dokonale zabezpečenou ochranou anonymity dat. Základem metody je odhad statistického modelu původní databáze ve tvaru diskrétní součinové směsi, která je následně použita jako báze znalostí pravděpodobnostního expertního systému. Interaktivní statistický model umožňuje odvozování libovolně podmíněných tabulek resp. histogramů s uživatelským komfortem, který je srovnatelný nebo lepší než v případě souboru mikrodat. Odhadnutá distribuční směs neobsahuje původní data, takže výsledný interaktivní softwarový produkt může být zpřístupněn všem uživatelům bez jakéhokoli omezení.
    Trvalý link: http://hdl.handle.net/11104/0005532