Počet záznamů: 1
Problem of Missing Data in Census - Who Are the Non-Response Respondents?
- 1.0331864 - ÚTIA 2010 RIV CZ eng C - Konferenční příspěvek (zahraniční konf.)
Hora, Jan
Problem of Missing Data in Census - Who Are the Non-Response Respondents?
[Problém chybějících dat při sčítání lidu - kteří respondenti neodpověděli.]
Statistics - Investment in the future 2. Prague: Prague University of Economics, 2009, s. 1-15.
[Statistics - Investment in the future 2. Praha (CZ), 14.09.2009-15.09.2009]
Grant CEP: GA ČR GA102/07/1594; GA MŠMT 1M0572
Grant ostatní: GA MŠk(CZ) 2C06019
Výzkumný záměr: CEZ:AV0Z10750506
Klíčová slova: Census information * Statistical model * Missing data * Non-response substitution
Kód oboru RIV: IN - Informatika
http://library.utia.cas.cz/separaty/2009/RO/hora-problem of missing data in census who are the non response respondents.pdf
The confidentiality of census data is known to be rather restrictive for economic and social research. To improve the availability of census information we have proposed recently a new method of interactive presentation of census results by means of statistical models. The method is based on estimation of the joint probability distribution of data records in the form of a distribution mixture. The estimated mixture model can be used as a knowledge base of a probabilistic expert system and in this way we can derive the statistical information from the distribution mixture without any further access to the original database. The statistical model does not contain the original data and therefore the final interactive software product can be made freely available via internet without any confidentiality concerns.
Interaktivní reprodukce výsledků sčítání lidu pomocí statistického modelu nabízí v této souvislosti alternativní publikační možnost s dokonale zabezpečenou ochranou anonymity dat. Základem metody je odhad statistického modelu původní databáze ve tvaru diskrétní součinové směsi, která je následně použita jako báze znalostí pravděpodobnostního expertního systému. Interaktivní statistický model umožňuje odvozování libovolně podmíněných tabulek resp. histogramů s uživatelským komfortem, který je srovnatelný nebo lepší než v případě souboru mikrodat. Odhadnutá distribuční směs neobsahuje původní data, takže výsledný interaktivní softwarový produkt může být zpřístupněn všem uživatelům bez jakéhokoli omezení.
Trvalý link: http://hdl.handle.net/11104/0005532
Počet záznamů: 1