Number of the records: 1  

Webové archivy a sociální vědy: příležitosti, problémy a řešení

  1. 1.
    0522603 - SOÚ 2020 RIV CZ cze J - Journal Article
    Pilnáček, Matouš - Tabery, Paulína - Vávra, Martin
    Webové archivy a sociální vědy: příležitosti, problémy a řešení.
    [Web Archives and Social Sciences: Opportunities, Problems and Solutions.]
    Naše společnost. Roč. 17, č. 1 (2019), s. 43-58. ISSN 1214-438X
    R&D Projects: GA MK(CZ) DG18P02OVV016
    Keywords : web archives * social sciences * ethical issues
    OECD category: Media and socio-cultural communication
    Method of publishing: Open access
    https://cvvm.soc.cas.cz/index.php?option=com_content&view=article&id=5126&lang=en

    Tento článek se věnuje úvodu do problematiky webových archivů, které mohou sloužit jako zdroj dat částečně vypovídající o dynamické proměně současné společnosti a komunikace. V první části článku je představen smysl webových archivů a jejich současné institucionální zakotvení jak v České republice, tak v zahraničí. V druhé části je diskutována otázka přístupu k datům z webových archivů. Omezení v přístupu jsou na jedné straně technická, kdy se musí výzkumník vypořádat s velkým množstvím dat a nároky na výpočetní kapacitu, a na druhé straně právní a etická. Jako částečné řešení omezení v přístupu k datům navrhuje článek mimo jiné vytvoření a provozování analytického rozhraní, ze kterého by výzkumníci mohli získávat agregované výstupy z webových archivu. Třetí závěrečná část článku se věnuje metodologickým omezením dat uložených ve webových archivech. Zabývá se především otázkami reprezentativity, neúplnosti a heterogenity těchto dat. Autoři článku nabízí dílčí řešení otázky omezené reprezentativity celoplošných sklizní prostřednictvím kvalitního výběru dat z webového archivu, a to jak pomocí tematického zúžení, tak pomocí pravděpodobnostního váženého výběru dat z archivu. Článek také zdůrazňuje, že pozorovaná změna webu se kromě změny chování aktérů může dít i z důvodů změny populace používající internet, změny technologie a v neposlední řadě kvůli změně metodologie sběru dat. Je proto důležité vytvářet velmi pečlivou dokumentaci sběru dat webového archivu a v případě využívání analytického rozhraní i přesný popis metod, které má výzkumník v rozhraní k dispozici.

    This article provides an introduction to the subject matter of web archives, which can serve as sources of data that help us draw a picture of the dynamic change of contemporary society and communication. In the first section of the article, we explain the purpose of web archives and their current institutional framework both in the Czech Republic and abroad. In the second section, we discuss issues of accessing web archive data. We distinguish technological access limitations, where the researcher is faced with large amounts of data and computing requirements, legal, and ethical limitations. As a partial solution to data access limitations, the article proposes creating and operating an analytical interface through which researchers could obtain aggregate web archive data. Finally, the third section of the article deals with the methodological limitations of web archive data. It primarily focuses on issues of representativeness, incompleteness and heterogeneity of such data. As a partial solution to the problem of limited representativeness of full-domain harvests, the authors propose implementing weighted random sampling of web archive data. Furthermore, the article stresses that observed changes to online content are based not only on changes in actors’ behaviours but possibly also shifts in the population of internet users, technological innovations and, last but not least, modifications of data collection methodology. It is, therefore, important for web archives to document their data collection efforts carefully and complete any analytical interfaces they provide with a precise description of the methods available to researchers.
    Permanent Link: http://hdl.handle.net/11104/0307068

     
    FileDownloadSizeCommentaryVersionAccess
    J_Pilnacek _Tabery_Vavra_Naše společnost 2019.pdf2198 KBPublisher’s postprintopen-access
     
Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.