Výzkumná data

Výzkumná data – Research Data tvoří základ vědecké práce, dokumentují její výsledky a představují jednu z forem výstupů vědecké práce. Zahrnují jakékoli informace či materiály, které byly shromážděny, pozorovány, změřeny, vygenerovány nebo vytvořeny za účelem dosažení, ověření či reprodukování výsledků vědeckého výzkumu. Výzkumná data představují zaznamenaný faktický materiál obecně uznávaný ve vědecké komunitě jako nezbytný pro ověření výsledků výzkumu, včetně souborů dat používaných jako podklad pro vědecké publikace.

Výzkumná data by měla být spravována podle FAIR principů, v případě zveřejnění a otevřeného sdílení výzkumných dat mluvíme o otevřených výzkumných datech. Nedílnou součástí nakládání z výzkumnými daty by měla být vhodná správa výzkumných dat, jejíž součástí je v posledních letech čím dál tím rozšířenější tvorba tzv. plánů správy dat (DMP, Data Management Plan). Pro dlouhodobé uchování výzkumných dat je vhodné využít dostupné datové repozitáře.

Co jsou výzkumná data

Rozsah typů výzkumných dat odráží rozmanitost vědeckých disciplín a jejich výzkumných přístupů a metod. Příklady výzkumných dat:

  • digitální kopie
  • audiovizuální data
  • digitální reprezentace analogových dat
  • data z měření, pozorování a průzkumů
  • texty a textové edice
  • databáze a sbírky předmětů
  • protokoly
  • metodické testovací postupy jako jsou dotazníky, software a simulace

Za výzkumná data se považují také informace, které zaručují dokumentaci, sledovatelnost a reprodukovatelnost výsledků (metadata).

Výzkumná data mohou být jak analogová data, dokumenty a objekty relevantní pro výzkum, které mají být digitalizovány v průběhu výzkumu, tak i původní digitální data, dokumenty a objekty (“born digital”), které vznikají v průběhu výzkumného procesu a jsou předmětem nebo výsledkem výzkumu. Za výzkumná data naopak nejsou považovány textové interpretace (publikace), např. časopisecký článek či dizertace.

Životní cyklus výzkumných dat

Model životního cyklu výzkumných dat popisuje a vizualizuje různé fáze, kterými procházejí data během výzkumného procesu. Detailní pohled na jednotlivé fáze výzkumného procesu může pomoci odhalit specifické požadavky související s daty a navrhnout vhodné postupy pro zajištění efektivní správy výzkumných dat. Jednotlivé fáze mohou probíhat současně nebo některé mohou chybět v závislosti na povaze dat, požadavcích projektu, prováděných experimentech nebo oborových standardech. Rozhodnutí o tom, které postupy a strategie zavést a kdy a jak, se provádí ve fázi plánování.

Příklady modelů životního cyklu výzkumných dat:

Úroveň otevřenosti výzkumných dat

  • otevřená – open: data, ke kterým může kdokoli přistupovat, používat je a sdílet; musí být licencována tak, aby bylo zřejmé, že kdokoli může data používat jakýmkoli způsobem, včetně jejich úpravou, kombinováním a sdílením s ostatními, a to i pro komerční účely (více v sekci otevřená výzkumná data)
  • s embargem – with embargo: data jsou veřejnosti zpřístupněna s odstupem od jejich vložení do repozitáře, např. z důvodu požadavku vydavatele; datum zpřístupnění je uvedeno v repozitáři
  • omezená/sdílená – shared: podobně jako otevřená data mohou být sdílená data široce přístupná, ale mohou mít určité podmínky přístupu (např. nekomerční opakované použití); ne všechna sdílená data musí být přístupná komukoli, někdy jsou sdílená data zpřístupněna pouze určitým skupinám, například kolegům z jiné univerzity, někdy musí uživatel zažádat a zdůvodnit svoji žádost o přístup k datům
  • uzavřená/neveřejná – closed: pokud výzkumní pracovníci operují s velmi citlivými daty (například citlivými osobními údaji nebo komerčně citlivými údaji), nemusí být sdílena vůbec; v takových případech by však měl být sdílen alespoň metadatový popis výzkumných dat

Legitimní omezení otevřeného přístupu k výzkumným datům

Ne všechna výzkumná data mohou být otevřená. Tam, kde data vyvolávají obavy o soukromí nebo bezpečnost, může být nutné nastavit více kontrol a omezení přístupu k výzkumným datům. Dle doporučení UNESCO z roku 2021 se jedná například o právní procesy, obchodní tajemství, práva duševního vlastnictví, osobní údaje, ochranu lidských subjektů nebo ohrožených a vzácných druhů. Jakákoli omezení přístupu k datům by měla být výslovná a odůvodněná a tato data by měla být stále spravována v souladu s FAIR principy.

Otevřený přístup tedy nemusí být poskytnut vždy, zejména pokud by to bylo v rozporu:

  • se zájmy EU v oblasti hospodářské soutěže
  • s právem na ochranu duševního vlastnictví v případě podávání žádosti o patent
  • s právem na ochranu soukromí a osobních údajů
  • s právem na ochranu obchodního tajemství
  • s bezpečností státu
  • s jinými oprávněnými zájmy Příjemce veřejné podpory (např. v případě možnosti obchodního využití)
  • s povinnostmi Příjemce veřejné podpory vůči Poskytovateli finanční podpory VaVaI

Pokud není zajištěn otevřený přístup k některým nebo ke všem datům, důvody by měly být uvedeny v plánu správy dat a ve zpřístupněných metadatech.

Možná úskalí sdílení otevřených výzkumných dat

  • nevyjasněné právní a etické otázky, např. kdo je zodpovědný za shromážděná data, jakým způsobem lze data anonymizovat, zda/jak lze údaje anonymizovat, aby byla zaručena ochrana údajů aj.
  • nedostatečná infrastruktura, jako je specializovaný datový server nebo poradenské služby
  • dodatečná pracovní zátěž výzkumných pracovníků a celých výzkumných týmů
  • zvyšování nákladů na výzkum včetně lidských zdrojů
  • nedostatek pobídek k přípravě a dokumentaci dat, zejména u subjektů s málo automatizovanými průzkumy nebo s nedostatečnou správou výzkumných dat 

Další zdroje

  1. Výzkumná data (Centrum pro podporu open science, Univerzita Karlova)
  2. Výzkumná data (Open Science, ČVUT v Praze)
  3. Správa výzkumných dat (Ústav vědecko-pedagogických informací a služeb, Mendelova univerzita v Brně)
  4. Open/FAIR data (Knihovna Akademie věd ČR)
  5. Enhanced Access to Publicly Funded Data for Science, Technology and Innovation [online]. OECD, 2020. ISBN 9789264733312. DOI: 10.1787/947717bc-en
  6. HÜBNER, Andreas. Who „owns“ research data? Zenodo, 2024. DOI: 10.5281/zenodo.11059315
  7. LEWIS, Crystal. Data Management in Large-Scale Education Research [online]. CRC Press, 2024. Dostupné také z: https://datamgmtinedresearch.com/
  8. OECD. Recommendation of the Council OECD Legal Instruments concerning Access to Research Data from Public Funding. 2021. Dostupné také z: https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0347