Dane badawcze (research data) – dane zebrane lub wytworzone jako materiał do analizy w ramach badań naukowych. Dostęp do nich pozwala zweryfikować wyniki zaprezentowane w publikacji naukowej. Informacje, w szczególności fakty, liczby, zebrane do analizy i uważane za podstawę do dalszego wnioskowania, dyskusji lub obliczeń.
Cykl życia danych badawczych:
- Planowanie.
- Wytworzenie i zbieranie.
- Opracowanie i analiza.
- Przechowywanie.
- Udostępnianie.
- Ponowne wykorzystanie.
Rodzaje danych badawczych:
- surowe – zebrane, ale nie przeanalizowane;
- obserwacyjne – przechwytywane w czasie rzeczywistym (np. odczyty czujników, dane telemetryczne, wyniki anonimowych ankiet, badania fokusowe), często unikalne, ponieważ nie można ich „odzyskać”;
- eksperymentalne – uzyskane ze sprzętu laboratoryjnego w kontrolowanych warunkach, powtarzalne, ale często bardzo kosztowne (np. sekwencje genów, spektroskopia, odczyty pola magnetycznego);
- dane symulacji – zebrane podczas testów badających rzeczywiste lub teoretyczne systemy (np. modele klimatyczne, ekonomiczne, systemy inżynieryjne);
- dane pochodne / skompilowane – wyniki analiz danych, albo dane agregowane z różnych źródeł. Powtarzalne, ale ich pozyskanie może być bardzo kosztowne (bazy danych, teksty, modele 3D, dane bibliometryczne);
- dane referencyjne – poprawione lub organiczne zbiory danych, zwykle recenzowane, publikowane i selekcjonowane (dane GUS, struktury chemiczne, bazy danych z sekwencjami genów).
Przykłady danych badawczych:
- notatki z eksperymentów, dzienniki;
- protokoły laboratoryjne, opisy procedur;
- opisy metodologiczne;
- próbki;
- artefakty, obiekty;
- dokumenty tekstowe;
- kwestionariusze, ankiety;
- nagrania audio lub wideo;
- fotografie, obrazy;
- zawartość baz danych (obrazy, teksty, nagrania audio i wideo);
- oprogramowanie (skrypty, pliki wejściowe);
- wyniki symulacji komputerowych;
- modele matematyczne i algorytmy.
Dane badawcze powinny być udostępniane zgodnie z zasadą: Tak otwarte, jak to możliwe i na tyle zamknięte, w jakim stopniu to jest konieczne (As open as possible, as closed as necessary).
Zasady FAIR:
- Findable – łatwe do znalezienia i wyszukania.
- Accesible – dostępne dla wszystkich,
- Interoperable – interoperacyjne, łatwe do odczytu i przetwarzania zarówno przez ludzi, jak i komputery.
- Reusable – możliwe do ponownego wykorzystania.
Licencje Creative Commons dla danych badawczych:
- CC0 – zrzeczenie się praw autorskich
- CC BY – Uznanie autorstwa
- CC BY-NC – Uznanie autorstwa – Użycie niekomercyjne
- CC BY-SA – Uznanie autorstwa – Na tych samych warunkach
- CC BY-NC-SA – Uznanie autorstwa – Użycie niekomercyjne – Na tych samych warunkach
- CC BY-ND – Uznanie autorstwa – Bez utworów zależnych
- CC BY-NC-ND – Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych