numer 027
Luty 2024
26

DMP-y, PZD-y i cały ten zgiełk, czyli o zarządzaniu danymi słów kilka

Współczesny świat tonie w danych, generowanych w każdym momencie i gromadzonych na niespotykaną dotąd skalę, a automatyzacja wielu procesów sprawiła, iż mamy do czynienia ze znacznym globalnym przyspieszeniem w tym względzie.
Zmiany nie ominęły również świata nauki, dla którego gromadzone i analizowane dane zawsze przecież były podstawą. Dotychczasowe wymagania metodologiczne, zostają w procesie badawczym uzupełnione dodatkowo o aspekty zarządzania danymi, co materializuje się w formie Planów Zarządzania Danymi (Data Management Plan), będącymi już od pewnego czasu nieodzownymi elementami, wymaganymi przez grantodawców wraz z pełną dokumentacją projektową.
Osoba na grafice trzyma w dłoniach tablet. W tablecie wyświetlają się półki z książkami. Dzięki użyciu efektów graficznych można odnieść wrażenie, że zdjęcie z tabletu
Grafika: Aleksandra Kozak, Biblioteka Główna UM w Lublinie
Plan Zarządzania Danymi – czym w zasadzie jest?
Jest dokumentem dynamicznym, podlegającym zmianom, co oznacza, że należy go również traktować jako miejsce naszej osobistej refleksji, nie jedynie formularz do wypełnienia. A refleksji może być niemało, zważając na ogromny – choć często ukryty – potencjał jaki tkwi w danych. Schematy planów zarządzania danymi, wymagane przez grantodawców są jedynie pewnym niezbędnym minimum informacyjnym, jakie instytucje finansujące potrzebują do oceny wniosków. Oznacza to, że w praktyce możemy mieć tak naprawdę dwa plany – jeden jako dokument niezbędny do uzyskania finansowania w formie okrojonej, oraz drugi – rozbudowany – stanowiący centrum informacyjne dla grupy badawczej.

Nad czym warto pochylić się w pierwszej kolejności?
Przede wszystkim jakiego rodzaju dane pozyskamy lub wytworzymy podczas całego procesu badawczego. Definicja takich „danych” powinna wówczas znacznie wykraczać poza podstawowe rozumienie tego słowa w pracy badacza – surowe dane, które podlegają potem poszerzonej analizie mogą być podstawowym, ale nie jedynym filarem pracy. W zależności od dziedziny, zakresu, przyjętej metodologii, czy nawet osobistych przyzwyczajeń, będą przyjmować różne formy.
Warto już na tym etapie przemyśleć kwestie ergonomii naszej pracy. Być może istnieją już zasoby, z których możemy skorzystać, zarówno w kontekście surowych danych, które poddamy potem analizie, jak i wszelkich danych pomocniczych. Być może udostępnione są one przez inne ośrodki naukowe, niezależnych badaczy, różnego rodzaju organizacje czy administrację publiczną. A może pochodzą... z naszej szuflady? Notatki metodologiczne, skrypt napisany pół roku temu, schematy, instrukcje pisane na potrzeby działalności dydaktycznej – to wciąż są dane pomocnicze, które uzupełniają nasz warsztat, gdyż na tym początkowym etapie granica między typami gromadzonych zasobów (dana, narzędzie, element przyjętej metodologii) jest płynna. Notujemy również wszelkie informacje techniczne – o formie (cyfrowa czy analogowa -– czy planowana digitalizacja), formatach (z jakich formatów plików będziemy korzystać, czy konieczna będzie konwersja i dlaczego), objętości (ile przestrzeni dyskowej potrzebujemy w czasie całego projektu, czy ta wartość zmienia się w czasie), o ich pochodzeniu i prawnych aspektach własności intelektualnej itd.
Na tym etapie zobaczymy również wszelkie flagi ostrzegawcze, wskazujące na konieczność poświęcenia niektórym zasobom większej uwagi – być może pojawią się dane wrażliwe, a może powstanie konieczność uściślenia kto bezpośrednio ma prawo do dysponowania danymi i na jakiej podstawie nam je udostępnia?
Po zgromadzeniu tych wszystkich informacji, należy przesortować je pod względem typu i istotności dla projektu – nie tylko unikniemy chaosu, ale również w szybki sposób „wyłuskamy” te informacje, które np. z punktu widzenia zespołu czy grantodawcy będą niezbędne do wykazania w Planie, czy późniejszego udostępnienia.
Plan się krystalizuje...
Możemy teraz przejść do formalności – w zależności od przyjętego modelu Planu, będzie to proces opisu i analizowania – punkt po punkcie – wszelkich cech i procesów, jakie naszych danych dotyczą. Zwykle to podstawowy opis danych z aspektami technicznymi, prawnymi i organizacyjnymi, wraz z planowaną dokumentacją; procedury bezpieczeństwa i zabezpieczenia natury technologicznej; desygnowanie osób odpowiedzialnych oraz planowanie udostępnienia, archiwizowania czy niszczenia danych.
W kontekście danych wytwarzanych na naszym Uniwersytecie, aspekty związane z kwestiami prawnymi (zarządzanie własnością intelektualną, przetwarzanie danych osobowych) czy zagadnieniami bezpieczeństwa technologicznego (deponowanie danych na Macierzy Dyskowej uczelni, tworzenie kopii bezpieczeństwa, bezpieczeństwo sieci wewnętrznej) są regulowane są przez wewnętrzne akty prawne.
Decyzje związane z udostępnianiem danych powinny być podjęte po odpowiedniej selekcji oraz wybraniu odpowiedniego repozytorium. Postawa otwartości i wpisanie się w nurt otwartej nauki jest zwykle premiowana przez grantodawców, czy nawet stanowi warunek niezbędny do uzyskania finansowania, nie oznacza to jednak konieczności zignorowania wszystkich osobistych obiekcji, jakie mogą pojawić się u członków zespołu badawczego. W każdym przypadku warto w procesie decyzyjnym uwzględnić wszelkie "za i przeciw" i rozwiać wszelkie pojawiające się wątpliwości.

Biblioteka Główna Uniwersytetu Medycznego w Lublinie oferuje usługę konsultacji planów zarządzania danymi – w tym celu należy się skontaktować z Działem Cyfrowego Udostępniania Zbiorów. Wykwalifikowana kadra specjalistów postara się odpowiedzieć na wszelkie pytania oraz pomoże rozwiązać pojawiające się problemy.

Konsultacja telefoniczna – tel.: +48 81 448 58 13
Konsultacja za pomocą e-mail: cyfrowa@umlub.pl
Konsultacje osobiste: Dział Cyfrowego Udostępniania Zbiorów z Pracownią Kserograficzną, budynek Biblioteki Głównej, ul. Szkolna 18, drugie piętro, p. 213.

Zachęcamy również do zapoznania się z dwuetapowym kursem dotyczącym zarządzania danymi badawczymi na platformie Navoica, kierowanym bezpośrednio do naukowców:
Poziom podstawowy: Podstawowy kurs zarządzania danymi badawczymi dla naukowców
Poziom zaawansowany: Średnio zaawansowany kurs zarządzania danymi badawczymi dla naukowców

Treści kursu obejmują zagadnienia wstępne w zakresie otwartej nauki i zarządzania danymi badawczymi, aspekty planowania wszelkich procesów, organizacji, przechowywania danych – podczas trwania badań oraz już po ich zakończeniu, a także udostępniania. Omawiane są również sposoby licencjonowania, modele deponowania, formaty otwarte oraz typy repozytoriów. Instytucją odpowiedzialną za merytorykę kursu jest Uniwersytet Warszawski, zapisy na platformie możliwe są do 30 kwietnia 2024 roku.
Autorka: Aleksandra Pietrzyk, Biblioteka Główna UM w Lublinie
Grafika: Aleksandra Kozak, Biblioteka Główna UM w Lublinie
© 2022 Centrum Symulacji Medycznej UM w Lublinie