Pārlekt uz galveno saturu

Datu deponēšana

Dep-LVDatu deponēšana ir process, kurā pētniecības dati tiek ievietoti un strukturētā repozitorijā, lai nodrošinātu to saglabāšanu, pieejamību un atkārtotu izmantojamību laika gaitā. Pētniecības datu pārvaldībā (PDP) datu deponēšana ir būtisks elements, kas palīdz uzturēt pētniecības atklātību, reproducējamību un ilgtermiņa pieejamību. Tā ir cieši saistīta ar atvērtās zinātnes un FAIR (atrodami, pieejami, savietojami, atkārtoti izmantojami) datu principiem, veicinot datu koplietošanu un pieejamību gan pētniekiem, gan plašākai sabiedrībai.

Tā kā datu kļūst arvien vairāk un pētījumu ietvaros nepieciešams organizēt sadarbību starp dažādiem pētniekiem un organizācijām, efektīva datu deponēšanas prakse ir svarīga, lai būtu iespējams kvalitatīvi pārvaldītu datus visā to dzīves ciklā. Datu repozitoriji – vai tie būtu institucionāli, specifiski konkrētai disciplīnai, vai atvērtās piekļuves – nodrošina strukturētu vidi datu glabāšanai, organizēšanai un izgūšanai, saglabājot pētniecības rezultātus turpmākai izmantošanai un atklājumiem.

Šajā nodaļā jūs varēsiet uzzināt par:

  • deponēšanas iemesliem, t.sk. par pētniecības atklātības palielināšanu, datu pieejamības uzlabošanu, sadarbības un datu koplietošanas veicināšanu;
  • datu deponēšanas procesa soļiem, kas ietver datu sagatavošanu, piemērota repozitorija izvēli, metadatu izveidi, licencēšanas un piekļuves tiesību noteikšanu utt.;
  • izaicinājumiem datu deponēšana, ko ietekmē gan datu privātuma apsvērumi, gan resursu ierobežojumi;
  • labo praksi datu deponēšanā – savlaicīgu plānošanu, standartizētu metadatu shēmu izmantošanu, atbilstoša repozitorija izvēli u.c. pasākumiem;
  • datu deponēšanas nākotnes tendencēm, ko nosaka tehnoloģiju progress un datu koplietošanas normu izmaiņās.

Datu deponēšana ir būtiska mūsdienu pētniecībā, jo tā sniedz vairākas priekšrocības gan pētniekiem, gan iestādēm, gan sabiedrībai kopumā. Ievietojot datus repozitorijā, pētnieki nodrošina, ka viņu darbs ir pieejams, pārbaudāms un atkārtoti izmantojams.

Galvenie iemesli, kāpēc datu deponēšana ir svarīga:

  • datu saglabāšana: repozitoriji nodrošina ilgtermiņa uzglabāšanu, aizsargājot datus no zudumiem, kas var rasties aparatūras kļūmju, nejaušas dzēšanas vai citu risku dēļ;
  • pētniecības atklātības palielināšana: datu deponēšana padara pētījuma rezultātus atklātus, ļaujot citiem pārbaudīt secinājumus, atkārtot pētījumus un apstiprināt rezultātus;
  • atbilstība finansētāju un publicēšanas prasībām: daudzi finansētāji un žurnāli mūsdienās pieprasa datu deponēšanu kā nosacījumu dotāciju saņemšanai vai rakstu publicēšanai, veicinot atbildīgu datu pārvaldību;
  • datu pieejamības uzlabošana: deponētie dati tiek indeksēti un organizēti repozitorijos, kas padara tos vieglāk meklējamus, un pieejamus atkārtotai izmantošanai;
  • sadarbības un datu koplietošanas veicināšana: dati, kas deponēti repozitorijos, ir pieejami plašākai auditorijai, veicinot sadarbību starp disciplīnām un reģioniem.

Atbalstot datu deponēšanu, pētniecības iestādes un finansētāji sekmē to koplietošanas un atvērtības kultūru, paātrinot zinātnisko progresu un efektīvāku pētniecības resursu izmantošanu.

Datu deponēšanas process ietver vairākus soļus, kas nodrošina, ka dati ir pienācīgi sagatavoti, organizēti un iesniegti repozitorijā. Šis process var nedaudz atšķirties atkarībā no datu veida, disciplīnas vai repozitorija prasībām, bet vispārīgi ietver šādas darbības :

  • datu sagatavošana: pētniekiem jānodrošina, ka dati ir sakārtoti, un tiem pievienoti detalizēti metadati, kas ietver tādas detaļas kā datu avots, vākšanas metodes un kontekstuāla informācija;
  • piemērota repozitorija izvēle: pētniekiem jāizvēlas repozitorijs, kas atbilst viņu nozares vai institūcijas vadlīnijām. Plaši izmantotie repozitoriji ir, piemēram, Zenodo (vispārēji pētniecības dati), Dryad (bioloģijas un vides zinātnēm) un ICPSR (sociālajām zinātnēm);
  • metadatu izveide: aprakstošo metadatu pievienošana ir būtiska, lai nodrošinātu datu pieejamību un izmantojamību. Metadatiem būtu jāatbilst standartiem, kas ir piemēroti datu tipam vai pētniecības jomai, piemēram, Dublin Core vispārējiem datiem vai nozarei specifisks metadatu standarts;
  • licencēšanas un piekļuves tiesību noteikšana: pētniekiem jānosaka atbilstoša licencēšana, lemjot par atvērtu vai ierobežotu piekļuvi, pamatojoties uz datu jutīgumu vai īpašumtiesībām;
  • iesniegšana un pārbaude: pēc datu a\ugšupielādes pētniekiem var būt nepieciešams pārbaudīt deponēšanas procesā ievadīto informāciju, lai pārliecinātos, ka tā ir pareiza un pilnīga. Daži repozitoriji piedāvā datu kvalitātes pārbaudes procesu;
  • pastāvīgo identifikatoru piešķiršana: kad dati ir deponēti, tiem bieži tiek piešķirts Digital Object Identifier (DOI), kas ir unikāls un pastāvīgs identifikators, kas atvieglo datu citēšanu un izsekošanu.

Katrs datu deponēšanas procesa solis ir būtisks, lai padarītu datus drošus, pieejamus un izmantojamus, atbalstot PDP un datu koplietošanas principus.

Datu deponēšana rada vairākus izaicinājumus, kurus pētniekiem un institūcijām jārisina, lai nodrošinātu efektīvu datu pārvaldību:

  • datu jutīgums un privātuma apsvērumi: sensitīvu datu, piemēram, veselības vai personiskās informācijas, deponēšanai nepieciešami stingri privātuma pasākumi. Datu anonimizācija vai deidentifikācija var būt sarežģīta un laikietilpīga;
  • resursu ierobežojumi: deponēšanas process, tostarp datu tīrīšana, metadatu izveide un iesniegšana, var būt resursietilpīgs un prasa laiku, zināšanas un reizēm arī finansējumu;
  • repozitorija izvēle: piemērota repozitorija izvēle var būt sarežģīta daudzo iespēju un prasību dēļ. Pētniekiem var būt neskaidrības par institucionāla, disciplīnai specifiska vai vispārēja repozitorija izmantošanu;
  • licencēšanas un piekļuves lēmumi: atbilstošas datu licencēšanas noteikšana var būt sarežģīta, īpaši pētniekiem, kuri nav pazīstami ar atvērtās piekļuves prasībām, Creative Commons licencēm vai īpašuma tiesību apsvērumiem;
  • kvalitātes kontrole un standartizācija: datu kvalitātes, konsekvences un metadatu standartu atbilstības nodrošināšana var būt izaicinājums, īpaši lielu un sarežģītu datu kopu gadījumā;
  • ilgtermiņa uzturēšana un atjauninājumi: laika gaitā deponētajiem datiem var būt nepieciešami atjauninājumi vai labojumi. Nodrošināt datu precizitāti un izmantojamību var būt sarežģīti, ja resursi uzturēšanai ir ierobežoti.

Šie izaicinājumi uzsver nepieciešamību pēc institucionālā atbalsta, apmācībām un pietiekamiem resursiem, lai palīdzētu pētniekiem efektīvi orientēties datu deponēšanas procesā.

Labās prakses ievērošana var padarīt datu deponēšanu efektīvāku un palīdzēt pētniekiem izveidot labi organizētas, pieejamas datu kopas, kas atbilst repozitorija prasībām un lietotāju vajadzībām.

Datu deponēšanas labā prakse:

  • savlaicīga plānošana: pētniekiem būtu jāplāno datu deponēšana jau projekta sākumā, apsverot datu pārvaldības, tīrīšanas un metadatu prasības. Savlaicīga plānošana palīdzēs vienkāršot deponēšanas procesu vēlāk;
  • standartizētu metadatu shēmu izmantošana: tādu standartu kā DataCite vai Dublin Core izmantošana nodrošina, ka dati atbilst repozitorija prasībām un ir viegli atrodami un atkārtoti izmantojami;
  • atbilstoša repozitorija izvēle: piemērota repozitorija izvēle, kas atbilst datu disciplīnai vai tipam, palielina datu redzamību un pieejamību. Pētnieki var konsultēties ar institūciju vai izmantot atvērtas un publiski pieejamas platformas, piemēram, re3data.org;
  • skaidru licencēšanas un piekļuves tiesību definēšana: licencēšanas un piekļuves līmeņu noteikšana nodrošina, ka dati tiek kopīgoti atbildīgi. Pētniekiem vajadzētu pārskatīt atvērtās piekļuves politikas un konsultēties ar institūciju vai repozitoriju uzturētājiem;
  • sadarbība ar datu pārvaldības ekspertiem: konsultēšanās ar datu bibliotekāriem, IT darbiniekiem vai PDP profesionāļiem var palīdzēt pētniekiem izpildīt repozitorija prasības, izstrādāt augstas kvalitātes metadatus un izvēlēties atbilstošus formātus;
  • strukturēta dokumentācija: visaptveroša dokumentācija, tostarp metodoloģija, failu organizācija un datu formāti, palīdz padarīt datus saprotamus un izmantojamus pat lietotājiem, kuri nav pazīstami ar oriģinālo pētījumu.

Ievērojot šīs labās prakses, pētnieki var nodrošināt, ka viņu deponētie dati ir labi sagatavoti, pieejami un vērtīgi ilgtermiņa izmantošanai, sniedzot labumu gan pētniecības kopienai, gan sabiedrībai.

Datu deponēšanas joma turpina attīstīties līdz ar tehnoloģiju progresu un datu koplietošanas normu izmaiņām. Datu deponēšanas nākotnes tendences, visticamāk, iekļaus automatizāciju, uzlabotu savietojamību un paplašinātas datu koplietošanas iespējas.

Jaunās tendences un nākotnes virzieni:

  • automatizēta datu un metadatu ģenerēšana: mākslīgais intelekts un mašīnmācīšanās arvien vairāk tiek izmantoti, lai automatizētu datu tīrīšanu, metadatu ģenerēšanu un failu organizēšanu, samazinot pētnieku slodzi un uzlabojot precizitāti.
  • uzlabota repozitoriju savietojamība: nākotnē repozitoriji varētu integrēties savā starpā, ļaujot vieglāk kombinēt, meklēt un piekļūt datiem no dažādiem avotiem, veicinot starpdisciplināru pētniecību.
  • blokķēžu tehnoloģija datu integritātei: blokķēžu tehnoloģija varētu nodrošināt  pārbaudāmus datu deponēšanas ierakstus, uzlabojot atklātību un izsekojot datu izmaiņām laika gaitā;
  • reāllaika datu deponēšana un atjauninājumi: tā kā datu vākšana un analīze kļūst ātrāka, pētnieki varētu deponēt datus reāllaikā vai biežāk atjaunināt deponētos datus, uzlabojot datu pieejamību un precizitāti.
  • integrācija ar atvērtās zinātnes iniciatīvām: datu deponēšanas prakse visticamāk vairāk saskaņosies ar atvērtās zinātnes politikām, kas uzsver publisku datu pieejamību un reproducējamību;
  • lietotājam draudzīgi repozitoriji un vizualizācijas rīki: repozitoriji, visticamāk, piedāvās lietotājam draudzīgākus interfeisus un datu vizualizācijas iespējas, padarot datu saprašanu, izpēti un atkārtotu izmantošanu vienkāršāku pētniekiem un sabiedrībai.

Šīs tendences norāda uz nākotni, kur datu deponēšana būs vairāk automatizēta, integrēta un pieejama, veicinot sadarbīgāku un atklātāku pētniecības vidi.

Médiathèques HES-SO Valais-Wallais. (2024). Choosing a data repository. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://hevs-ch.libguides.com/RDM/Choosing-repository

Queen’s University Belfast. (2024). Research Data Management: Finishing a research project. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://libguides.qub.ac.uk/ResearchDataManagement/FinishingAProject

RCSI Library. (2024). Data sharing and long-term preservation. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://libguides.rcsi.ie/rdm/preservation

The Chinese University of Hong Kong Library. (2024). Research Data Management: Data Deposit. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://libguides.lib.cuhk.edu.hk/rdm/datadeposit

UCLA Library. (2024). Data Deposit and Sharing. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://guides.library.ucla.edu/c.php?g=180539&p=1189101