FAIR principi un dati

F-LV Tehnoloģiju un uz datiem balstītu pētījumu attīstība ir novedusi pie vēl nepieredzēta datu apjoma radīšanas dažādās zinātnes jomās. Lai gan datu pieejamība piedāvā milzīgu potenciālu jauniem atklājumiem, tā arī rada izaicinājumus datu pārvaldībā, pieejamībā un ilgtermiņa izmantojamībā. FAIR datu principi tika ieviesti, lai risinātu šos izaicinājumus un nodrošinātu, ka dati ir atrodami (Findable), pieejami (Accessible), sadarbspējīgi jeb savietojami (Interoperable) un atkārtoti izmantojami (Reusable). FAIR mērķis ir nodrošināt, ka pētniecības dati tiek efektīvi kopīgoti, viegli atrodami un izmantojami dažādos pētniecības projektos, tādējādi veicinot sadarbību un paātrinot zinātnisko progresu.

FAIR principi tika formāli aprakstīti 2016. gadā, Wilkinson et al. publicējot rakstu “The FAIR Guiding Principles for scientific data management and stewardship”. Kopš tā laika šie principi ir ieguvuši globālu atzinību un tiek plaši īstenoti dažādās zinātnes jomās, cenšoties radīt ilgtspējīgu atvērtās zinātnes ekosistēmu, kur dati ir brīvi pieejams resurss.

Šajā nodaļā jūs varēsiet uzzināt par:

FAIR datu principiem, kas veicina efektīvu datu koplietošanu un izmantošanu;
FAIR principiem atbilstošu datu nozīmi zinātniskajā pētniecībā, kas veicina to atkārtotu izmantošanu un sadarbību starp pētniecības organizācijām;
FAIR principu praktisko īstenošanu, kas apraksta metodes un pieejamos rīkus, lai šos principus būtu iespējams realizēt;
izaicinājumiem FAIR datu ieviešanā, kas apraksta būtiskākās problēmas, ar kurām var saskarties pētnieki, kā arī to risināšanas metodes;
FAIR datu nākotni un to ietekmi uz zinātni, kas raksturo, kāda būs FAIR principu nozīmē nākotnes pētījumos un kādu labumu no to ievērošanas iegūs sabiedrība.

Četri FAIR principi

Akronīms FAIR nozīmē atrodami (Findable), pieejami (Accessible), sadarbspējīgi (Interoperable) un atkārtoti izmantojami (Reusable). Katrs princips risina konkrētu datu pārvaldības aspektu un sniedz vadlīnijas efektīvai datu koplietošanai un izmantošanai:

atrodami: datiem jābūt viegli atrodamiem gan cilvēkiem, gan datoru programmām. Šī mērķa sasniegšanai datiem nepieciešami bagātīgi metadati, unikāli identifikatori (piemēram, DOI) un glabāšana repozitorijos ar meklēšanas iespējām;
pieejami: kad dati ir atrasti, tiem jābūt iegūstamiem, izmantojot precīzi definētus protokolus. FAIR nenozīmē, ka visiem datiem jābūt atklāti pieejamiem; tiem jābūt pieejamiem saskaņā ar konkrētiem nosacījumiem un ar skaidrām piekļuves atļaujām;
sadarbspējīgi: datiem jābūt savietojamiem ar citām datu kopām un skaitļošanas rīkiem, tāpēc ir jāizmanto standartizēti formāti, kopīgas vārdnīcas un struktūras, kas nodrošina datu integrāciju un salīdzināmību;
atkārtoti izmantojami: lai maksimāli palielinātu datu vērtību, tiem jābūt atkārtoti izmantojamiem nākotnes pētījumos. Atkārtota izmantošana ir atkarīga no detalizētu metadatu esamības, lietošanas licencēm un to atbilstības nozares standartiem.

FAIR principiem ir jādarbojas sinerģiski, nodrošinot, ka dati ir ne tikai pieejami, bet arī jēgpilni izmantojami, atbalstot starpdisciplināru pētniecību un inovācijas.

FAIR datu nozīme zinātniskajā pētniecībā

FAIR dati ir būtiski mūsdienu pētniecībā, jo tie veicina atklātību, reproducējamību un datu ilgtermiņa izmantojamību. Ievērojot FAIR principus, pētnieki var padarīt datus pieejamākus plašākai auditorijai, veicinot sekundāro pētniecību un ļaujot pārbaudīt rezultātus. FAIR principi palīdz novērst datu zudumu un to nelietderīgu ievākšanu, nodrošinot sistemātiskus veidus, kā uzglabāt un pārvaldīt pētniecības datus.

FAIR datu priekšrocības:

uzlabota pētniecības efektivitāte: pētnieki ietaupa laiku, atkārtoti izmantojot esošos datus, nevis atkārtojot datu vākšanu;
palielināta ietekme: pētījumi rāda, ka atvērtie, FAIR atbilstīgie dati bieži vien tiek vairāk citēti;
labāka sadarbība: FAIR datu principi atvieglo starpdisciplināru komandu sadarbību, jo standartizēti dati ļauj tos bez problēmām integrēt dažādās jomās.

COVID-19 pandēmija uzskatāmi parādīja FAIR datu nozīmi, jo zinātnieki visā pasaulē apmainījās ar datiem un paātrināja vakcīnu izstrādi, izmantojot atvērtos datus par vīrusu, tā izplatību un vakcīnu izmēģinājumu rezultātiem.

FAIR principu praktiskā īstenošana

Veiksmīgai FAIR principu īstenošanai nepieciešami specifiski rīki, platformas un standarti. Galvenās komponentes ir datu repozitoriji, metadatu standarti, pastāvīgie identifikatori un datu pārvaldības plānu veidošanas rīki.

Galvenie rīki un platformas:

datu repozitoriji: tādas platformas kā Zenodo, Dryad un Figshare ir populāri repozitoriji, kas atbalsta FAIR prasībām atbilstošu datu glabāšanu un koplietošanu;
datu pārvaldības plāni (DPP): tādi rīki kā DMPTool vai ARGOS palīdz pētniekiem izklāstīt, kā viņi apstrādās datus, ievērojot FAIR principus, sākot no datu vākšanas līdz koplietošanai un arhivēšanai;
metadatu standarti: lai atbalstītu sadarbspēju, tiek piemēroti metadatu standarti, piemēram, Dublin Core vispārējiem datiem vai MIxS mikrobiomu pētījumiem. Standartizētu formātu izmantošana ļauj datus jēgpilni apvienot ar citām datu kopām (skat. metadatu standartu katalogu pa nozarēm);
pastāvīgie identifikatori: PID ir unikāli un ilglaicīgi piešķirti identifikatori, kas ļauj viennozīmīgi identificēt objektu, personu, organizāciju, datu kopumu, digitālo resursu vai citu vienību. To galvenais mērķis ir nodrošināt, ka saistītais resurss vai informācija ir viegli atrodama un pieejama arī pēc laika, neskatoties uz tehnoloģiskajām vai strukturālajām izmaiņām.

Finansēšanas aģentūras un pētniecības iestādes bieži pieprasa, lai pētnieki izstrādā FAIR atbilstīgus datu pārvaldības plānus, tādējādi uzsverot apņemšanos ievērot ilgtspējīgu datu praksi.

Izaicinājumi FAIR ieviešanā

Lai gan FAIR datu priekšrocības ir ievērojamas, šo principu ieviešana ir saistīta ar vairākiem izaicinājumiem:

izmaksas un infrastruktūra: FAIR prakses ieviešanai ir nepieciešami ieguldījumi tehnoloģijās un infrastruktūrā. Daudziem pētniekiem, jo īpaši jaunattīstības valstīs, trūkst finanšu resursu, lai uzturētu FAIR prasībām atbilstošus repozitorijus vai modernas datu glabāšanas sistēmas;
kultūras barjeras: dažās jomās pētnieki var vilcināties dalīties ar datiem, bažījoties par to ļaunprātīgu izmantošanu vai kontroles zaudēšanu pār savu darbu. Pāreja uz atvērtības un sadarbības kultūru prasa izmaiņas darbinieku stimulēšanas un motivācijas sistēmās;
standartu sarežģītība: dažādu zinātnes jomu datu tipu un formātu daudzveidība apgrūtina universālu standartu izveidi. Bieži vien nepieciešami pielāgoti risinājumi, bet tas var sarežģīt sadarbspējas mērķa sasniegšanu;
privātums un drošība: īpaši tādās jomās kā veselības aprūpe, pastāv ētiski un juridiski apsvērumi saistībā ar datu koplietošanu. Joprojām aktuāls jautājums ir FAIR prasītās atklātības un privātuma apsvērumu līdzsvarošana, kam nepieciešama stabila datu pārvaldība un anonimizācijas metodes.

Lai risinātu šīs problēmas, būs vajadzīgi saskaņoti valdību, iestāžu un pētnieku centieni saņemt finansiālu, tehnisku un politisku atbalstu.

FAIR datu nākotne un to ietekme uz zinātni

FAIR datu nākotne ir daudzsološa, jo tehnoloģiju attīstība un politikas izmaiņas arvien vairāk atbalsta atvērto zinātni un datu koplietošanu. Inovācijas mākslīgā intelekta, mašīnmācīšanās un blokķēdes tehnoloģijās var uzlabot datu pārvaldību, padarot FAIR principus vieglāk īstenojamus. Piemēram, mākslīgā intelekta rīki var automatizēt datu pārvaldību un palīdzēt atklāt un labot metadatu kļūdas, vienkāršojot FAIR datu uzturēšanas procesu.

Politikas un finansējuma atbalsts. Tādas organizācijas kā Eiropas Savienība, izmantojot programmu “Horizon 2020”, un ASV Nacionālais veselības institūts ir ieviesuši noteikumus, kas pieprasa veikt datu pārvaldību saskaņā ar FAIR principiem. Daudzas finansējošās aģentūras tagad pieprasa atvērtu piekļuvi publikācijām un datu koplietošanu kā nosacījumus grantu saņemšanai, mudinot pētniekus visā pasaulē pieņemt FAIR praksi.

Nākotnes perspektīvas:

mākslīgā intelekta vadīta datu pārvaldība: mākslīgais intelekts var atvieglot FAIR datu pārvaldību, identificējot modeļus datu kopās, identificējot metadatus un automatizējot datu tīrīšanas procesus;
autonoma datu koplietošana: blokķēdes tehnoloģijas var piedāvāt drošus veidus datu koplietošanai un verifikācijai, nodrošinot privātumu un uzticamību;
plašāka starpdisciplināra sadarbība: pieaugot FAIR datu izplatībai, starpdisciplinārā pētniecība gūs labumu no vienkāršas datu integrācijas dažādās jomās, veicinot zinātniskus atklājumus.

Ievērojot FAIR principus, zinātniskā kopiena var nodrošināt, ka dati ir koplietojams, atkārtoti izmantojams resurss, kas veicina inovācijas un rada uz sadarbību vērstu, pārredzamāku un produktīvāku pētniecības vidi.

Resursi padziļinātai izpratnei

Barker M., Chue Hong N.P., Katz D.S., Lamprecht A.L., Martinez-Ortiz C., Psomopoulos F., Harrow J., Castro L. J., Gruenpeter M., Martinez P.A., Honeyman T. (2022). Introducing the FAIR Principles for research software. Scientific Data, Vol. 9, pp. 1–6. DOI: 10.1038/s41597-022-01710-x

Boeckhout M., Zielhuis G.A., Bredenoord A.L. (2018). The FAIR guiding principles for data stewardship: fair enough? European Journal of Human Genetics, Vol. 26, pp. 931–936. DOI: 10.1038/s41431-018-0160-0

GO FAIR. (2024). FAIR Principles. [tiešsaiste] [skatīts 11/23/2024]. Pieejams: https://www.go-fair.org/fair-principles/

Izglītības un zinātnes ministrija. (2021). Latvijas atvērtās zinātnes stratēģija 2021.-2027. gadam. 30 lpp.

Mons B., Schultes E., Liu F., Jacobsen A. (2020). The FAIR principles: First generation implementation choices and challenges. Data Intelligence, Vol. 2, pp. 1–9. DOI: 10.1162/dint_e_00023

OpenAIRE. (2020). How to make your data FAIR. [tiešsaiste] [skatīts 11/24/2024]. Pieejams: https://www.openaire.eu/how-to-make-your-data-fair

Wilkinson M.D., Dumontier M., Aalbersberg Ij.J., Appleton G., Axton M., Baak A., Blomberg N., Boiten J.W., da Silva Santos L.B., Bourne P.E., Bouwman J., Brookes A.J., Clark T., Crosas M., Dillo I., Dumon O., Edmunds S., Evelo C.T., Finkers R., … Mons B. (2016). Comment: The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, Vol. 3, pp. 1–9. DOI: 10.1038/sdata.2016.18