Bevaring av forskningsdata ved prosjektslutt

Denne siden gir veiledning om bevaring av forskningsdata ved prosjektslutt.

Arkivering og publisering av forskningsdata

Ved prosjektslutt er det viktig med langsiktig bevaring av forskningsdata. Arkivering og publisering av forskningsdata er et stadig økende krav fra finansiører, nasjonale myndigheter og tidsskrift. For eksempel forventer Norges forskningsråd, Det europeiske forskningsrådet og Kunnskapsdepartementet åpen tilgang til forskningsdata under prinsippet «så åpent som mulig, så lukket som nødvendig».

I tråd med disse forventningene, sier retningslinjene for forvaltning av forskningsdata ved Nord universitet, at forskere som hovedregel skal gjøre forskningsdata åpent tilgjengelig for videre bruk for alle relevante brukere. Unntaket er når det er juridiske, etiske, sikkerhetsrelaterte eller kommersielle årsaker til ikke å gjøre det. Bevaring av forskningsdata kan oppnås via:

  • tidsskriftstjenester
  • ulike typer dataarkiv (f.eks. domenespesifikke og institusjonelle dataarkiv). Å bruke dataarkiv er generelt en bedre løsning enn å bruke tidsskriftstjenester. Dette fordi tidsskrifter kan kreve opphavsrett til dataene og kan lukke dataene bak en betalingsmur. Arkivering i dataarkiv sikrer enkel tilgang til forskningsdata.

Kilde: CESSDA Data Management Expert Guide.

  • Vurder alternativene beskrevet nedenfor når du skal arkivere dataene dine i et dataarkiv. Er du i tvil, ta kontakt på research-data@nord.no for veiledning.

    • Finansiører kan kreve et spesifikt arkiv for dataene dine. I slike tilfeller må det angitte arkivet brukes. For eksempel for prosjekter innen samfunnsvitenskap, humaniora, medisin og helse kan Norges forskningsråd kreve at forskere arkiverer data i arkivet fra Sikt.

    • Vurder et domenespesifikt dataarkiv. Hvis et slikt arkiv allerede er etablert i forskningsfeltet ditt, er det en god strategi å benytte seg av det. Slike arkiv vil sannsynligvis samle mye av forskningsdataene som produseres i et felt, og dataene i disse arkivene vil sannsynligvis nå flere og ha en økt innvirkning. Se denne veiledningen fra Springer Nature for informasjon om hvordan å velge et domenespesifikt dataarkiv.

    • Som ansatt ved Nord universitet kan du bruke Nord universitet sin samling i DataverseNO. Dette er et tverrfaglig, CoreTrustSeal-sertifisert arkiv for åpne forskningsdata. Publiserte data vil følge beste praksis in henhold til f.eks. datadokumentasjon og foretrukne filformater.

    • Dersom forskningsdataene inneholder informasjon som kan identifisere enkeltpersoner, kan dataene arkiveres hos Sikt personverntjenester.

      To viktige merknader:

      (1) Når det gjelder behandling av personopplysninger, må GPDR alltid følges. Personopplysninger kan ikke lagres lenger enn det som er nødvendig for å oppnå formålene som personopplysningene behandles for. I utgangspunktet skal derfor alle personopplysninger slettes eller anonymiseres ved prosjektets slutt. Under spesielle omstendigheter f.eks. i tilfeller hvor data har høy gjenbruksverdi, kan det være mulig å bevare forskningsdata med personopplysninger også etter at prosjektet er avsluttet. Dette krever imidlertid samtykke fra deltakerne. I tillegg må du informere om dette når du melder prosjektet til Sikt personverntjenester slik at de kan gi en vurdering av dette. Dersom prosjektet krever godkjenning fra REK, må godkjenningen også omfatte lagring av personopplysninger utover prosjektperioden;

      (2) Videre er det verdt å merke seg at GDPR ikke gjelder anonyme data. Det vil si at når et datasett er fullstendig anonymisert, kan det bevares på lang sikt i åpne arkiv (f.eks. i Nord universitet sin samling i DataverseNO). En forskningsetisk vurdering må fortsatt tas i disse tilfellene.

    • Uninett Sigma2 Research Data Archive (NIRD) kan være egnet for store datasett produsert gjennom Uninett Sigma 2 sine tjenester for høykapasitetsberegninger/tungregning.

    • Vurder generiske dataarkiv som Zenodo eller Figshare. Husk å sjekke bruksvilkår og om de har datapubliseringskostnader. Hvis det er kostnader, planlegg på forhånd hvordan prosjektet ditt skal dekke slike utgifter.

    • Hvis ingen av alternativene ovenfor gjelder, kan du søke på re3data.org for å finne andre dataarkiv. Du kan også ta kontakt på research-data@nord.no for veiledning om valg av dataarkiv.

    Ytterligere informasjon om hvordan å velge et dataarkiv kan også finnes på OpenAIRE.

  • Ifølge retningslinjene for forvaltning av forskningsdata ved Nord universitet skal forskningsdata som er uten juridiske, etiske, sikkerhetsrelaterte eller kommersielle begrensninger gjøres tilgjengelig så tidlig som mulig. Videre sier retningslinjene at:

    • Data som danner grunnlag for vitenskapelige publikasjoner skal gjøres tilgjengelig senest ved publiseringstidspunktet.

    • Øvigre data som kan være av interesse for andre forskningsprosjekter bør gjøres tilgjengelig innen rimelig tid, og aldri senere enn tre år etter at et prosjekt er avsluttet.
  • For data som er uten juridiske, etiske, sikkerhetsrelaterte eller kommersielle begrensninger, er det fortsatt nødvendig å reflektere over hvilke deler av dataene som skal bevares. Det er en anbefalt å sette kriterier for bevaring tidlig i et forskningsprosjekt. Digital Curation Center (DCC) gir noen tips i denne forbindelsen:

    • Når det gjelder data som ligger til grunn for en vitenskapelig publikasjon, er det viktig å gjøre det mulig for andre å reprodusere forskningsresultatene dine. I dette tilfellet skal dataene som ble brukt i studien bevares, sammen med data dokumentasjon.

    • For øvrige data som kan være av interesse for andre, anbefales at så mye som mulig av datamateriale bevares. Dette fordi det er mange potensielle bruksområder for forskningsdata f. eks.:

      • Potensial for videre analyse: muligheter for videre analyse av dataene f.eks. ved bruk av nye metoder og integrasjon med andre datakilder.
      • Potensial for videre forskning: data kan føre til nye forskningsspørsmål.  
      • Utvikling av forskningsfelt: data kan ha stor verdi for brukergrupper innen og på tvers av forskningsfelt.
      • Læring og undervisning: forskningsdata kan være verdifulle for lærings-/undervisningsformål.
      • Potensial for samarbeid: forskningsdata som er synlige kan fremme samarbeid med ulike interessenter f.eks. andre forskningsgrupper eller industrielle og offentlige partnere.
  • Ved bruk av et dataarkiv skal en lisens velges. En lisens spesifiserer hva brukere har lov til å gjøre med et datasett. Generelt anbefales standardlisenser som Creative Commons-lisenser fordi de er anerkjent internasjonalt, lesbare for både mennesker og maskiner og er enkle å bruke og forstå.

    I tråd med internasjonal utvikling innen forskningsdatahåndtering bruker Nord universitet sin samling i DataverseNO CC0 "Public Domain Dedication" -lisens som standard. CC0 tillater at dataene distribueres, kopieres, omformateres og integreres i ny forskning uten juridiske hindringer.

    CC0 enables scientists, educators, artists and other creators and owners of copyright- or database-protected content to waive those interests in their works and thereby place them as completely as possible in the public domain, so that others may freely build upon, enhance and reuse the works for any purposes without restriction under copyright or database law.” Kilde: Creative Commons.

    I tillegg unngår CC0-lisensen «attribution stacking» som betegner vanskeligheter med å kombinere data fra mange ulike kilder og med ulike lisenser.

    Det er viktig å merke seg at selv om CC0 ikke juridisk krever kildereferanser, gjelder likevel forskningsetiske retningslinjer og normer. På samme måte som med akademisk litteratur skal forskere alltid referere til sine datakilder. Om CC0 ikke er aktuelt for dine data, ta kontakt på research-data@nord.no.

Hvorfor bevare forskningsdata?

Ved å arkivere og publisere forskningsdata kan andre finne og få tilgang til dataene dine for ulike formål (f.eks. konsultasjon, verifisering av funn og gjenbruk). Det er anbefalt å arkivere forskningsdata i et pålitelig arkiv med tilstrekkelig dokumentasjon og arkivverdige filformater.

Datapublisering øker også anerkjennelsen av vitenskapelig arbeid. Åpne forskningsdata bidrar til økt synlighet og innvirkning av forskning. Den positive effekten vises i studien fra Colavizza et al. (2020), som fant at vitenskapelige publikasjoner der de underliggende dataene er tilgjengelige gjennomsnittlig får flere siteringer.

Metadata

Metadata er strukturert og standardisert informasjon om datasettet. De hjelper andre med å finne, forstå og gjenbruke et datasett. Eksempler på metadata er informasjon om forfattere, bruksvilkår og tilgangsbetingelser. For mer informasjon om metadata, se denne veiledningen fra CESSDA.

Når du sender inn dataene dine til et arkiv, skal du gi informasjon om dataene dine på et standardformat (dvs. metadata), ofte sammen med en README-fil som fungerer som en guide til datasettet ditt.

Ved bruk av Nord universitet sin samling i DataverseNO, vil du bli bedt om å gi så mye informasjon som mulig om dataene dine; se denne veiledningen om metadata. I tillegg vil du bli bedt om å generere en README-fil med detaljert informasjon om dataene; se denne veiledningen om README-filer.

TIPS: hvis du har brukt en README-fil mal fra DataverseNO for datadokumentasjon i løpet av forskningsprosjektet ditt, blir dataarkiveringsprosessen enklere og raskere.