Håndtering av aktive forskningsdata i løpet av et prosjekt

Lagring og deling av aktive forskningsdata

Beslutninger angående lagring og deling av aktive forskningsdata (dvs. data som samles inn og analyseres i løpet av et prosjekt) er viktige og bør tas i starten av et prosjekt. Det er også viktig å reflektere over risikoer og potensielle konsekvenser av datatap og uautorisert datatilgang, samt å iverksette tiltak for å unngå disse. Husk imidlertid at det kan være behov for å vurdere disse beslutningene på nytt i prosjektforløpet.

Dersom forskningsdataene inneholder personopplysninger, må rutine for personvern i forskning​ følges. 

IT-avdelingen har retningslinjer for hvordan man lagrer og deler aktive forskningsdata:

  • ​Ta kontakt med informasjonssikkerhetsrådgiver Per Gustav Gården og personvernombud Toril Irene Kringen ved Nord universitet for hjelp med klassifisering av forskningsdata.

    • TSD er en plattform hvor sensitive forskningsdata kan samles, lagres og analyseres i et sikkert miljø.

    • Nord universitet har avtale om bruk av TSD som driftes av UiO. TSD oppfyller krav til behandling og lagring av sensitive forskningsdata. TSD er et fullt sett med tjenester, fra innsamling av data, til analyse, behandling og lagring, i sikrede omgivelser.​

    • TSD brukes for strengt fortrolig informasjon (sorte data) eller for store mengder fortrolig informasjon (røde data), som kan forårsake betydelig skade for institusjonen, offentlige interesser, enkeltpersoner eller samarbeidspartnere hvis informasjonen blir kjent for uvedkommende.

    • ​​​UiO tilbyr støtte og brukerveiledning for TSD.
    • ​TSD har en årlig pris per prosjekt. Se TSD-priser.
    • Se intern kursmateriell om TSD​.

Dokumentasjon av forskningsdata

Det er anbefalt å dokumentere forskningsdata på en konsistent eller ensartet måte gjennom hvert enkeltet forskningsprosjekt. Et viktig mål er at både du og andre skal kunne forstå dataene dine. Noen grunnleggende anbefalinger:

  • Start tidlig og bruk datahåndteringsplan for å komme i gang.

  • Vurder hvilken informasjon som er nødvendig for å forstå dataene dine, og dokumenter gjennom hele prosjektet.

  • Lag en dokumentasjonsfil for hvert datasett, og oppgi nok informasjon til at dataene er forståelige. Merk disse filene slik det er en klar sammenheng mellom dem og de tilsvarende datasettene. Vurder en av README-fil maler fra DataverseNO for datadokumentasjon.

  • Vurder arkiveringsalternativ fra starten av prosjektet.

Kilde: basert på CESSDA

Administrer versjoner og kopier av dataene dine

Grunnleggende anbefalinger:

  • ​Hold rådata uberørt og lagret på et sikkert sted. Bruk kopier av rådataene for å kjøre analysene dine. En viktig grunn til dette er at du kanskje må dele dataene med et tidsskrift for fagfellevurdering.

  • Velg et sted for hovedkopier, mens kopier som er lagret andre steder bør være midlertidige og legges tilbake eller synkroniseres med hovedkopiene regelmessig.

  • Sett opp en strategi for versjonskontroll. Dette hjelper deg med å holde oversikt over endringer i dataene. En enkel strategi er å inkludere et versjonskontrollnummer på slutten av filnavnene. For eksempel V1.0, V1.1, V2.0, V3.0 der ordenstall indikerer store endringer og desimaler indikerer mindre endringer.

Kilde: basert på veiledningen "Storing and preserving data" av Utrecht universitet

Mappestruktur og filnavn

Grunnleggende anbefalinger:

  • ​Finn en balanse mellom en flat og en dyp struktur. I en flat struktur med svært få nivåer, vil du sannsynligvis ha filer med lite til felles på samme sted. I en dyp struktur med for mange nivåer vil du sannsynligvis ende opp med fragmentert informasjon og vil bruke mer tid enn nødvendig på å finne filene dine.

  • Gå tilbake til mappestrukturen gjennom hele prosjektet for å finjustere den. Det er sannsynlig at prosjektet ditt vil ha endrede behov knyttet til dette. Planlegg derfor på forhånd for å ha en fleksibel struktur slik at du kan omorganisere den.

Kilde: basert på veiledningen "Storing and preserving data" av Utrecht universitet

Grunnleggende anbefalinger om filnavn:

  • Bruk konsistente filnavn.
  • Bruk beskrivende, men korte filnavn (< 25 tegn).
  • Unngå mellomrom. I stedet kan du bruke understrek (first_study), bindestrek (first-study) eller kamelstil (FirstStudy).
  • Unngå tegn som \ / ? : * ” > < | : # % ” { } | ^ [ ] ` ~ æÆ øØ åÅ äÄ öÖ …
  • Bruk internasjonal datoformat: ÅÅÅÅ-MM-DD (t.d. 2017-10-25).

Kilde: DataverseNO

Filformat

Gjennom et forskningsprosjekt vil du sannsynligvis bruke filformater som Word (.docx) og Excel (.xlsx), men når du nærmer deg prosjektslutt og planlegger å arkivere dataene dine, er det anbefalt å lage en kopi av datafilene dine i et format med følgende egenskaper:

  • ikke-proprietære
  • åpne, og dokumenterte innenfor internasjonale standarder
  • bruke standard tegnkoding, helst Unicode (t.d. UTF-8)
  • ukomprimerte

Ved å følge disse anbefalingene vil du muliggjøre at dataene dine kan brukes på lang sikt. For en fullstendig liste over foretrukne filformater, se DataverseNO.