Lagring og deling av aktive forskningsdata
Beslutninger angående lagring og deling av aktive forskningsdata (dvs. data som samles inn og analyseres i løpet av et prosjekt) er viktige og bør tas i starten av et prosjekt. Det er også viktig å reflektere over risikoer og potensielle konsekvenser av datatap og uautorisert datatilgang, samt å iverksette tiltak for å unngå disse. Husk imidlertid at det kan være behov for å vurdere disse beslutningene på nytt i prosjektforløpet.
Dersom forskningsdataene inneholder personopplysninger, må rutine for personvern i forskning følges.
IT-avdelingen har retningslinjer for hvordan man lagrer og deler aktive forskningsdata:
- Se «Retningslinjer for klassifisering av informasjon ved Nord universitet» for informasjon om hvordan å klassifisere data ut fra beskyttelsesbehov og virksomhetskritikalitet.
- Se «Veiledning klassifisering av filer og epost» for en trinnvis veiledning om hvordan å klassifisere og beskytte filer og e-poster.
Ta kontakt med informasjonssikkerhetsrådgiver Per Gustav Gården og personvernombud Toril Irene Kringen ved Nord universitet for hjelp med klassifisering av forskningsdata.
- Se «Retningslinjer for klassifisering av informasjon ved Nord universitet» for informasjon om hvordan å klassifisere data ut fra beskyttelsesbehov og virksomhetskritikalitet.
- «Lagring av forskningsdata ved Nord universitet»: veiledning om hvor forskningsdata skal lagres ut fra beskyttelsesbehov og hvem dataene deles med (dvs. intern eller ekstern deling).
- «Lagringsguide for Nord universitet»: oversikt over hvilke verktøy og lagringsområder som kan brukes ut fra beskyttelsesbehov f.eks. verktøy for innhenting, analyse, deling, lagring m.m.
- «Lagring av forskningsdata ved Nord universitet»: veiledning om hvor forskningsdata skal lagres ut fra beskyttelsesbehov og hvem dataene deles med (dvs. intern eller ekstern deling).
- TSD er en plattform hvor sensitive forskningsdata kan samles, lagres og analyseres i et sikkert miljø.
- Nord universitet har avtale om bruk av TSD som driftes av UiO. TSD oppfyller krav til behandling og lagring av sensitive forskningsdata. TSD er et fullt sett med tjenester, fra innsamling av data, til analyse, behandling og lagring, i sikrede omgivelser.
- TSD brukes for strengt fortrolig informasjon (sorte data) eller for store mengder fortrolig informasjon (røde data), som kan forårsake betydelig skade for institusjonen, offentlige interesser, enkeltpersoner eller samarbeidspartnere hvis informasjonen blir kjent for uvedkommende.
- UiO tilbyr støtte og brukerveiledning for TSD.
- TSD har en årlig pris per prosjekt. Se TSD-priser.
- Se intern kursmateriell om TSD.
- TSD er en plattform hvor sensitive forskningsdata kan samles, lagres og analyseres i et sikkert miljø.
Dokumentasjon av forskningsdata
Det er anbefalt å dokumentere forskningsdata på en konsistent eller ensartet måte gjennom hvert enkeltet forskningsprosjekt. Et viktig mål er at både du og andre skal kunne forstå dataene dine. Noen grunnleggende anbefalinger:
- Start tidlig og bruk datahåndteringsplan for å komme i gang.
- Vurder hvilken informasjon som er nødvendig for å forstå dataene dine, og dokumenter gjennom hele prosjektet.
- Lag en dokumentasjonsfil for hvert datasett, og oppgi nok informasjon til at dataene er forståelige. Merk disse filene slik det er en klar sammenheng mellom dem og de tilsvarende datasettene. Vurder en av README-fil maler fra DataverseNO for datadokumentasjon.
- Vurder arkiveringsalternativ fra starten av prosjektet.
Kilde: basert på CESSDA
Administrer versjoner og kopier av dataene dine
Grunnleggende anbefalinger:
- Hold rådata uberørt og lagret på et sikkert sted. Bruk kopier av rådataene for å kjøre analysene dine. En viktig grunn til dette er at du kanskje må dele dataene med et tidsskrift for fagfellevurdering.
- Velg et sted for hovedkopier, mens kopier som er lagret andre steder bør være midlertidige og legges tilbake eller synkroniseres med hovedkopiene regelmessig.
- Sett opp en strategi for versjonskontroll. Dette hjelper deg med å holde oversikt over endringer i dataene. En enkel strategi er å inkludere et versjonskontrollnummer på slutten av filnavnene. For eksempel V1.0, V1.1, V2.0, V3.0 der ordenstall indikerer store endringer og desimaler indikerer mindre endringer.
Kilde: basert på veiledningen "Storing and preserving data" av Utrecht universitet
Mappestruktur og filnavn
Grunnleggende anbefalinger:
- Finn en balanse mellom en flat og en dyp struktur. I en flat struktur med svært få nivåer, vil du sannsynligvis ha filer med lite til felles på samme sted. I en dyp struktur med for mange nivåer vil du sannsynligvis ende opp med fragmentert informasjon og vil bruke mer tid enn nødvendig på å finne filene dine.
- Gå tilbake til mappestrukturen gjennom hele prosjektet for å finjustere den. Det er sannsynlig at prosjektet ditt vil ha endrede behov knyttet til dette. Planlegg derfor på forhånd for å ha en fleksibel struktur slik at du kan omorganisere den.
Kilde: basert på veiledningen "Storing and preserving data" av Utrecht universitet
Grunnleggende anbefalinger om filnavn:
- Bruk konsistente filnavn.
- Bruk beskrivende, men korte filnavn (< 25 tegn).
- Unngå mellomrom. I stedet kan du bruke understrek (first_study), bindestrek (first-study) eller kamelstil (FirstStudy).
- Unngå tegn som \ / ? : * ” > < | : # % ” { } | ^ [ ] ` ~ æÆ øØ åÅ äÄ öÖ …
- Bruk internasjonal datoformat: ÅÅÅÅ-MM-DD (t.d. 2017-10-25).
Kilde: DataverseNO
Filformat
Gjennom et forskningsprosjekt vil du sannsynligvis bruke filformater som Word (.docx) og Excel (.xlsx), men når du nærmer deg prosjektslutt og planlegger å arkivere dataene dine, er det anbefalt å lage en kopi av datafilene dine i et format med følgende egenskaper:
- ikke-proprietære
- åpne, og dokumenterte innenfor internasjonale standarder
- bruke standard tegnkoding, helst Unicode (t.d. UTF-8)
- ukomprimerte
Ved å følge disse anbefalingene vil du muliggjøre at dataene dine kan brukes på lang sikt. For en fullstendig liste over foretrukne filformater, se DataverseNO.