English version of this page

Introduksjon til forskningsdata

Forskningsdata er registreringer, nedtegnelser, rapporteringer i form av tall, tekst, bilde, lyd, video som genereres eller oppstår underveis i forskningsprosjekter. Nedenfor kan du lese om ulike typer av data og om hvordan du kan gå frem for å organisere data på en hensiktsmessig måte.

Ulike typer forskningsdata

  • Beregningsdata er data fra modeller, simuleringer og andre beregninger. Det kan være snakk inndata eller utdata, samt algoritmer. Arkivering av slike data avhenger av hvor kostbart og vanskelig det vil være å gjennomføre beregningene på nytt.
  • Eksperimentelle data er data fra kontrollerte forskningsforsøk. Det er særlig behov for å bevare data fra slike forsøk hvis det er vanskelig og tidskrevende å gjenskape eksperimentet.
  • Kildedata er data som allerede finnes, uavhengig av forskningen som skal gjennomføres. Det kan være snakk om dokumenter, opptak, registre eller andre kilder som blir til forskningsdata når en forsker anvender seg av denne informasjonen. Ofte vil det være tilstrekkelig å dokumentere hvor slike data allerede er lagret, men i enkelte tilfeller kan det være fornuftig å lagre en kopi av datasettet man har benyttet seg av.
  • Observasjonsdata er opptak, bilder, målinger og skriftlige nedtegnelser som baserer seg på observasjoner som forskeren foretar seg i en gitt kontekst. Slike data samles inn maskinelt eller fysisk av forskeren. Det er ikke uvanlig at slike data dreier seg om samhandling og mellommenneskelige prosesser, og at forskeren selv er deltagende i sammenhengen som observeres i varierende grader (deltagende observasjon). Observasjonsdata kan vanskelig etterprøves og/eller reproduseres, og derfor er det ofte behov for å arkivere slike data stort (sjekk lagringsguiden).
  • Metadata er data som definerer eller beskriver andre data. Det kan være nyttig å lære seg mer om metadata og metadatastandarder uavhengig av hva slags forskningsdata du arbeider med.
  • Åpne data eller FAIR data er data som er gjort så gjenfinnbare, tilgjengelige, interoperable og gjenbrukbare som mulig, men så lukkede som nødvendig. På høgskolens hjemmesider om åpen forskning kan du lese mer om dette og hvordan man går frem for å gjøre sine data FAIR.

Systematisering og navngivning av filer og mapper

Med "aktive" eller "varme" data menes data som fremdeles er i bruk i forskningssammenheng. Til sammenlikning er dataene "kalde" når de eventuelt arkiveres. Det er viktig å tenke på hvordan man organiserer slike aktive data, slik at det blir lettere å finne fram blant alle mappene og filene og forstå hva de faktisk inneholder uten å måtte åpne hver enkelt fil. Her har vi samlet noen tips til hvordan dette kan gjøres på en hensiktsmessig måte.

Systematisering

  • Hierarkisk mappestruktur kan være nyttige for å holde orden og strukturere dataene.

  • Organiser mappene i relevante kategorier

  • Bruk konsistent navnestruktur på alle mappene. La navnestruktur på mappene gjenspeile innholdet i mappene

  • La mappestrukturen gjenspeiles i filnavnene. Da blir lettere å beholde orden når du senere skal arkivere dataene

  • Bruk en navnsetting som er meningsbærende i prosjektet. Det skal være mulig å forstå innholdet i en fil uten å åpne den

Navngivning

  • Bruk konsistente filnavn
  • Bruk beskrivende, men korte filnavn (< 25 tegn)
  • Unngå mellomrom. I stedet kan du bruke understrek (f.eks. first_study), bindestrek (f.eks. first-study) eller kamelstil (FirstStudy)
  • Unngå spesielle tegn som \ / ? : * ” > < | : # % ” { } | ^ [ ] ` ~ æÆ øØ åÅ äÄ öÖ
  • Bruk internasjonalt datoformat: ÅÅÅÅ-MM-DD
  • Bruk flere siffer dersom filene nummereres (for eksempel 001 i stedet for 1). Da unngår man rot ved sortering
  • Noen elementer som kan inkluderes i filnavn er for eksempel:
    • Dato/tidsintervall/sted
    • Navn på studie/prosjekt
    • Versjonsnummer
    • Fil-innhold
    • Navn/initialer på forskeren
  • Unngå:
    • Ikke-beskrivende, generiske mappenavn som for eksempel «Aktuelt»
    • Personnavn på mapper innad i et prosjekt. Mappenavn skal gjenspeile innholdet
    • Overlappende kategorier eller flere lignede mapper plassert på ulike steder
    • Flere kopier av samme fil i forskjellige mapper. Ved behov kan man lage snarveier til en fil
    • Fil- og mappenavn styrer gjerne hvordan filene sorteres. Dermed kan ønsket sortering være avgjørende for valg av navnesyntaks.

ReadMe-fil

Husk å dokumentere struktur og navnesyntaks i en ReadMe-fil som plasseres på øverste nivå i mappehierarkiet.

Husk dessuten å gjøre følgende (dette kan fortrinnsvis dokumenteres i ReadMe-filen):

  • Beskrive eller loggføre hva som er gjort med dataene
  • Beskrive hvilke typer og versjoner av programvare som blir brukt underveis
Publisert 14. mai 2019 12:24 - Sist endret 17. okt. 2023 13:33