– Forskningsdata skal deles!

Marte Qvenild

– EU er en av de største produsentene av vitenskapelige data i verden, men benytter i for liten grad slike data til innovasjon og verdiskapning, sier Marte Qvenild fra Forskningsrådet.

Åpne forskningsdata gir fremskritt
Deling og tilgjengeliggjøring av forskningsdata har vært på den internasjonale forskningspolitiske agenda i nærmere ti år.

– EU er en av de største produsentene av vitenskapelige data i verden, men benytter i for liten grad slike data til innovasjon og verdiskapning, sier Marte Qvenild fra Forskningsrådet. Hun sier at EU nå ønsker å forandre på dette: Forskningsdata som i tiden fremover produseres innenfor EUs store rammeprogram for forskning og innovasjon, Horisont 2020, skal som hovedregel være åpne for å sikre gjenbruk og vitenskapelig fremskritt. Så hvorfor skal forskningsdata deles? Qvenild oppsummerer argumentene:

  • Det øker innovasjonstakten og gir raskere vekst
  • Forskningen blir bedre, med økt samarbeid og mindre duplisering
  • Lettere å bygge på andres arbeid
  • Øker transparens, noe som muliggjør involvering av den enkelte og samfunnet
  • Enklere å etterprøve og verifisere forskning
  • Data som er finansiert av det offentlige bør komme allmennheten til gode.

Europeisk forskningspolitikk
I Europa, så vel som i Norge, har åpne data blitt forskningspolitikk. I 2012 kom EU-kommisjonens rapport «Recommendation on Access to and Preservation of Scientific Information».

– Denne ble retningsgivende for politikkutvikling i medlemslandene, også i Norge, sier hun og forteller videre at EU ønsker å spille en ledende rolle i den digitale økonomien for økt innovasjon og samfunnsutvikling, og her blir forskningsdata et viktig verktøy. I tråd med dette målet har EUs ministerråd nylig kommet med prinsipper for tilgjengeliggjøring av forskningsdata. De har lansert FAIR-prinsippet, der data skal være Findable, Accessible, Interoperable og Reusable. Data skal være enkelt tilgjengelig, ha overføringsverdi mellom fagfelt og av en kvalitet som muliggjør gjenbruk. Et annet viktig prinsipp er «så åpen som mulig, og så lukket som nødvendig».

– I Norge startet det for alvor i 2007 ved OECD sine prinsipper og retningslinjer for tilgang til offentlig finansierte forskningsdata, som Norge har forpliktet seg til å implementere, sier hun. Forskningsrådets policy for tilgjengeliggjøring av forskningsdata kom i 2014. Her er åpenhet hovedregel, men med unntak for data som må beskyttes av sikkerhetshensyn, personvern eller andre juridiske forhold. Unntak gjelder også dersom data skal utnyttes kommersielt. Qvenild opplyser videre at Kunnskapsdepartementet nå arbeider med en handlingsplan for forskningsdata, og den skal være ferdig i 2017.

Nye arenaer for deling
– Forskningsrådet sonderer nå interessen for å etablere en dialogarena for ulike infrastrukturer og tjenestetilbydere for arbeid med deling av data, sier hun. Her skal blant annet BIBSYS og Cristin delta sammen med mer fagspesifikke aktører.

– Et tyvetalls infrastrukturer og institusjoner skal møtes og diskutere tjenestetilbudet som finnes for forskere i dag, og om det er behov for å utvide tilbudet, sier hun og peker på en annen viktig arena for deling på EU nivå.

– Gjennom et initiativ kalt European Open Science Cloud ønsker kommisjonen å lage en arena for sikker deling og tilgjengeliggjøring av data på tvers av europeiske land og fagfelt, sier Qvenild. Kina og USA har kommet langt med ”high performance computing”, og EU må bli bedre her. Med denne skyen ønsker en å koble sammen eksisterende infrastruktur og ressurser som allerede finnes.

– Det blir spennende å se nøyaktig hvordan denne digitale plattformen vil fungere, men man kan tenke seg en slags Googletjeneste, der en kan søke og få tilgang til datasett, sier hun.

Metadata er viktig
For at forskningsdata skal være gjenfinnbar, må de ha metadata, og disse bør være i samsvar med internasjonale standarder. Identifikatorer er et viktig element i dette og BIBSYS er nå medlem av DataCite , og har fått rolle som utsteder av DOI-er i Norge. En DOI (Digital Object Identifier) er en varig og unik identifikator.

– De kan brukes på objekter som er siteringsverdige og som har gode metadata. Denne tjenesten tilrettelegger for korrekt sitering av forskningsdata og bidrar til arkivering av forskningsdata for verifikasjon og gjenbruk. Forskningsdata med DOI fra DataCite er gjenfinnbar i Oria.no og synlig sammen med sine respektive publikasjoner, sier hun. Forskningsrådet anbefaler også bruk av Creative Commons lisenser, nærmere bestemt CC-BY lisensen.

– Vi ønsker å bevege oss fra ”åpen hvis man må, lukket hvis man kan”, til ”åpen hvis man kan, lukket hvis man må”, avslutter hun.

Forskningsdata-illustrasjonVidere lesning: