INSTITUSJONEN

Dansk Data Arkiv - arkivering af data i 25 år

Hans Jørgen Marker

Dansk Data Arkiv er et nationalt dataarkiv for samfundsvidenskabelige og historiske forskningsdatamaterialer. Da DDA blev grundlagt i 1973, var det den danske version af en international bevægelse af dataarkivgrundlæggelser, som var startet ved University of Michigan i Ann Arbor med International Consortium for Political Social Research, ICPSR. Dette amerikanske initiativ blev en model for oprettelser af nationale dataarkiver i Nordvesteuropa. I Tyskland (Köln), Storbritannien (Colchester) og Norge (Bergen) er dataarkiverne ældre end det danske. Hovedformålet med disse dataarkiver var arkivering af samfundsvidenskabelige spørgeskemadatamaterialer. Spørgeskemaundersøgelser er nemlig dels meget bekostelige og dels ureproducerbare. Man kan ikke gentage en spørgeskemaundersøgelse og opnå de samme svar, som man fik i den oprindelige undersøgelse. Den danske variant af temaet blev anderledes derved, at datamaterialer fra historisk forskning fra begyndelsen blev anset for en del af ansvarsområdet.

Dansk Data Arkiv blev grundlagt som et eksperiment under det samfundsvidenskabelige forskningsråd. Eksperimentet var oprindelig treårigt, men da de første tre år gik godt, forlængedes projektet med yderligere to år, som blev brugt til at finde den rette form for en permanentgørelse. Formen blev i 1978 en placering af DDA ved Odense Universitet som et institut umiddelbart under konsistorium. Denne ordning fungerede frem til 1993, hvor DDA blev en institution i Statens Arkiver.

I projektperioden fra 1973-78 boede DDA i lejede lokaler på H.C.Andersens Boulevard i København sammen med Rigsarkivets edb-afdeling. Som del af Odense Universitet, havde institutionen til huse i det elementbyggeri, som var rejst til universitetet, mens universitetets varige byggeri blev opført. Efter overgangen til Statens Arkiver fik DDA sine nuværende lokaler på Islandsgade i Odense.

Ved etableringen i april 73 blev der ansat 7 medarbejdere. Ansættelserne fortsatte, indtil institutionen i februar 1974 nåede 22 medarbejdere. Sit højeste medarbejdertal nogensinde nåede DDA i juni 1975 med 27 medarbejdere. Ved flytningen til Odense nåede medarbejdertallet ned til 11 i maj 1978. I tiden under Odense Universitet var DDA størst i september-december 1979, hvor det havde 23 medarbejdere. Ved overflytningen til Statens Arkiver var medarbejdertallet skrumpet til 12. Sin største størrelse under Statens Arkiver havde DDA i maj-juli 1996 med 21 medarbejdere. I oktober 1998 har DDA 15 medarbejdere og to stillinger under besættelse.

Med oprettelsen af Enheden for Registrering og Arkivering af Sundhedsvidenskabelige Datamaterialer, ERAS, som projekt finansieret af Danmarks Grundforskningsfond er DDA’s fagrække udvidet til også at omfatte sundhedsvidenskab. Afgrænsningen af, hvilke datamaterialer, det så er, DDA har ansvar for, er vanskeligere at præcisere. Typen af datamaterialer, som er vigtige i forskningen, er naturligvis præget af den teknologiske udvikling. Det betyder dog ikke, at man skal lade sig forblinde af teknologien. Nok er det i dag muligt at lave databaser, hvor felterne indeholder lyd eller levende billeder, men DDA er ikke blevet præsenteret for ønsker om arkivering af sådanne datamaterialer. DDA’s fokus er på den type datamaterialer, som faktisk anvendes i forskningen, og blandt disse er DDA’s perspektiv præget af arkivets historiske udgangspunkt, spørgeskemadatamaterialerne.

Et spørgeskemadatamateriale består af en fil, som man kan opfatte som en tabel, hvori søjlerne er spørgsmålene, og rækkerne er svarpersonerne. Rigtig mange af de materialer, som anvendes i forskningen, kan ses som en eller flere tabeller med individer i den ene dimension og egenskaber i den anden. Det er sådanne tabeller, som DDA’s bevarings- og formidlingsmetoder er bedst egnet til at håndtere.

Når et sådant datamateriale af forskningsmæssig relevans kommer til DDA’s kendskab, tager DDA passende skridt for at få materialet indleveret. Det kan her være en meget enkel procedure, hvis den forsker, der har materialet, på forhånd er indstillet på at aflevere det. Det kan være en vanskeligere opgave, hvis forskeren skal have forklaret arkiveringens nødvendighed og hensigtsmæssighed. Arkivering er nødvendig af forskningsetiske grunde. Forskning er kun forskning, når den lader sig efterprøve, og forskning, der er baseret på et datamateriale, lader sig kun efterprøve, hvis datamaterialet er til rådighed. Arkiveringen er hensigtsmæssig for forskeren, fordi langtidsbevaring af maskinlæsbare data faktisk er en opgave, som kan være vanskelig at løse, hvis man ikke har det som sit fag. Der er flere faldgruber i langtidsbevaringen, hvilket har medført, at mange forskere gennem tiden har haft glæde af at kunne hente deres egne data i DDA, når disse data var gået tabt for dem selv. Endelig er der naturligvis det aspekt, at data, såfremt de stilles til rådighed for andre forskere, kan gøre gavn i undervisning, til specialer og ved pilotanalyser i forskningsplanlægningen. Der er også en række egentlige forskningsprojekter, som er blevet mulige i kraft af, at Danmark har en enestående samling af let tilgængelige forskningsdatamaterialer.

Noget af det første, DDA gør i forbindelse med lokaliseringen af et nyt datamateriale, er at skrive en såkaldt studiebeskrivelse, SD. Studiebeskrivelsen indeholder de nødvendige baggrundsoplysninger om datamaterialet i standardiseret form. Standarden er international og blev vedtaget i 1974 på et møde i København mellem repræsentanter for 9 institutioner, herunder dataarkiverne fra USA, Tyskland, Nederlandene og Danmark samt den Demografisk Databas i Umeå. Standarden er anvendt i dataarkiver verden over, men har naturligvis fået nationale dialekter i de mere end to årtier, den har været i brug. Studiebeskrivelserne for de datamaterialer, der indgår i DDA’s beholdninger, holdes løbende opdateret. Hver måned opdateres DDA’s katalog på internettet (http://www.dda.dk/dk-cat.html) på basis af de ajourførte studiebeskrivelser. Søgekataloget giver DDA’s brugere mulighed for selv at afgøre, om DDA har materiale, der kan understøtte deres forskningsprojekt. De fleste henvendelser til DDA med ønske om udlevering af data er baseret på forudgående søgninger på internettet.

Efter studiebeskrivelsen og modtagelse og arkivering af datamaterialet er den næste store arbejdsopgave i DDA det, vi betegner som oparbejdning. Oparbejdningen tjener såvel bevaring som formidling. Ved oparbejdningen placeres data i en systemuafhængig fil, således at data ikke mere skal konverteres som følge af den teknologiske udvikling. Derudover samles og systematiseres informationen om data i en datadokumentationspublikation, DDP. Ved hjælp af DDP’en og passende programmel kan data læses og konverteres til de formater, som anvendes i forskningen. Under oparbejdningen gennemgås data og dokumentation nøje over for hinanden, således at de uoverensstemmelser, der uvægerligt er i virkelighedens verden, kan blive dokumenteret, så de ikke volder for mange bryderier, når data senere skal anvendes. Denne gennemgang har primært et formidlingssigte, medens omlægning af data og dokumentation til standardiserede formater er med til at sikre langtidsbevaringen af data på den måde, som på længere sigt er den mest økonomiske. DDA har i sin funktionsperiode færdigoparbejdet over tusind datamaterialer. Det er i international sammenligning et meget stort antal.

En stor mængde af data kommer til DDA i kraft af Kildeindtastningsprojektet. Det er et projekt, som har været koordineret af DDA siden 1994. Projektet har som langsigtet mål at skabe maskinlæsbare kildeudgaver af alle Danmarks folketællinger, kirkebøger mv. Indtastningen foretages af frivillige amatørhistorikere ude i landet, medens koordinering, arkivering, vejledning og formidling varetages af DDA. Data fra Kildeindtastningsprojektet indgår ikke i DDA’s internetkatalog, men distribueres separat over internet (http:\\ddd.sa.dk), CD-ROM og som enkeltmaterialer på disketter. Over internettet udleveres der omkring 25000 datamaterialer fra Kildeindtastningsprojektet om måneden.

Udlevering over internet ligger også i DDA’s udviklingsstrategier for resten af databeholdningerne. Her er DDA deltager i et EU-finansieret projekt ved navn NESSTAR. Dette projekt har som mål at skabe faciliteter for informationssøgning, dataanalyse, udtræk af data og udlevering af data. Altsammen brugerstyret fra brugerens egen maskine. Som en del af systemet er der en brugerkontrol, som sikrer, at adgangsbestemmelserne for datamaterialerne bliver overholdt. NESSTAR-systemet vil være en kørende realitet fra begyndelsen af år 2000. De interne testversioner er stort set færdige nu, som de bør være, et år inden de skal være helt færdige til alment brug.

DDA kan ved sin 25 års fødselsdag se tilbage på en funktionsperiode, som har været præget af gedigne resultater, skabt så vel i kraft af arkivets egne ressourcer som i samarbejde med andre fra indland og udland. Arkivet har været deltager i adskillige projekter af betydning for forskning, formidling og arkivering. DDA møder fremtiden med forventning om stadig at kunne være et aktivt element i den danske forskningsverden og den internationale dataarkivbevægelse. Vi ser med fortrøstning frem til stadig at udvikle vores arbejdsmetoder og ekspertise, så arkivet fortsat er på højde med situationen (og helst lidt mere) i en sektor med en hurtig udvikling.