Tilbakeført fra kommune til prestegjeld

Folketellingen per 31.12.1865 ble gjennomført og ordnet prestegjeldsvis både i byene og på landet, men både Teleslekt og RHD (Registreringsenheten for Historiske Data) forsøkte å transkribere tellingen kommunevis, bl.a. for å gjøre den direkte sammenlignbar med den kommuneinndelte 1900-tellingen. I 1999 ble prestegjeldsinndelingen av 1865-tellingen langt på vei gjeninnført i Digitalarkivet, men kommunefilene fra RHD ble ikke slått sammen til prestegjeld ved utleggingen i 2000. I versjon 2 er nå kildens prestegjeldsinndeling gjennomført så langt det lar seg gjøre. 13 kommunefiler er blitt slått sammen med andre til prestegjeldsfiler, mens to byer er blitt splittet opp i til sammen 5 prestegjeldsfiler. Antallet filer er dermed blitt redusert fra 443 til 433. 

 To unntak  fra ren prestegjeldsinndeling er verdt å merke seg:

  • Det ble benyttet ulike skjemaer til tellingen i byene og på landet, hvilket medfører noe ulik struktur i datafilene for by og land. Derfor må prestegjeld som inneholder et bysokn og ett eller flere landsokn, deles opp i to filer, hvilket tilsvarer to ”kilder” i Digitalarkivet - Moss prestegjeld er f.eks. delt opp i Moss by og Moss landsokn (Jeløya).
  • Tellingen for de fire største byene Kristiania, Bergen, Trondheim og Stavanger er delt inn i hhv. 5, 4, 3 og 2 menigheter i originalmaterialet, men vi har vurdert det som uhensiktsmessig å opprette en fil/kilde for hver menighet, siden navnene på og grensene mellom menighetene ofte er ukjente for brukerne. Vi har derfor beholdt de fire byfilene, men Årstad og de to landsoknene i Bergen er ført på landskjemaer og derfor skilt ut som egne filer. Av andre grunner er Carljohansværns Garnisonsmenighet og et av bysoknene i Borre prestegjeld slått sammen til byfilen Horten, mens Drammen er delt opp i sine to godt kjente prestegjeld Bragernes og Strømsø.

Standard struktur for alle data

Som et resultat av et større kvalitetsfremmende arbeid med folketellingsdataene, utført ved Riksarkivet, er alle datafilene blitt konvertert til det såkalte utvekslingsformatet i Histform-standarden . Dette innebærer strukturell standardisering av dataene  i egne poster for tellingskrets  (skoledistrikter på landet), bosted  (gård/bruk/plass på landet og gård/hus i byene), person  og jordbruksopplysninger , noe som muliggjør like datavisninger i det nye Digitalarkivet for alle folketellingene. Enkelte dataverdier blir også standardisert i form  under konverteringen, men det er viktig at informasjonsinnholdet  ikke endres.

I versjon 2 av 1865-tellingen er det nå:

  • beregnet fødselsår på grunnlag av den oppgitte alderen i tellingen
  • fjernet farsnavnsforkortelser. Farsnavn som er forkortet til f.eks. Pauls. og Jensd. ved transkriberingen, er nå ekspandert til hhv. Paulsen og Jensdatter
  • antatt etternavn på barn og hustru. Barn uten oppgitt etternavn er blitt påført farsnavn eller slektsnavn markert med en *. På samme måte er gifte kvinner påført mannens slektsnavn med * dersom de selv kun er oppført med pikenavn (”fød Meyer” etc.).

Alle disse endringene vil bidra til økt gjenfinnbarhet for personer ved søking i nye Digitalarkivet. Det er bestemt at også beregnede fødselsår skal markeres med en * o.a. i Digitalarkivet, men denne markeringen er ennå ikke på plass.

Transkriberingsfeil rettet

Kontrollarbeidet utført i Riksarkivet omfatter gransking av frekvenslister over alle verdier i alle felt i alle filene. Ved å sjekke usannsynlige verdier mot originalkilden er tusenvis av transkriberingsfeil blitt avdekket og korrigert:

  • skrivefeil i personnavn, gårdsnavn og fødested
  • feilføringer for kjønn
  • feil bruk av spesialsymbolene definert i Histform-standarden (!!, ?? ,@, %, *)

Kontrollarbeidet omfatter også kjøring av et spesialutviklet testprogram mot hver datafil. I dette dataprogrammet blir samsvar mellom dataverdier i samme post (f.eks. person) og mellom naboposter (f.eks. bosted – person eller person – person) testet, og det teller opp antall personer innenfor hver husstand, bosted, krets og prestegjeld. Samsvarstestingen avdekker ”umulige” kombinasjoner av dataverdier, f.eks. aldersforskjell på 10 eller 50 år mellom mor og barn, samt mangler/feil i de transkriberte listenumrene og de maskingenererte bosteds- (land) og personnumrene. Opptellingene har avdekket et utall av dublettposter og uteglemte personer ved transkriberingen. De sistnevnte er nå ettertranskribert på grunnlag av originalkilden.

Videre korrigeringsarbeid

Filene registrert ved RHD og Statsarkivet i Bergen har ikke gjennomgått korrigeringen mht antatt etternavn på barn og hustru, samt kontrollarbeidet gjennomført med frekvenslister. Dette arbeidet pågår per mai 2012. Resultatet vil bli lagt ut som versjon 3 av folketellingen 1865.

Før versjon 3 av 1865-tellingen ferdigstilles, skal også alle innkomne korrekturmeldinger fra Digitalarkivets brukere gjennomgås. Mulige feiltranskriberinger sjekkes mot den originale kilden, og transkriberingsfeil korrigeres. Dette gjenstår for alle de 433 filene, men er i gang per mai 2012.

I arbeidet med tilretteleggingen av versjon 2 av 1865-tellingen (og flere andre tellinger) for Digitalarkivet har vi mottatt stor og viktig hjelp fra RHD. Dette både i form av datafiler som RHD har rettighetene til, og i form av ”grovkonvertering” av filer til Histforms utvekslingsformat, utført av deres IT-konsulent Trygve Andersen. Vi setter stor pris på dette gode samarbeidet.

Permanente IDer og nettadresser

Fra og med versjon 2 av 1865-tellingen kan alle IDer knyttet til personer, bosteder osv. i denne betraktes som permanente. For eksempel vil IDen pf01038011000809  for alltid være knyttet til personposten til Fridtjof Nansen i 1865-tellingen. Videre vil URLen http://digitalarkivet.arkivverket.no/ft/person/pf01038011000809  i overskuelig fremtid føre til en side i Digitalarkivet der denne tellingens opplysninger om Nansen og hans nærmeste familie og omgivelser vises frem.