Allt du någonsin velat veta om OAIS

Vi som har arbetat en hel del med myndigheter och e-arkiv vet att myndigheter gärna skriver ”ska följa OAIS-standard” i sina upphandlingskrav. Vad innebär egentligen OAIS, och hur kan kunskap därom hjälpa oss att säkerställa framtidens tillgång till dagens information?

Som verksamhetskonsult inom informationshantering och e-arkivering är mitt jobb att först och främst involvera användarna och beslutsfattarna vid etablerandet av ett OAIS-arkiv (d.v.s. ett arkiv som följer OAIS- modellen). Ett OAIS-arkiv består först och främst av rutiner, kunskap och regler vilka förvaltas av en OAIS-organisation. Först när grunden är på plats är det meningsfullt att kravställa och upphandla mjuk- och hårdvara till ett it-system. E-arkivet enligt OAIS-modellen är nämligen en organisation bestående av både människor och system. Min erfarenhet säger mig att myndigheter är lite rädda för ämnet och att de hoppas gå från ett KAOS-arkiv[1] till ett OAIS-arkiv enbart genom att införa en extern it-produkt.

Jag ska i denna artikel ge dig som läsare grundläggande kunskap om OAIS, med förhoppning att du sedan ska känna dig hyfsat bekväm med hela konceptet. Innehållet i artikeln är till stor del ett utdrag från eNorms utbildning[2] i ämnet – om du vill citera enstaka meningar går det bra så länge du anger eNorm som källa. Om du i stället vill veta mer om hur OAIS kan hjälpa just din organisation, om du vill använda texten, eller om du vill bli utbildad i ämnet kan du kontakta eNorm[3] eller ArkivIT. 

Varför OAIS är ett bra ramverk?

De komponenter som behövs för att bevara ett elektroniskt arkiv är identifierade och sammanställda i modellen Open Archive Information System (OAIS), ursprungligen 

utvecklad för datahantering åt NASA och numera en ISO-standard.[4] OAIS-modellen är ett konceptuellt ramverk bestående av en organisation av människor och system, vilka ansvarar för att tillgängliggöra bestämda arkivobjekt åt en specificerad grupp.

Vad betyder då detta? Jo, att ett OAIS-arkiv är betydligt mer än ett upphandlat eller hemmabyggt it-system – det måste finnas en organisation av människor vilka ska ansvara för att ta fram regler och rutiner för bevarande och åtkomst samt identifiera och känna dem som ska leverera till och nyttja arkivet. Och då vi pratar om bevarande menar vi för mycket lång tid framöver.

Vad har OAIS någonsin gjort för oss?

Med OAIS får vi en gemensam vokabulär och ett gemensamt ramverk. Vokabulären med entydiga begrepp gör att vi alla vet vad vi pratar om så att vi kan involvera inte bara arkivarier, utan även it-folk, finansiärer, slutanvändare, ledning etc. Vi kan jämföra olika tjänster och tekniska lösningar, och vi kan diskutera hur arkiv, teknik, slutanvändare och datamodeller förändras med tiden. Ramverket beskriver nödvändiga funktioner för intag, bevarande och tillgängliggörande av arkivobjekt, det beskriver arkitektur och processer, samt definierar delkomponenter inför etablering och förvaltning av e-arkivet.

OAIS ger oss goda förutsättningar att etablera och förvalta ett system för bevarande.

OAIS-arkivets verksamhetsområden

De flesta av oss har någon bild av vad OAIS-arkiv innebär, typ ”ett system för att bevara handlingar” eller ”ett etablerat koncept för färdiga e-arkivprodukter”. Men OAIS-modellen är mer specifik än så: Ett OAIS-arkiv har sex obligatoriska verksamhetsområden, vilka jag beskriver nedan.

1.     Enas kring och ta emot leveranser från producenter

Följande situation är lätt att föreställa sig för många arkivarier: Verksamheten kommer ner till arkivet med en stor och dammig låda innehållande videofilmer/floppydiskar/osorterade handlingar och lämnar in för arkivering. Arkivet tar emot leveransen och frågar sig lite uppgivet om det ens finns en floppydrive i huset. Situationen är upplagd för misslyckande: Verksamheten tycker att den har gjort sitt men kommer inte att kunna få åtkomst till arkivobjekten, arkivet är fast med arkivobjekt som varken kan bevaras eller tillgängliggöras, och ledningen undrar varför pengar, yta, personal och anseende går åt till saker som inte ger någon effekt.

Det som i stället görs i ett OAIS-arkiv är att OAIS-arkivet och producenten (den som skapar arkivobjekt) på förhand enas kring vad som ska tas emot, i vilket skick, och på vilket sätt. Till exempel bör arkivet neka att ta emot objekt som ska gallras, objekt som inte har nödvändiga uppgifter om härkomst eller bevarande, eller objekt som inte tillhör arkivets verksamhetsområde. OAIS-arkivet ska på förhand bestämma att arkivobjekt ska levereras i ett visst format enligt en viss datamodell, och kan neka att ta emot, eller ta ut en extra avgift för objekt som överlämnas på annat sätt.

2.     Möjliggöra bevarande av arkivobjekt genom att hantera metadata

En elektronisk handling är tämligen oanvändbar utan sitt metadata. I ett OAIS-arkiv måste metadata hanteras både vid intag och vid lagring. OAIS-arkivets mjukvara måste kunna identifiera, extrahera och omvandla metadata enligt beslutade regler, och mjukvaran behöver kunna lagra metadata i databasen och kunna koppla dettill både informationspaket och arkivobjekt.

Alla verksamheter ser olika ut, och arkivobjekt från olika producenter har olika typer av nödvändig metadata. En upphandlad e-arkivprodukt har ingen möjlighet att på eget bevåg bestämma vilket metadata och vilka omvandlingsregler som är gällande för en enskild verksamhet. Det är OAIS-arkivet som bestämmer vilket metadata som är nödvändigt för intagning och bevarande av arkivobjekt, beroende på OAIS-arkivets unika förutsättningar. En upphandlade myndighet som inte har koll på detta innan en upphandling av en e-arkivprodukt löper stor risk att arkivet är tvunget att begränsa sig till vad produkten erbjuder – inte vad arkivet faktiskt har behov av (och nej, FGS är inte lösningen[5]).

3.     Utse en representativ konsumentgrupp

Konsumenten är den som ska använda arkivet. OAIS-arkivet ansvarar för att tillhandahålla arkivobjekt till konsumenten, och måste därför identifiera konsumentgrupper och förstå hur dessa vill och kan använda arkivet. Typiska konsumentgrupper kan vara verksamheten själv (producenten), forskare, allmänhet och media. De olika grupperna har olika kunskapsbas och förutsättningar. Kanske behöver arkivobjekten lämnas ut tillsammans med pdf-läsare till allmänheten och media, medan forskare och verksamheten förväntas ha tekniska lösningar för att läsa arkivobjekten. OAIS-arkivet hanterar upphovsrätt, eventuell betalning eller krav på snabbhet för de olika konsumentgrupperna. Med tiden kommer konsumentgrupperna förändras, och nya tillkommer, men OAIS-arkivet följer aktivt upp de grupper som arkivet vänder sig till och vidtar nödvändiga åtgärder.

4.     Säkra att arkivobjekt är oberoende

Vi har nog alla hittat dokument som har tappat sitt sammanhang – ett vykort utan avsändare, en inköpslista i botten på en kundkorg, eller en barnteckning utan namn. Värdet på ett sådant dokument är avhängigt dess proveniens – om vi vet att det är det nu vuxna egna barnets teckning, inköpslistan till bröllopsfesten eller en hälsning från Kungen så betyder dokument mer än om vi inte vet det. Information om handlingen är väsentlig och måste finnas i direkt anslutning till handlingen för att den ska vara oberoende och därmed bära sitt eget värde. 

Ett OAIS-arkiv säkerställer att arkivobjekt är oberoende så att konsumenten alltid kan hämta, läsa och förstå dem. Nödvändiga filer och tekniska metadata måste lämnas ut tillsammans med arkivobjektet, och beskrivning och extrahering av sökord för arkivobjektet måste vara relevanta. Om en viss filtyp kräver en viss programvara bör denna erbjudas vid uttaget, och om en viss handling tillhör ett specifikt ärende bör kopplingen till ärendet framgå.

5.     Etablera rutiner för bevarande av objekt

En myndighets arkiv består av dess allmänna handlingar, där de som inte ska gallras ska bevaras. När vi pratar om att bevara handlingar menar vi inte att lagra dem för lång tid, utan att lagra dem för evigt. OAIS-arkivets reglemente förvaltar myndighetens bevarandestrategi. Denna är långsiktig och kommer att förvaltas vidare efter att vi går i pension och sedermera hädan. Bevarandestrategin är det övergripande regelverk som styr behov av personal, finanser, lokaler, teknik etc på både kort och lång sikt.

OAIS-arkivet tar fram rutiner för hur människor och system ska agera. Beskrivande rutiner för människor kan bestå av checklista vid överenskommelse med producent, rutiner för drift av hård- och mjukvara eller manuell kontroll av informationspaket. Automatiska regler för system kan vara program för intag av informationspaket, skript för migrering av arkivobjekt till ny media, kod för att definiera åtkomstregler, etc.

6.     Tillhandahålla objekt till konsument

OAIS-arkivet erbjuder en översikt över vad som finns i arkivet, exempelvis genom resultat av sökningar, register och sammanställningar. OAIS-arkivet paketerar arkivobjekt i tillgängliga uttagspaket tillsammans med nödvändiga verktyg för att begripa arkivobjektet, allt nödvändigt metadata, och såklart själva arkivobjektet. OAIS-arkivet erbjuder även åtkomst till arkivet, antingen genom en eller flera specifika plattformar, eller genom integrationer med befintliga verksamhetssystem.

OAIS funktionella modell

Många av oss har nog skådat OAIS funktionella modell, illustrerad av en ruta med objekt (med exotiska namn som access, preservation planning, ingest) och några objekt utanför (producer, manager, consumer). Objekten binds samman med streckade linjer, och med pilar och lite här och där finns glada tillrop i form av AIP, DIP och SIP. Ibland finns även FGS med som ett svävande spöke över modellen. Modellen gör ett försök att visa vilka komponenter som ingår i OAIS, vilka flöden som finns, och vilka relationer som finns mellan olika funktionsområden.

När vi har fått OAIS funktionella modell visad för oss så är den oftast kopierad direkt från litteraturen eftersom ingen riktigt orkar eller vågar tolka den och presentera den på ett praktiskt sätt. Är modellen lätt att förstå? Nej. Går den att göra begriplig? Ja. Nedan följer en beskrivning av OAIS praktiska modell, bearbetad av eNorm.

OAIS praktiska modell

OAIS praktiska modell är beskrivande och syftar till att på ett enkelt och överskådligt sätt stabilisera och konkretisera den önskade utformningen av arkivfunktionen, så att den kan ligga till grund för en handlingsplan och en bevarandestrategi.[6] Modellen är alltså inget flödesschema eller en it-arkitektur, utan den standardiserar och kommunicerar termer och funktioner för koncept, strategi och aktiviteter. Först när enighet kring detta råder går det att på allvar etablera ett OAIS-arkiv

Modellen består av själva OAIS-arkivet – vilket i sig innehåller två entiteter vilka behandlar rutiner, planering och regler, samt fyra entiteter vilka till största delen är hård- och mjukvara i en it-miljö. Modellen innehåller även tre externa funktioner, vilka inte är en del av själva OAIS-arkivet, men väl en del av OAIS-modellen.

1.     Ledning (management)

Ledningen ligger utanför själva OAIS-arkivet, och är den som äger, finansierar och organiserar arkivet. Ledningen fattar strategiska beslut om omfattning och strategi, säkrar budgeten på kort och lång sikt, och ser till att det finns personal och tekniska resurser på lång och kort sikt. Ledningen är ytterst ansvarig för arkivet. Hos en myndighet torde denna funktion innehas av myndighetschefen eller styrelsen.

2.     Producent (producer)

Producenten är inte en del av själva OAIS-arkivet, men en nyckelspelare i OAIS-modellen. Producenten skapar information och levererar den till OAIS-arkivet. Producenten ansvarar för att gallra, rensa och undanta metadata på de objekt som ska arkiveras, och ansvarar även för att leverera leveranspaket i enlighet med överenskommelser. Producenten ska även uppge sina behov för OAIS-arkivet och enas med förvaltningen kring leveranser. En myndighet med flera olika verksamheter har flera olika Producenter.

3.     Konsument

Konsumenten är inte en del av OAIS-arkivet, men däremot den som OAIS-arkivet finns till för. Konsumenten söker och sammanställer de tillgängliga objekten i OAIS-arkivet, och får också tillgång till arkivobjekt. Konsumenten ska också göra sina förkunskaper och behov kända för OAIS-arkivet, såsom behov av tekniska verktyg. Konsumenten är betydligt mer abstrakt än Producenten, vilket ställer stora krav på att OAIS-arkivet kan identifiera och analysera nuvarande och kommande konsumentgrupper.

4.     OAIS-reglemente (preservation planning)

OAIS-reglementet övervakar trender och förändringar i den egna verksamheten, i omvärlden och hos Konsumenter och Producenter. OAIS-reglementet får på så sätt underlag för att besluta om frågor som rör OAIS-arkivets rutiner, regler, teknik och migreringsplaner. I övergripande frågor som rör strategi, direktiv, resurser etc. tar OAIS-reglementet fram beslutsunderlag till Ledningen. OAIS-reglementet hos en myndighet kan bestå av en gruppering av olika roller ledd av ansvarig arkivarie eller motsvarande.

5.     OAIS-förvaltning (administration)

OAIS-förvaltningen ansvarar för att införa regler från OAIS-reglementet till OAIS-intag, OAIS-databashantering, OAIS-fillagring och OAIS-uttag. OAIS-förvaltningen samarbetar även med Producenter och Konsumenter vid överenskommelser samt vid intag och uttag. Hos en myndighet utgörs OAIS-förvaltningen sannolikt av en grupp innehållande både arkivarier och it. 

6.     OAIS-intag (ingest)

Detta är en teknisk funktion för att ta emot, validera och utöka metadata enligt fastställt regelverk (från OAIS-reglementet), och som kan skapa informationspaket i databas och på fillagring. En mottagning utan regelverk från organisationens OAIS-reglemente är alltså inte en del av OAIS-arkiv utan bara en it-produkt vilken riskerar begränsa arkivet. En mottagning som dessutom korrigerar felaktiga leveranser (pre-ingest) är inget annat än en ökad kostnad och tillkommande komplikation för OAIS-arkivet för en funktion som faktiskt ligger utanför OAIS-arkivets uppdrag.

7.     OAIS-databashantering (data management)

OAIS-databashantering är en teknisk funktion i form av ett kraftfullt databasprogram. Programmet ska hantera metadata och databasen med tabeller och uppdateringar. Det ska skapa förfrågningar, hantera kopplingar till OAIS-fillagring samt generera rapporter och sökträffar. Vilken databas som helst kan utgöra en OAIS-databashantering om den appliceras i rätt sammanhang.

8.     OAIS-uttag (access)

OAIS-uttag är en teknisk funktion för att dels hantera förfrågningar om vad som finns i OAIS-arkivet, dels paketera och lämna ut den efterfrågade informationen. Både sökbarhet, presentation och uttag styrs genom regler från OAIS-reglementet. Olika typer av Konsumenter och olika typer av arkivobjekt har olika regler, och dessa måste naturligtvis definieras.

9.     OAIS-fillagring (archive storage)

OAIS-fillagring utgörs av hård- och mjukvara som kan lagra filer på ett säkert sätt, inklusive konvertera arkivobjekt till nya format, uppdatera mjuk- och hårdvara, samt drifta och övervaka systemet. Vilken lämplig hård- och mjukvara som helst kan utgöra OAIS-fillagringen. Många proprietära e-arkivprodukter levereras utan själva lagringsytan. Myndigheten får då själv sätta upp säkra miljöer eller köpa dessa separat.

Informationspaket i OAIS

Nu när vi har god koll på vilka funktioner som finns i ett OAIS-arkiv, är det dags att titta på teknikaliteterna. Hur ska våra handlingar och register förflyttas från verksamhet till arkiv till utlämnande?

Ett objekt som ska arkiveras kallas ett arkivobjekt. Detta beslår av själva innehållet (filer eller data) samt teknisk metadata. Till detta kopplas arkivmetadata i xml-format vilken beskriver åtkomst, kopplingar, identitet, autencitet och historik. Slutligen kopplas beskrivande metadata såsom söktermer och visningstermer i ett så kallat index. Hela konkarongen samlas i ett så kallat informationspaket, tillsammans med information om paketet. Informationspaket som innehåller arkivobjekt som tas emot av arkivet kallas Submission Information Package (SIP), det som innehåller arkivobjekt som packats om för att lagras i arkivet kallas Archive Information Package (AIP), och det informationspaket som lämnas ut kallas Dissemination Information Package (DIP).

Informationspaken kan innehålla ett eller fler informationsobjekt. I en SIP finns typiskt sett arkivobjekt såsom alla ärenden och många handlingar från en viss tidsperiod och ett visst it-system, och  metadata, åtminstone för identifiering. I en AIP finns vanligen arkivobjekt som har liknande krav på lagring, det vill säga samma format, hårdvara och åtkomstregler, tillsammans med påförd metadata för lagring och uttag, återsökning och presentation. I en DIP finns vanligen det eller de arkivobjekt som efterfrågas tillsammans med nödvändig metadata för att kunna läsa arkivobjektet.

Vad som ska ingå i ett informationspaket beror på unika omständigheter såsom typ av källsystem, vilka lagringsytor som används och vilka konsumenter som ska använda e-arkivet. Regler för informationspaketen sätts upp av OAIS-arkivets reglemente och producenten respektive konsumenten i form av leverans- och uttagsöverenskommelse. Överenskommelsen reglerar vid vilken tidpunkt en SIP ska levereras, enligt vilket dataschema och hur validering ska ske. För en DIP regleras vad som startar ett uttag, vilken information som måste följa med, och information om begränsningar av tillgänglighet till arkivobjektet (exempelvis upphovsrätt, avgift, sekretess).

Sammanfattning – vem är det som kör egentligen?

När vi nu vet vad ett OAIS-arkiv faktiskt består av kan vi omgruppera och ta ett nytt grepp på införandet av OAIS-arkiv. Finns det strategiska planer för bevarande som säkrar de ekonomiska, tekniska och personella resurserna nu och framöver? Förstår ledningen sitt ansvar som ägare och möjliggörare av arkivet? Vet arkivets producenter vad som får levereras, när det ska ske och i vilket skick? Vet vi ens vilka som är arkivets producenter? Vet vi vem som ska använda arkivet och hur vi måste tillhandahålla objekten? Har vi datamodeller, regler för åtkomst och specifikationer över nödvändigt metadata (och icke-tillåtet metadata)? Hur ser it-arkitekturen ut, och har vi möjlighet till säker fillagring i stora mängder? Först när detta är säkerställt är det meningsfullt att gå ut i upphandling. Vi har alla sett det: kunskap först – affär sedan.

[1] KAOS-arkiv är ett arkiv som genom att inte vara kontrollerat eller följa fastställda krav befinner sig i kaos. Ett KAOS-arkiv är med andra ord raka motsatsen till ett OAIS-arkiv. Konceptet är lånat från eNorm.

[2] Swedish eNorm Software AB, www.e-norm.se: Grundutbildning OAIS.

[3] www.e-norm.se; info@e-norm.se; malin.sundin@e-norm.se 

[4] NASA: Consultative Committee for Space Data Systems (CCSDS). Finns som ISO 14721:2012 (kostar pengar) eller som Magenta Book (gratis).

[5] FGS är ett frivilligt utbytesformat för leveranser mellan it-system bestående av paketstruktur och metadataspecifikation. Då organisationens förutsättningar är unika och det inte finns gemensamma e-arkivprodukter riskerar FGS:er skapa onödiga och kostsamma extra steg för myndigheten som måste mappa datan vid flera tillfällen – källsystem till FGS till intag till FGS till lagring till FGS till uttag i stället för källsystem till intag till lagring till uttag.

[6] Den intresserade kan läsa mer om modeller


Namn: Malin Sundin 

Arbetsplats: Swedish eNorm Software AB med olika uppdrag bland annat via ArkivIT 

Roll: Projektledare, kravhanterare, produktutvecklare