Varför all denna standardisering?

Standardisering handlar om att komma fram till gemensamma sätt att lösa utmaningar. En av de stora utmaningarna för oss idag är att både kunna hitta information och veta om det går att lita på den. Gemensamma format för att beskriva och överföra data är en central del i infrastrukturen för ett säkert informationsutbyte.

Ännu idag kan vi tolka och läsa runstenar som är spridda överallt i det svenska landskapet, även om de är tusen år gamla. Till vår hjälp har vi appar och tjänster som talar om geografisk plats och hjälper till med tolkning. För att kunna bevara den information vi skapar idag behöver den märkas upp på ett sätt som är förståeligt för alla. Genom märkningen kan informationen bevaras oavsett hur vi sprider ut våra digitala runstenar i form av informationspaket. För att märkningen ska vara förståelig för alla behövs standardisering.

Arbetet med standardisering inom informationsområdet sker på många olika nivåer och i olika kontexter. Lokalt och regionalt sker arbete för att möta de behov som uppkommer och praktiskt lösa informationsöverföringen i verksamheten. Ett exempel på det nationella planet är Riksarkivets funktion för FörvaltningsGemensamma Specifikationer, (FGS), som för tillfället är vilande. Ett annat exempel är de satsningar som Myndigheten för digital förvaltning (DIGG) leder mot endigital infrastruktur för informationsutbyte. Det finns flera olika satsningar på europanivå. Ett exempel är byggnadsblocket för e-arkivering (eArchiving Building Block) som specificerar användning av standarder. Ett annat exempel är Inspire som är ett EU-direktiv med regelverk och informationsformat för geodata.

Standardisering handlar i grunden om att komma överens. Det kan som bekant vara lättare sagt än gjort.

På internationell nivå bedrivs standardiseringsarbete dels hos standardiseringsorgan som International Organization for Standardization ISO. Dels sker arbetet i styrelser som hanterar specifika informationsformat vilka kan ses som de-facto standarder inom ett område. Här fokuserar vi framför allt på dessa styrelser och tekniska kommittéer.

Cykler för revidering

I alla grupper pågår kontinuerligt arbete som kommer oss som användare till del i form av nya eller uppdaterade standarder och specifikationer. Allt arbete går i cykler eftersom man inte vill släppa nya versioner allt för ofta. Det beror på att användare, leverantörer av olika tjänster och de som utvecklar programvaror behöver tid för att anpassa sina lösningar.

Arbetet med att genomföra uppdateringar eller ta fram nya standarder, specifikationer eller vägledningar tar tid. Grupperna låter oss som användare vara med och tycka till. Standardisering handlar i grunden om att komma överens. Det kan som bekant vara lättare sagt än gjort. Arbetet i alla grupper fortsätter och revisionscyklerna rullar på. Det är viktigt med transparens och öppenhet för att stödja långsiktigt digitalt bevarande. Ingen av standarderna får vara inom lås och bom!

Under hösten 2021 är det mycket som sker både i form av nya specifikationer och uppdaterade standarder.

Påverka tillsammans!

Det kan vara ett tungt arbete att gå igenom remisser och ge svar. En av nycklarna är att vara med i en organisation som till exempel Open Preservation Foundation (OPF) där medlemmarna tillsammans kan ta fram synpunkter att skicka in och vara fler som delar på arbetet. Vi på Kommunalförbundet Sydarkivera försöker besvara remisser tillsammans med våra förbundsmedlemmar. Vi har samtidigt valt att gå med i OPF för att vara en del i en större samverkan.

Arkivinformation                                                                                                       

Technical Subcomittee on Encoded Archvial Standards (TS EAS) hanterar formaten för arkivens sökverktyg. TS EAS arbetar med XML som grundspråk. Grundstandarderna kommer från International Council on Archives (ICA).

Utbytesformatet för arkivförteckningen kallas Encoded Archival Description (EAD) och innehåller all den information som gör att man kan söka bland arkivens serier och volymer.  Utbytesformatet för arkivbildaren kallas Encoded Archival Context-Corporate bodies, Persons and Families (EAC-CPF).

TS EAS är i slutfasen av en större uppdatering av EAC-CPF till version 2. Bland nyheterna finns en anpassning som innebär att samma elementnamn i både EAD och EAC-CPF betyder samma sak och gör samma sak. Den nya versionen stödjer ett bättre sätt att hantera och beskriva relationer till andra arkivbildare eller resurser som en arkivförteckning. Den största nyheten är en Best Practice Guide (BPG) som ger mer beskrivning i form av text och exempel som visar hur del element används. Allt för att underlätta för oss som användare.

Samtidigt har TS EAS inlett revidering av EAD som i sin tur hänsyn till kommentarer och ändringar i EAC-CPF. Det kommer att komma en BPG även för EAD.

Har du hört talas om RiC? Under ett antal år har arbete pågått inom ICA:s expertgrupp Expert Group on Archival Description (EGAD). Arbetet går ut på att slå samman de tidigare arkivstandarderna till Records in Context (RiC). RiC är en konceptuell modell som stödjs av en ontologi. Målsättningen är att det ska fungera att publicera arkivinformation som länkad data. Det vill säga ett strukturerat sätt att tillgängliggöra data med kopplingar mellan informationsobjekt från flera källor. Deras arbete släpps troligen under senhösten 2021.

TS EAS planerar att titta på den konceptuella modellen när den är klar och ta ställning till hur den påverkar formaten. Det kommer att ta tid innan alla system och tjänster kan hantera RiC med tillhörande ontologi. Både förteckningssystemen och tjänsterna för att publicera arkivinformation behöver anpassas för att stödja länkad data. De nuvarande formaten inom TS EAS kommer fortsätta vara viktiga nyckelstandarder även framöver. 

Bevarandeinformation

PREMIS, PREservation Metadata Implementation Stratigies, är en de-facto standard för bevarandemetadata. Den redaktionella kommittén, PREMIS Editorial Committee (PREMIS EC), arbetar just nu med beskrivning av rättigheter. Det är en av nyckeldelarna i standarden. Sättet att beskriva rättigheter har vidareutvecklats och stämmer inte längre överens med PREMIS struktur. Kommittén har valt att gå igenom hur rättigheter beskrivs för att se hur en vidareutveckling skulle kunna se ut. Man kommer att vända sig till användarna för att få återkoppling. 

Verktygen vi använder kan hjälpa till att skapa bevarandeinformation. Organisationer som OPF spelar en viktig roll genom att tillhandahålla verktyg som till exempel VeraPDF. Vid kontroll av en PDF-fil ger verktyget en resultatfil som kan sparas i PREMIS som bevarandemetadata. Informationen hjälper till att säkerställa autenticiteten på filen över tid.

Paketstruktur

Metadata Encoding & Transmission Standard Editorial Board (METS Editorial Board) är styrelsen som hanterar den standard som just nu används mest för att beskriva informationspaket. När det gäller METS sker arbetet för tillfället mest i bakgrunden. Det finns en planering för att uppdatera hemsidan och förberedelser är igång för att kunna ta fram en nästa version.

DILCIS Board

Specifikationsarbetet för det europeiska byggnadsblocket för e-arkivering leds av DILCIS Board, the Digital Information LifeCycle Interoperability Standards Board. DILCIS Board tog emot utkast till specifikationer för informationspaket från projektet E-ARK som avslutades 2016. Arbetet fortsattes av E-ARK4all och 2018 startade det europeiska byggnadsblocket för e-arkivering. Under åren 2019–2021 har projektet E-ARK3 producerat specifikationer och olika verktyg till byggnadsblocket.

Arbetet som DILCIS Board genomför är viktigt att hålla ögonen på. Just nu är det den enda gruppering som praktiskt visar hur vi gemensamt ska använda de standarder som finns för att kunna flytta information och skapa informationspaket. Allt för att vi inte ska behöva uppfinna hjulet på nytt utan i stället återanvända samma specifikationer. Det gör att vi också kan använda samma verktyg för att kontrollera att specifikationerna följs. Sydarkivera har valt att delta aktivt med resurser i E-ARK3 och DILCIS Board. Implementationen av specifikationer och verktyg pågår i interna projekt.

CSIP för informationspaketen

Fokus under byggnadsblockets första tid var att beskriva informationspaketen. Specifikationerna behövde bli klara för att kunna bygga valideringsverktyg. Valideringen gör det möjligt att kontrollera om ett informationspaket följer specifikationen. Valideringsverktyget finns tillgängligt både som en webbsida och som kod som går att återanvända.

CITS för innehållet

Under de senaste två åren har arbetet med specifikationer avancerat. I slutet av september 2021 publicerades nya Content Information Type Specification (CITS) som beskriver innehållet i ett informationspaket. Detta sker antingen genom att specificera innehållets element eller helt enkelt hur information struktureras i ett informationspaket.

Vid publiceringen släpptes även ett antal vägledningar till procedurer som beskriver hur man tar fram, reviderar eller remisshanterar en specifikation. Detta stödjer arbetet med att ta fram specifikationer. Vägledningarna beskriva exakt hur varje specifikation ska vara utformad. Det är i hög grad beroende av den typ av information som ska hanteras och hur de standarder som används fungerar.

Återanvänd mera 

Om det redan finns en specifikation som används behöver man inte ta fram en ny. Det bästa är att helt enkelt använda en befintlig specifikation för den aktuella typen av information. Inom DILCIS Board beskriver en av de vägledningar hur det går till att få en befintlig specifikation godkänd som en CITS. Dessa godkännanden är viktiga för att snabbt få fram specifikationer som redan används och inte börja om från början.

Ett exempel är den CITS som finns för arkivinformation. Den pekar på att man ska använda antingen nationella profiler av EAD och EAC-CPF eller någon av specifikationerna som redan används för gemensamma tjänster. Tänk FGS Arkivredovisning i dess båda former och de profiler som Archives Portal Europé har tagit fram. De senare finns implementerade i många av de verktyg som används över hela Europa.

Att implementera

Praktiskt handlar det i många fall om att man behöver mappar informationen i sin databas mot de beskrivna fälten som finns i en specifikation för att sedan skapa en export som är lätt för andra att förstå och tolka. Ett arbete som man kan göra själv eller med hjälp av någon annan, till exempel en systemleverantör. Allt beroende på vilka kompetenser och resurser som finns att tillgå. På sikt ser vi fram mot färdigbyggda exporter som följer de tillgängliga specifikationerna från alla de på marknaden förekommande programvarorna.

I andra fall handlar det om att man använder ett specialverktyg som till exempel DataBase Preservation ToolKit (DBPTK) som använder standarden SIARD för att exportera valfri relationsdatabas. Detta är en av de standarder vi på Sydarkivera använder oss mest av för tillfället.

Exporten eller uttaget, oavsett hur det kom till, paketeras med hjälp av ett paketeringsverktyg. Resultatet blir till slut ett informationspaket som följer byggnadsblockets specifikationer.

Hur kan jag vara med och påverka?

En av de viktigaste sakerna är att ha med dessa grupper i sin omvärldsbevakning. Bevaka webbplatserna eller prenumerera på nyhetsbrev så ser du när det händer saker! Deltagande kan ske på många olika sätt. Ett sätt är att vara medlem. Alla grupperna meddelar när det finns lediga platser och intresserade kan skicka in en ansökan om att bli styrelsemedlem. Det bästa sättet att bidra är att använda formaten, ge kommentarer och svara på remisser. 

Alla grupper arbetar med öppna remisser där vi som användare får vara med och ge vår syn på hur det fungerar och tycka till om nyheter.

När det inte är remisser ute kan man som användare fortfarande behöva skicka synpunkter och kommentarer. Tänk på att mer och mer av kommunikation och rapportering av fel eller problem med en standard sker med hjälp av GitHub. Ett tips är att skaffa ett konto på GitHub och utöka dina kunskaper med GitHub knowhow. På så sätt kan du som användare enklare hänga med och lämna synpunkter.


Namn : Karin Bredenberg 

Roll/yrke : Metadatastrateg 

Arbetsplats : Kommunalförbundet Sydarkivera 

Presentation: Karin Bredenberg har en lång erfarenhet av arbete med standarder inom området digitalt bevarande och leder flera internationella arbetsgrupper såsom TS EAS, PREMIS EC och DILCIS Board. Just nu färdigställs flera specifikationer inom E-ARK där Karin är med och leder och deltar i arbetet. Vid sidan av arbetet utforskar Karin just ni de olika sömmarna som kan användas på en symaskin för att skapa en egen garderob.