Hur ska vi skörda data och skapa datadrivna organisationer? av Andrew Tutt- Wixner

Det är ingen hemlighet att data spelar en allt större roll i organisationers beslutsfattande och strategisk utveckling. Hypen rörande öppna data, big data och datadrivna organisationer har vuxit till lyriska proportioner – med goda anledningar. Datadrivna organisationer åtnjuter flera konkurrensfördelar, inklusive förbättrad effektivitet, ökad innovation och förmågan att snabbt anpassa sig till förändringar. Genom att effektivt utnyttja data kan organisationer identifiera, agera på trender och optimera processer. Denna artikel vill belysa en outnyttjad möjlighet som kvarstår i insamling av verksamhetsdata. 

Utnyttjande av data är dock ingen ny företeelse. Inom finans har värdet av data länge varit känt och har använts flitigt. Finansiella institutioner har investerat betydande resurser i att samla in, analysera och agera på data för att göra informerade beslut och maximera vinster. Denna strategi har möjliggjort snabba reaktioner på marknadsförändringar och identifiering av lönsamma möjligheter innan konkurrenterna. Under Brexit-omröstningen använde en del finansiella institutioner sentimentanalys för att förutspå hur marknaderna skulle reagera på olika utfall. Detta gjorde det möjligt för dem att positionera sina portföljer på ett sätt som minimerade risk och maximerade avkastning baserat på den sannolika marknadsreaktionen. Ett annat exempel är där banker och kreditinstitut använder dataanalys för att bedöma kreditvärdighet hos låntagare. Genom att analysera data som inkomster, skulder, betalningshistorik, kan de bättre förutsäga sannolikheten för att en låntagare kommer att kunna återbetala ett lån.  

Nya effektivare verktyg och metoder har dock demokratiserat analys av verksamhetsdata. Området har tillgängliggjorts för medarbetare utan avancerade tekniska färdigheter och dörren öppnats för nya typer av analyser. Den största och mest självklara förändringen här har varit AI:s inträde, en trend som har gjort att även ostrukturerade data har blivit mer värdefull. Utöver AI har dock andra betydelsefulla verktyg för dataanalys sett dagens ljus under de senaste åren vilka har revolutionerat sättet organisationer förstår och agerar på sin data. I spetsen finns Microsoft Power BI ₁ som har etablerat sig som ett populärt verktyg inom området och erbjuder både djupa insikter och en översikt på verksamhetens realtidsdata via dashboards.  

På metodsidan har innovationer inom exempelvis textanalys via natural language processing (NLP) möjliggjort analys som bygger på förståelse och tolkning av mänskligt språk i textform. Metoden möjliggör sentimentanalys, ämnesmodellering och automatisk textgenerering. Data mining vilket är processen att upptäcka mönster samt korrelationer inom stora datamängder genom att använda statistik och databehandlingstekniker har också haft stor betydelse. Både dessa metoder har också fått ett starkt uppsving särskilt i och med utvecklingen och utrullning av AI till allmänheten.  

Det har inom många verksamheter blivit alltmer självklar att tillgängliggöra stora datamängder som öppna data samt förvalta och publicera verksamhetsdata. I en typisk organisation kan det ofta förvaltas data rörande sjukfrånvaron, intäkter och utgifter. Trenden är dock lite extra stark när det gäller vidareförvaltning av geodata. Där finns det för det mesta en utstakad väg att gå och ett allmänt engagemang och acceptans för insamlingen samt krav som ställs på kvalité av verksamhetsdata. Det till och med finns en lag (Lag om den offentliga sektorns tillgängliggörande av data₂) som reglerar och uppmuntra publicering av dessa slags data.  

Det hanteras till vardags å andra sidan mycket verksamhetsdata som inte har samma omfattning och ibland inte heller samma dignitet som dessa stora datamängder. Där finns det inte en lika självklar väg framåt för insamling och förvaltning. Här kan vi kalla dessa mindre mängder data för mikrodatamängder. Mikrodatamängder kan till exempel utgöra en mindre del av en rapport, insamlade data från en enkät eller vara verksamhetsdata lagrad i ett system som vid en första anblick verkar sakna potential för vidareförädling och som potentiellt kan gallras. På många håll har det förmodligen inte funnits en strukturerad och enhetlig strategi för skörd och förvaltning av mikrodatamängder utan de har antingen gallrats efter ett antal år eller arkiverats. Troligtvis för att nyttorna inte ansetts vara uppenbar i förhållande till insatsen. Jag menar att denna typ av verksamhetsdata, trots sin mindre skala, kan innebära outnyttjade möjligheter. 

För att ge ett tydligt exempel från vardagen inom organisationer. När en rapport ska sammanställas över verksamhetsåret behöver man ofta lägga in verksamhetsdata eller statistik. Behöver man göra en jämförelse med året innan kommer de förmodligen att ta statistik från den senaste rapporten – vilket fungerar ju. Men vad händer om du behöver sammanställa statistik över längre perioder, säg tio år. Var lagras denna data? Eller kommer jag att behöva leta på flera olika ställen att hitta den verksamhetsdata och sen formatera om för att få till en sammanställning?  

Vi leker med tanken att denna rapport finns inom bibliotekens verksamhet. I Biblioteket finns det en räknare vid ingången sen tio år tillbaka. Varje år noteras hur många besökare det har varit under året och sedan nollställs mätaren. Antalet besökare publiceras i årets rapport från kulturförvaltningen där man konstatera att årets besökssiffra var 40 000 och förra året var 37 000. Det finns alltså mikrodatamängder här, årets och fjolårets besökssiffror. I samma rapport finns det också data om antal bibliotekslån per år som har tagits ut från bibliotekssystemet (som har bytts två gånger under tidsperioden). För att få till en bild av utvecklingen i dessa två områden under de tio år som har mätt få man förmodligen leta fram och sammanställa siffor från tio olika årsrapporter.  

Den största och mest självklara förändringen här har varit AI:s inträde, en trend som har gjort att även ostrukturerade data har blivit mer värdefull. 

I många organisationer gör personalavdelningen en årlig undersökning om personalens nöjdhet på jobbet. Verksamhetsdata per avdelning för året finns troligtvis i råformat och sammanställs i en årlig komprimerad rapport tillsammans med delar av de tidigare årens resultat för att ge perspektiv. Hur skulle det gå att hitta en denna data från tio år tillbaka? Om de lyckades hitta denna verksamhetsdata, hur lång tid skulle det ta att sammanställa denna den för att skapa en graf eller annan sammanställning? Förmodligen skulle letandet och formateringen innebär ett betydande insats.  

De stora vinsterna uppenbarar sig dock när vi slå ihop dessa två exempel. Tänk att verksamhetsutvecklaren vill göra en sambandsanalys utifrån faktorerna på antal besökare på biblioteket kontra antal lån kontra de anställda mående på jobbet. För att få fram underlaget för denna undersökning skulle alltså kräva att 20 rapporter letas fram och manuellt skördas på data. Denna verksamhetsdata behöver sedan formateras för att kunna göra en sambandsanalys vilket innebär är en betydande investering – om det ens går att hitta underlaget i första hand. Det är sedan inte ens säkert att det finns en samband mellan faktorerna! Tänk om verksamhetsdata hade samlats på samma ställe och formaterats i ett gemensamt format allt eftersom. Det skulle uppmuntra till fler analyser och fler nyttiga insikter för organisationen.     
 
En annan faktor som kan vara problematiskt för datadrivna organisationer är att organiserade verksamhetsdatasmängder lagras i olika format. Verksamhetsdata kan exempelvis lagras i olika tidsintervaller, på olika plattformar eller på andra sätt som inte är direkt jämförbara med andra datamängder. Att analysera sådana datamängder kan innebära att en formateringsinsats behöver göras innan datat är användbar. Detta kan leda till ineffektivitet eller förlorade insikter, vilket hindrar organisationers förmåga att reagera på förändringar och dra full nytta av den tillgänglig data. 

Hur ska detta göras? 

Även om idén om att skörda, organisera och förvalta mer verksamhetsdata låter lovande finns det en del hinder för införande. Främst innebär det en pedagogisk utmaning att få verksamheter att välja att lägga extra tid på att förvalta data som de har tagit fram. Att kunna sälja in ny arbetsuppgift bland alla andra arbetsuppgifter som läggs på allt eftersom är inte självklart. I många fall skulle förvaltningen innebära manuell hantering vilket en del skulle anse vara en tråkig arbetsuppgift – inte nödvändigtvis en stor arbetsinsats men kräver ändock en investering från berörda parter inom verksamheten. Det är troligtvis särskilt kämpigt tidigt i processen innan lösningen börja att bära frukt.  

Att få till en lösning där många olika sorters data kan förvaltas med förhoppning om interoperabilitet skulle också innebära en gedigen initial insats att ta fram en struktur samt regelverk för insamling och förvaltningen av data. Detta skulle också kräva engagemang från verksamheterna och från olika för att lösningen i så hög grad som möjligt ska vara grundad I verkligheten.   

För att adressera dessa problem behöver vi ta fram ett koncept kring insamling och förvaltning av ett statistikarkiv. Konceptet är relativt enkelt och välbekant i grunden. Att centralt lagra verksamhetsdata i ett standardiserat format för att möjliggöra effektiv återsökning och återanvändning har gjorts många gånger förut. Det som är nytt här är skördande och den enhetliga förvaltningen av mindre datamängder. Att förvalta och skapa struktur på information är som tur var precis vad vi arkivarier är bäst på. Det som är extra spännande är det faktum att det är ett gyllene tillfälle för arkivarier att lyfta fram sin kompetens och verksamhetsinformation som resurs inom sina organisationer. 



1. https://www.microsoft.com/sv-se/power-platform/products/power-bi?market=se 

2. https://www.riksdagen.se/sv/dokument-och-lagar/dokument/svensk-forfattningssamling/lag-2022818-om-den-offentliga-sektorns_sfs-2022-818/ 


Andrew Tutt- Wixner, e- tjänstutvecklare, Mora kommun 

Andrew är en e-arkivarie som brinner lite extra mycket för ETL och älskar den kreativa processen vare sig det är framför arbetsdatorn eller med hemmaprojekt.