Så kan man mäta datakvalitet – en konkret metod i praktiken

Denna artikel är en del av en artikelserie om en färdplan för strategisk datahantering i en kommun. Klicka här för att komma tillbaka till huvudartikeln. För att komma till de andra artiklarna i färdplanen klicka på ikonerna i bilden nedan.
Datakvalitet
Data ligger till grund för många verksamheter, digitala tjänster och affärsmodeller. Oavsett sammanhang är kvaliteten på data – och den metadata som beskriver den – avgörande för att data ska kunna användas på ett effektivt och tillförlitligt sätt.
Data av låg kvalitet leder ofta till fördyringar och ineffektivitet: arbetsmoment behöver göras om, tillfälliga lösningar (workarounds) implementeras för att kompensera för brister, och organisationens effektivitet påverkas negativt. Dessutom kan låg kvalitet ge upphov till frustration hos medarbetare och användare, bidra till sämre beslutsunderlag och i värsta fall göra datamängden oanvändbar för sitt ursprungliga syfte.
Vad är god datakvalitet?
Datakvalitet kan definieras som hur väl en datamängd lämpar sig för sitt avsedda syfte – exempelvis inom förvaltning, planering eller beslutsfattande. Vad som uppfattas som "god kvalitet" varierar dock beroende på användningsområde, datans struktur, innehåll och användarnas kunskap. Det innebär att kvalitetsbedömning behöver utgå från flera olika perspektiv och kriterier.
Mätning som grund för förbättring
För att kunna förbättra datakvalitet behöver man först mäta den. Utan ett nuläge är det omöjligt att avgöra vilka insatser som krävs – eller om redan genomförda förbättringar har haft effekt.
Projektet Connected Urban Twins (CUT) har därför utvecklat ett praktiskt ramverk och en Excelbaserad mätmetod för att stödja kommuner och andra offentliga aktörer i detta arbete. Mallen är utformad för att vara tillgänglig utan avancerade verktyg eller djup teknisk kompetens. Den är även anpassad för att kunna användas direkt i verksamheten, med syfte att skapa samsyn och öka den interna förståelsen för vad datakvalitet innebär.
13 kriterier för mätning
Excelmallen bygger på 13 kriterier som tillsammans ger en nyanserad bild av datakvalitet. Varje kriterium bedöms enligt en fyrgradig skala, vilket ger utrymme för att dokumentera både styrkor och förbättringsområden:
- Aktualitet – Hur uppdaterad är informationen?
- Enhetlighet – Förekommer informationen i samma format och struktur överallt?
- Noggrannhet – Hur exakt är datan i förhållande till verkligheten?
- Konform till standard – Följer datan vedertagna standarder?
- Konsistens – Förekommer motstridiga uppgifter i samma datamängd?
- Korrekthet/felfrihet – Innehåller datan sakfel eller tekniska fel?
- Redundansfrihet – Finns onödiga upprepningar?
- Relevans – Är informationen relevant för de aktuella användningsområdena?
- Spårbarhet – Går det att följa datans ursprung och förändringshistorik?
- Begriplighet – Är informationen tydlig och begriplig för målgruppen?
- Fullständighet – Saknas uppgifter som borde finnas?
Så används mätmallen i praktiken

Mallen är uppbyggd för att dokumentera både resultatet av mätningen och kommentarer som förklarar poängen, vilket bidrar till transparens och lärande. Den ger även möjlighet att dokumentera åtgärder som kan förbättra kvaliteten, vilket gör den till ett verktyg för både nulägesanalys och uppföljning.
Varje kriterium poängsätts med hjälp av en enkel bedömningsskala från 1 till 4, där 1 innebär "mycket låg kvalitet" och 4 står för "mycket hög kvalitet". Bedömningen görs av personer med insyn i datamängdens innehåll och användning, ofta genom diskussioner mellan verksamhetsrepresentanter, systemförvaltare och dataansvariga.
Fliken Kriterier för datakvalitet listar definitionerna på de olika kvalitetsaspekterna och ger praktiska exempel. Fliken innehåller även information om hur granskningen eventuellt kan automatiseras.
Fliken Checklista datamängd är hjärtat i själva bedömningen och dokumenterar själva kvalitetsmätningen av datamängden.
Fliken Checklista attribut innehåller dokumentationen av datakvalitetsbedömningen för datamängdens attribut.
Rekommendation
Att dokumentera mätning av datakvalitet i excelfiler kan fungera så länge man bara har ett fåtal datamängder att förvalta. Vi rekommenderar dock att bygga in dokumentationen av datakvalitet i en metadatakatalog för att inte drunkna i excelfiler.
Nyttiga länkar:
- CUT Excel-mall för att mäta datakvalitet (svenska) >>
- Hur kan man mäta datakvalitet Datahantering - Sveriges Dataportal
- Open data & Metadata quality EU Open data support
- Handledning för datakvalitet - Svenska institutet för standarder, SIS
- Kommande ISO standard ISO 19157-3
Resultat:
- Status-quo mätning av datamängdernas kvalitet som utgångsläge för kvalitetshöjande åtgärder
TAGG: Koppling till Svenskt ramverk för digital samverkan: