Informationsarkitektens bokhylla – del 11: Arbetssätt och terminologi för data management

Finns det någon standard att hålla sig till då det gäller data management? Nej, men DAMA – DMBOK2 innehåller en genomtänkt och komplett översikt av arbetssätt och terminologi för data management-området som helhet. Boken hjälper oss att strukturera området, ge några allmänna begrepp och principer samt vägledning för vidare läsning

/Peter Tallungs, IRM 2023-09-21.

Finns det en standard för arbetssätt och begrepp inom data management?

Jag får ofta frågor om det finns någon standard att hålla sig till då det gäller data management.
Man vill kunna definiera roller, arbetssätt och begrepp inom området. Mitt svar blir då alltid ett nej. Det finns visserligen mycket skrivet, till exempel de böcker jag rekommenderat i denna artikelserie, men inget av detta är en etablerad standard. Området är under mognad och därmed i rörelse. Vi håller på att uppfinna det vi behöver och hur vi bäst går till väga. Då kan vi inte slå fast vad och hur, det skulle hämma områdets utveckling.

Vad vi kan göra är att ta del av andras erfarenheter och inspireras till egna dåd. Men det är något helt annat än att tillämpa en färdig standard.

Men finns det då någonstans en samlad erfarenhet från branschen? Något vi i kan utgå från, ta spjärn mot? Ja det finns det, vi har ju DAMA – DMBOK2.

DAMA – DMBOK2

DAMA står för Data Management Association och är en global ideell och oberoende organisation med uppgift att utveckla begrepp och arbetssätt för informations- och datahantering. DAMAs medlemmar är individer verksamma inom området. DAMA är i grunden en amerikansk organisation som startades 1980 i Los Angeles. Den har en internationell gren som kallas DAMA International, med avdelningar runt om i världen.

DAMA har samlat vad de kallar för Best Practices och förslag till en gemensam begreppsapparat. Detta finns publicerat i en skrift som heter DAMA – DMBOK, där DMBOK står för Data Management Body of Knowleedge, och som sedan 2017 finns i sin andra upplaga DMBOK2.

Boken har 17 kapitel som vart och ett behandlar en del-disciplin, (eller kunskapsområde, som man kallar det ) inom hela det stora Data Management-området. Några kapitel vill man dock inte se som en egen del-disciplin utan mera som en aspekt som skär tvärsöver hela området.

DMBOK är som helhet en komittéprodukt. Varje kapitel har en eller flera huvudförfattare. Varje kapitel har en omfattande lista med rekommendationer om vidare läsning, och är på så sätt en vägledning till hur man kan fördjupa sig.

Bokens innehåll

Chapter 1: Data Management (31sidor)

Detta första kapitel definierar några grundläggande begrepp och principer.
Jag är glad över att man här tar avstånd från den strikta åtskillnaden mellan begreppen data och information. Det är ett feltänk som har följt oss så länge. Data och information är två aspekter av samma företeelser. Data är, enkelt förklarat, en typ av information.
Kunskapsprocessen går inte, som man så ofta har hävdat, enkelriktat från data via information till kunskap. Sambandet är mycket mer sammanflätat. Till exempel behöver vi ha kunskap för att vi ska kunna skapa data. DAMA använder termerna data och information som sinsemellan utbytbara.

Chapter 2: Data Handling Ethics (17sidor)

Datahanteringsetik handlar om hur vi erhåller, förvarar, hanterar, tolkar, analyserar, använder och gör oss av med data på sätt som stämmer med etiska principer, inklusive det samhällsansvar vi har. Det innebär att vi värnar om kvalitet och pålitlighet.

Vi behöver:

  1. Definiera etiska regler
  2. Utbilda personal
  3. Fostra kultur och arbetssätt
  4. Bevaka regulatoriska förändringar i samhälle och övrig omgivning samt löpande monitorera och justera vår hantering.

Chapter 3: Data Governance (29 sidor)

Datastyrning är den mest centrala datahanteringsfunktionen, den som vägleder alla andra. Man tar ansvar för och styr hanteringen av organisationens datatillgångar.  Det innefattar planering, monitorering och upprätthållande.

Chapter 4: Data Architecture (21 sidor)

Informationsarkitektur på organisationsnivå handlar om att ta fram och underhålla ritningar och modeller som uttrycker organisationens databehov samt att använda dessa för att guida övriga funktioner.

(Observera att termen Data Architecture i DAMAs mening närmast stämmer med vad vi i Sverige av tradition benämner informationsarkitektur)

Kapitlet är skrivet av svensken Håkan Edvinsson, tidigare anställd på IRM och mångårig rektor för Dataföreningen Kompetens utbildning Certifierad Verksamhetsarkitekt.

Chapter 5: Data Modeling and Design (40 sidor)

Data-/informationsmodellering är processen för att fånga, analysera och avgränsa databehov och att representera och kommunicera detta i en precis form kallad data-/informationsmodell. Processen är iterativ och kan omfatta allt från konceptuellt och logiskt perspektiv till en ren fysisk modell.

Chapter 6: Data Storage and Operations (43 sidor)

Datalagring och drift omfattar design, implementering och stöd för lagrade data för att maximera dess värde.

Chapter 7: Data Security (45 sidor)

Datasäkerhet omfattar definition, planering, utveckling och exekvering av säkerhetspolicys och rutiner för att säkra en riktig autentisering, auktorisation, åtkomst och kontroll av data- och informationstillgångar.

Chapter 8: Data Integration and Interoperability (27 sidor)

Dataintegration och interoperabilitet handlar om att hantera förflyttning och konsolidering av data inom och mellan tillämpningar och organisationer.

Chapter 9: Document and Content Management (39 sidor)

Dokument- och innehållshantering innebär planerings-, implementations- och styrningsaktiviteter för livscykelhantering av data och information oavsett form och medium.

Chapter 10: Reference and Master Data (29 sidor)

Referens- och masterdata är de data som delas av många och refereras till från många ställen, och därför kräver särskild omsorg.

Chapter 11: Data Warehousing and Business Intelligence (30 sidor)

DW och BI handlar om att tillhandahålla data i en form som passar för beslutstöd, undersökning, analys och rapportering.

Chapter 12: Metadata Management (29 sidor)

Metadata är en bred kategori av data som alla beskriver data på olika sätt. Det som beskrivs av metadata dels är data i sig själv, det vill säga fysiska datastrukturer med mera, dels de begrepp och företeelser i verksamheten som data beskriver.

Chapter 13: Data Quality (43 sidor)

Datakvalitetsarbete handlar om hur vi säkerställer att våra data möter kraven hos konsumenterna av data.

Chapter 14: Big Data and Data Science (29 sidor)

Big Data och Data Science handlar om hur vi samlar in (Big Data) och analyserar (Data Science, Analytics och Visualisering) data av många olika slag för att hitta svar och insikter för frågor som inte är kända då vi börjar vår analys.

Chapter 15: Data Management Maturity Assessment (17 sidor)

Kapitlet handlar om hur vi kan ranka tillståndet hos datahanteringen i vår organisation, det vill säga hur väl vi hanterar data idag. Dessutom beskrivs hur vi kan planera förbättringar.

Chapter 16: Data Management Organization and Role Expectations (19 sidor)

Kapitlet diskuterar allmänna principer för hur vi kan tänka beträffande organisation och roller för datahantering i våra verksamheter.

Chapter 17: Data Management and Organizational Change Management (34 sidor)

Kapitlet handlar om hur vi kan tänka då vi driver den förändring som behövs för att förbättra datahanteringen i våra verksamheter.

Vad boken inte innehåller

DAMA – DMBOK2 är ingen lärobok i gängse mening utan som nämnts mer av en katalog. Boken hjälper oss att strukturera området, ge några allmänna begrepp och principer samt vägledning för vidare läsning

Något som jag tycker är viktigt för en informationsarkitekt men inte täcks av DAMA – DMBOK2 är det täta sambandet och ömsesidiga beroendet mellan att beskriva verksamhetens data (informationsmodellering) och att definiera och beskriva verksamhetens begrepp, benämningar och regler.
Min erfarenhet är att det i praktiken är ogörligt att se arbetet med att beskriva data som separerat från att definiera, beskriva och benämna det som data står för.

Jag förstår att man inom DAMA inte vill gå inpå detta område, för då blir det så mycket mer än datahantering. Någonstans behöver man dra gränsen.

Men för oss som jobbar med informationsarkitektur och i synnerhet informationsmodellering så är det viktigt att förstå att den gränsen inte är tydlig i praktiken och aldrig kan vara skarp. Vi kan inte i vår roll och vårt arbete avgränsa oss till data-/informationshantering. Jag menar att när vi tar fram informationsmodeller så gränslar vi över två stora områden. Vi har en nyckelroll inom datahantering, vilket beskrivs i DAMA – DMBOK. Men vi kan inte undgå att också engagera oss i att definiera och beskriva det som våra data representerar, det vill säga verksamhetens begrepp och hur de och hänger samman. Våra informationsmodeller kan, om de ska vara riktigt användbara, inte bara beskriva data-/informationsstrukturer utan samtidigt allt det som informationen står för, alla de företeelser som vår verksamhet hanterar och hur dessa företeelser definieras, benämns och hänger samman samt hur de styrs av våra verksamhetsregler.

Rent teoretiskt skulle man kunna se detta som två helt olika uppgifter. Någon annan får definiera, beskriva och benämna företeelserna i verksamheten och vi tar bara ansvar för hur detta ska representeras i data. Men det är i praktiken omöjligt. Vi kan inte analysera, definiera, beskriva, benämna och ge regler för data utan att samtidigt analysera, definiera, beskriva, benämna och ge regler för det som data representerar. Det är först när vi förstår de data vi har eller behöver som vi börjar förstå vad som det som detta data representerar i verksamheten. Vad en verksamhet hanterar manifesteras i de data som används. Det vi gör när vi informationsmodellerar är ett iterativt arbete med ömsesidigt beroende mellan att analysera data och analysera vad som representeras av dessa data.

Jag vill se detta som en effekt av informationsteknikens roll i våra verksamheter. Mycket av det som sker i en verksamhet sker i och mellan it-system. För att förstå en verksamhet i grunden kan vi inte bara intervjua verksamhetsfolk. Vi behöver också närstudera data. Data ger oss fakta, människor hjälper oss att tolka.

Det får inte tolkas som att vi själva ska ta hela ansvaret att definiera och beskriva verksamhetsbegrepp och regler. Vi kan inte jobba ensamma, vi gör detta i tätt samarbete med verksamhetskunniga av olika slag. Men ofta behöver vi driva det arbetet.

Varför ska jag läsa boken?

DAMA – DMBOK2 är inget man läser från pärm till pärm. Det är närmast en katalog, en referens, som man slår i då man funderar på de olika delområden som omfattas av Data Management, och hur man kan se på dessa.

Man behöver inte heller hålla med om allt, men det är i varje fall något att utgå från och ta spjärn mot i sin egen och sin organisations utveckling i hanteringen av sina data. Det är här vi hittar den mest genomtänkta, kompletta samlingen av kunskap inom området.

Peter Tallungs

23.09.21