Informationsarkitektens bokhylla – del 6: En viktig bok om definitioner

När vi informationsmodellerar behöver vi som informationsarkitekter ta fram, hantera och arbeta vidare med definitioner. Vi behöver göra det enskilt och tillsammans med andra. I själva verket är det en central uppgift, men ofta illa förstådd och ignorerad aspekt av arbetet. Det handlar inte bara om att utföra arbetet med definitioner utan också om att på ett hållbart sätt bygga upp den förmågan i organisationen. Vad det handlar om beskrivs utförligt och insiktsfullt i denna bok.

/Peter Tallungs, IRM, 2023-06-01

Vi behöver definitioner

Jag tror att vi kan vara överens om att data utan mening är meningslösa. Och att vi ofta är osäkra på den exakta meningen med olika dataelement, och att oklarheter och missförstånd leder till problem. Då kan vi nog också vara överens om att data behöver definitioner. Tydliga, krispiga, korrekta definitioner, inte för breda och inte för smala. Definitionerna behöver vara skriftliga och tillgängliga så att vi kan ta del av dem. Det gäller inte minst alla element i våra informationsmodeller, både entiteter, attribut, relationer och värden i uppräknade värdemängder.

Informationsmodeller saknar ofta definitioner

Ofta saknar informationsmodeller definitioner, med följden att modellen svajar bräckligt på osäker grund. Det är en brist med djupare och mer långtgående följder än man kanske kan tro. Om jag inte för mig själv tydligt kan klargöra min egen förståelse så riskerar den att vara falsk eller osäker. Jag har inte utsatt min förståelse för andras prövning om jag inte tydligt visar för andra vilka antaganden jag gjort. Någon säker gemensam förståelse går då inte att uppnå. Det skadar hela arbetet och orsakar problem som upptäcks sent och därmed försvårar all kommunikation och integration.

Att skriva definitioner gör mig klarare i tanken

Jag som modellerare bör alltid ta fram definitioner för alla element i mina informationsmodeller. Den första nyttan med detta är att jag då tvingas klargöra för mig själv vad jag uppfattar att något faktiskt är och vad det inte är. Min förståelse, vare sig den är klar eller diffus, blir på så sätt tydligare för mig själv.

Arbetet med definitioner skapar gemensam förståelse

En lika viktig sak är att vi som är inblandade i modelleringen, skapar oss en uttrycklig gemensam förståelse. Vilket inkluderar det som är ännu viktigare att vi är medvetna om, nämligen när och hur vår förståelse går isär. Modellen blir då en effektiv spelplan för vår dialog, vårt gemensamma lärande. Vi slipper sena och obehagliga överraskningar, till exempel när det visar sig att vi egentligen menat olika utan att vi varit medvetna om det.

Jag tror att den både vanligaste och mest grundläggande bristen då det gäller data i våra organisationer är att det saknas tydliga och gemensamt förstådda definitioner. Många problem kan härledas till denna brist. Speciellt tydligt blir det då data tas ur sin ursprungliga kontext, det vill säga då data integreras mellan olika delar av en verksamhet eller mellan olika verksamheter. Om jag har en annan förståelse än någon annan vet varken jag eller du om det, eftersom vi inte tydligt klargjort för varandra vad vi menar. Då kan vi aldrig få till den dialog som gör att vi kan utvecklas.

Där har vi som modellerar information vår stora uppgift. Syftet med våra informationsmodeller är ju ytterst just denna; att skapa en uttrycklig och ändamålsenlig gemensam förståelse för vad våra data representerar, det vill säga vilka företeelser vi egentligen hanterar i vår verksamhet och vilka egenskaper de kan ha. Informationsmodellering kan ytterst ses som konsten att skapa tydliga och gemensamma definitioner av det som verksamheten hanterar.

Vi behöver bli bättre

Vi som informationsmodellerar bör sträva efter att arbeta fram och formulera så bra definitioner som möjligt. Krispiga definitioner, inte för breda och inte för smala, utan definitioner som verkligen förmedlar innebörden.

Ändå är detta ett område som nästintill är frånvarande i böcker och kurser om informationsmodellering. Till och med den annars så vederhäftiga organisationen DAMA International, som med sin bok DMBOK (Data Management Body of Knowledge) naglar fast vad Data Management omfattar, tycks helt ignorera detta. På 300+ sidor nämner man inte ens begrepp och definitioner som något som ingår i arbetet med en organisations data.

Det är som att det finns en uppfattning om att man helt och hållet skulle kunna separera data och information från mening och kontext. När det i själva verket är precis tvärtom. Data och information är helt och hållet beroende av mening och därmed kontext som en del av meningen.

Malcolm Chisholms bok

Det finns dock en ljuspunkt. 2010 kom det en bok som helt och hållet handlar om hur man kan arbeta med definitioner för dataelement av olika slag. Det är hittills det enda jag sett om området. Därtill en alldeles utmärkt bok.

Boken är skriven av britten Malcolm D. Chisholm som är en välkänd expert inom Data Management. Han har doktorstitel och har ofta förekommit som huvudtalare på konferenser inom Data Management. Han fick för några år sedan utmärkelsen ”For his Life Time Achivement” av Data Management-organisationen DAMA International.

Bokens innehåll

Boken innehåller följande kapitel:

Chapter 1: Introduction to the Use of Definitions in Data Management (16 sidor)

En grund till vad en definition är och motiverar varför definitioner är viktiga inom Data Management.

Chapter 2: Justifying Definitions in Data Management (18 sidor)

Här ger Chisholm exempel på specifika situationer där definitioner spelar en viktig roll:

För att förstå verksamhetsbegrepp som representeras av data
Klargöra mening där en term kan tolkas på flera sätt
Skilja termer som är data från de som är metadata
Tydliggöra mening för uppräknade förekomster
Förmedla hur en härledd term är härledd eller beräknad term är beräknad
För att mappa data från ett sammanhang mot data från ett annat sammanhang
För att jämföra ett datafälts verkliga innehåll med förmodat innehåll
Kapitlet nämner även hela sammanhang där definitioner spelar en central roll
Källdataanalys i samband med Business Intelligence
Analys av befintliga applikationer
Dataintegration

Chapter 3. Definitions Versus Images (6 sidor)

Om explicita definitioner jämfört med våra mentala föreställningar.

Våra föreställningar av termers betydelse som vi har i våra huvuden, räcker i många sammanhang i livet, men då det gäller data är de inte tillräckligt precisa.

Chapter 4. Theory and History of Definitions (18 sidor)

En överflygning av den långa och betydelsefulla teoribildningen runt begrepp och deras definitioner, från de antika grekiska filosoferna och till idag.

Chapter 5. Data and Metadata Objects Requiring Definitions (18 sidor)

Vilka typer av data som behöver definitioner: Entiteter, attribut, relationer med mera.

Chapter 6. Real Versus Nominal Definitions (8 sidor)

Termen ”definition” kan ha två olika betydelser. En nominell definition berättar vad en term refererar till, men förutsätter att vi redan helt och fullt förstår det som refereras. Det är således enbart en översättning av en term, utan att beskriva betydelsen egentligen.

En reell definition beskriver vad termen står för. Det är reella definitioner vi behöver och det är dessa vi diskuterar då det gäller definitioner inom Data Management.

Chapter 7. Types of Definition (18 sidor)

Då man betraktar definitioner kan man dela in dessa på olika sätt. Typerna är olika sätt att karakterisera en definition. Vi kan inte hålla oss till en typ av definitioner; de olika typerna har sina respektive styrkor och svagheter som vi behöver avväga mellan.

Typer av definitioner som räknas upp:

essentiella
distinkta
kausala (ändamål)
kausala (orsak)
genetiska
slumpartade
ostensiva
stipulativa
legislativa .

Dessutom finns det begrepp som anses vara mer eller mindre omöjliga att definiera på ett helt korrekt sätt. Då får man göra vad man kan.

Chapter 8. Producing High-Quality Definitions (20 sidor)

Så här långt har boken gått igenom teorin bakom definitioner. Nu är det dags för praktiska råd och regler för hur vi kan skilja en bra definition från en dålig. Över huvud taget är arbetet med att definiera inte ett rakt mekaniskt arbete utan vi får prova oss fram för att hitta det som fungerar bäst för den specifika verksamheten. Processen är på sätt och viktigare än resultatet.

Avsnittet går bland annat igenom vilka krav vi ställer på en definition, eller i varje fall vad vi ska sträva efter så gott vi kan.

En definition av en term ska:

vara reell, inte nominell
vara komplett, det vill säga ta med alla aspekter om behövs för att särskilja betydelsen
verkligen avse termen i fråga
utesluta en tvetydig betydelse av termen
inte vara för smal, det vill säga täcka begreppets förekomster som helhet
inte vara för bred, det vill säga inte överskrida det begrepp man vill täcka
inte vara onödigt dunkel
vara atomär, det vill säga inte i sig innehålla en definition av ett annat begrepp (dock kan den behöva referera ett annat begrepp)
inte vara tautologisk
inte vara cirkulär
inte vara negativ om den kan vara positiv
inte vara självmotsägande
inte väljas med syfte att driva en agenda
inte med sin formulering uttrycka känslor
inte innehålla förklaringar, utöver det som behövs för definitionen
inte i onödan repetera saker eller vara redundant
vara anpassat till de som ska använda den, vilket omfattar både de som skapar definitionen, de som direkt ska använda definitionen samt de som ska hantera de företeelser eller termer som definitionen täcker.

Chapter 9. Entity Type Vesus Attribute Definitions (6 sidor)

Kapitlet tar upp frågor som rör specifikt definition av entiteter respektive attribut.

Chapter 10. Precision of Data (8 sidor)

Kapitlet berör attribut med ett numerärt värde. Definitionen ska ange både den enhet som värdet ges i samt precisionen hos värdet.

Chapter 11. Accurancy of Data (8 sidor)

Definitionen av en term behöver ibland behöva ange vilken grad av riktigheten vi kan förvänta oss hos det data som representeras av termen.

Riktigheten kan avse olika aspekter som bland andra:

Fördröjda data
Föråldrade data
Felöversatt data.

Chapter 12. Scope of Data (8 sidor)

De termer vi definierar inom Data Management representerar data som har en mycket precis och ofta väl avgränsad räckvidd. Därför räcker det inte att bara använda de allmänna definitioner vi finner i ordböcker, vi måste också inkludera räckvidden i definitionen, vad som är inkluderat och vad som inte är inkluderat.

Chapter 13. Context of Data (10 sidor)

När vi hanterar en term inom Data Management så avser vi alltid termens användning i ett specifikt sammanhang. Därför behöver vi inse att vissa företeelser kan behöva ha olika termer i olika delar av verksamhet eller i olika sammanhang i övrig, det vill säga att vi behöver hantera synonymer.

De sammanhang vi kan behöva hantera är till exempel följande:

Olika företag i samma koncern
Olika affärsområden
Olika funktioner, inte minst olika stödfunktioner
Olika länder eller kulturer
Olika it-applikationer.

Chapter 14. Sources of Definitions (22 sidor)

Varifrån får vi definitioner, som färdiga eller som startpunkt för att arbeta vidare med? De resurser vi kan använda är dels externa resurser som ordböcker på nätet dels interna resurser som redan existerande databaser, modeller eller material.

Resurser kan också vara formella, det vill säga sådana som är avsedda att vara källor för definitioner som ordlistor med mera, eller informella det vill säga sådana som råkar ge oss ledning som dokumentation med andra syften.

Resurser kan ha olika status som:

Förordad källa. Verksamheten är förbunden att använda en viss källa för en viss definition. Så är ofta fallet med lagar, kontrakt eller regulatoriska regler
Antagen källa. Man har bestämt att använda definitioner från en viss källa utan att anpassa dem
Övervägd källa. En källa med definitioner man utgår från, men anpassar vid behov
Förkastad källa. En källa man av någon anledning bestämt att inte använda sig av.

Chapter 15. Governance of Definitions (14 sidor)

Definitioner behöver hanteras och utvecklas kontinuerligt. De måste hållas tillgängliga och det behöver finnas en öppen dialog över hela organisationen.

Chapter 16. Metadata of Definitions (10 sidor)

Definitioner inom Data management är en typ av metadata, det vill säga data om data, men även definitioner är data och har metadata som kan behöva hanteras.

Chapter 17. Conclusion (8 sidor)

Ett kort sammanfattande kapitel.

Varför ska jag läsa boken?

För att jag som informationsarkitekt behöver ta fram definitioner, hantera definitioner och arbeta vidare med definitioner. Jag behöver göra det enskilt och tillsammans med andra. I själva verket är det en central uppgift för mig, men ofta illa förstådd och ignorerad aspekt av arbetet. Det handlar inte bara om att utföra arbetet med definitioner men också om att bygga upp den förmågan i min organisation på ett hållbart sätt. Vad det handlar om beskrivs utförligt och insiktsfullt i denna bok.

Vad tänker du om det jag skriver?

Välkommen att maila mig på peter.tallungs(at)irm.se eller kommentera artikelns post på IRM:s linkedin.

Vill du prenumerera på denna artikelserie? Det innebär att du får ett nyhetsbrev, samtidigt som vi publicerar en ny artikel i ämnet informationsarkitektur, med länk till den senaste artikeln. Skriv ett mail till info@irm.se med namn och e-postadress. Skriv IA-artikelserie i ämnesraden.

Peter Tallungs

23.06.01