Informationsarkitektens bokhylla – del 3: En kultbok

Bok Data and Reality av William Kent

I min bokhylla står det en tunn bok som lockat mig mer än andra böcker nämligen Data & Reality skriven av William Kent. En klassiker och kultbok. Kent borrar i kopplingen mellan utformningen av data i våra informationssystem och den verklighet de ska representera.

William Kent formulerade de tidlösa frågorna

William Kent gav år 1978 ut sin enda bok, Data & Reality. Det är en tunn bok. Djupt filosofisk utan att vara tung. Vi möter här tankarna Kent, en av databaspionjärerna, hade för nära 50 år sedan då informationsmodellering var ett helt nytt och ännu outforskat sätt att beskriva verkligheten. I boken diskuterar han ett antal frågeställningar om hur data i våra informationssystem kan representera den verklighet de ska representera. (Peter Chen hade kommit ut med sitt arbete om Entity-Relationship Modeling bara två år tidigare.)

This book addresses timeless questions about how we as human beings perceive and process information about the world we operate in, and how we struggle to impose that view on our data processing machines.

Ur inledningen av boken Data & Reality av William Kent

Kent ställer de tidlösa och tänkvärda frågorna om vad vi verkligen håller på med då vi informationsmodellerar. Ingen har ställt dessa frågor bättre än han. Än idag, efter nära ett halvt sekel! Jag förstår varför Hoberman 2012 gav ut boken Data & Reality på nytt, och att han inte kunde låta bli att i texten föra en dialog med William Kent. Om det inte vore gjort redan skulle jag göra detsamma.

Bokens innehåll

För att ge en smak av vilka typer av frågor Kent borrar i vill jag här ge några exempel.

Enhet – Identitet – Kategori

När vi bygger upp en datastruktur i en databas, fil eller tjänst använder vi termer för att beskriva datafälten. De ord vi använder är mångtydiga för det är så det är i naturliga språk. Ett och samma ord har inte en och samma mening utan refererar, mer eller mindre alltid, till ett kluster av närliggande meningar. Men det är normalt inget problem för oss i stunden, för som människor är vi bra på att lösa upp den mångtydigheten. Vi gör det automatiskt och omedvetet genom att uppfatta vilken kontext vi befinner oss i. Vi förstår vanligen vad just den databasen, filen eller tjänsten handlar om. Men när samma data dyker upp i en annan kontext, kanske i en rapport eller efter en integration blir det problem. Då kan vi inte lika lätt tolka de termer som använts.

William Kent ser det som att vi behöver hantera följande aspekter:

  • Enhet (Oneness)
    Vad är en individuell företeelse? Hur kan vi få fram en klar och komplett definition av vad vi refererar till?Exempel: Om en författare har skrivit en bok, den finns i tre utgåvor och varje utgåva finns i flera upplagor. Sedan finns upplagorna i många exemplar. Vad är det vi är intresserade av att hålla reda på? Och hur gör vi med digitala upplagor? Termen ”bok” kan referera till vilken som helst eller alla av dessa betydelser. Vi behöver analysera och beskriva exakt vilken betydelse vi avser.
  • Identitet (Sameness)
    När kan vi säga att två saker vi ser är samma individuella företeelse? När något ändras, när blir det då något annat? Vilka ändringar kan vi acceptera utan att vi måste börja se företeelsen som något annat?Exempel: Om en och samma person förekommer i flera roller är det då samma förekomst eller olika? Om en roll ändras, hur mycket och på vilket sätt kan den då ändras utan att den ses som en annan roll?
  • Kategori (Category)
    Vad är företeelsen vi försöker beskriva för något, egentligen? Vilka kategorier behöver vi sortera in företeelsen i?Inte minst behöver vi att avgöra om vi ska se företeelsen som en egen företeelse (en entitet) eller värdet på en egenskap (ett attributvärde).Exempel: En kunds belägenhetsadress till exempel, har den en egen oberoende existens eller finns den bara som en egenskap hos en kund? Det beror förstås på vad vi modellerar, men exakt vad beror det på?

Modellerar vi den verkliga världen?

William Kent vill göra oss medvetna om att vi inte kan säga att vi modellerar verkligheten. I varje fall inte utan att gardera oss ordentligt. Ty den värld vi modellerar behöver faktiskt inte ha en verklig existens. Vad vi nu menar med ”verkligheten”.

Det kan till exempel röra sig om något av följande:

  • Historisk information
    Det vill säga att det representerar något som inte finns just nu i varje fall. Vi kan ha olika åsikter om händelser i det förflutna har en verklig existens i nuet.
  • Falska uppgifter
    Det vill säga information som aldrig varit sann, men vi ändå behöver hålla reda på.
  • Framtida planerade tillstånd
    Uppgifter om något man planerar, det vill säga saker som inte är sanna än och kanske aldrig kommer att bli sanna.
  • Hypotetiska uppgifter
    Saker som vi inte ens tror kan komma att inträffa.

Vi behöver således tänka i mentala verkligheter i stället för faktiska verkligheter. Det mesta som finns i databaser avbildar vad människor har i huvudet, inte sådant som har en objektiv existens utanför vår kognition.

Vi modellerar på sätt och vis aldrig ”verkligheten” utan snarare hur information om verkligheten hanteras av människor.

Vem var William Kent

William (Bill) Kent var kemisten och matematikern som hamnade på IBM på 70-talet och senare på Hewlett Packard. Utan bakgrund inom datavetenskap deltog han i arbetet med att utveckla databastekniker. Tidigt började han skriva artiklar och vetenskapliga uppsatser om databasteknik, objektorienterad systemutveckling och informationsmodellering.

Kent gick bort 2005 men boken Data & Reality lever kvar som en klassiker. Den är något av en kultbok för de som, likt mig, är intresserade av de filosofiska frågorna runt data.

Varför ska jag läsa Data & Reality?

Jag rekommenderar boken till den som vill tänka lite djupare, reflektera över vad vi verkligen håller på med då vi informationsmodellerar. För att kunna tänka klarare. För att lättare hantera olika knepiga situationer. För att möta en person som tidigt försökte förstå naturen av det vi gör och bättre än någon annan lyckats formulera de frågeställningar vi får då vi reflekterar över vårt värv. Och för att roas av tankeleken och det klara sätt att formulera djupa frågor som Kent bjuder in till. Jag har svårt att tänka mig ett bättre intellektuellt nöje!

Välkommen att maila mig på peter.tallungs@irm.se eller kommentera artikelns post på IRM:s linkedin.

Vill du prenumerera på denna artikelserie? Det innebär att du får ett nyhetsbrev, samtidigt som vi publicerar en ny artikel i ämnet informationsarkitektur, med länk till den senaste artikeln. Skriv ett mail till info@irm.se med namn och e-postadress. Skriv IA-artikelserie i ämnesraden.

Peter Tallungs

23.04.20