”Data” eller ”information”

Vad är skillnaden? Jag tvekar ofta om jag ska benämna något som ”data” eller ”information”. Är det data eller är det information? Är detta som jag tar fram en datamodell eller en informationsmodell?

I Sverige kallas en konceptuell modell ofta för informationsmodell och en logisk eller fysisk modell ofta för datamodell. Men i USA talar man vanligen bara om ”Data Models” oavsett om de är konceptuella, logiska eller fysiska. Hur kan vi se på det?

Den påstådda teoretiska skillnaden

Alla som definierat begreppen data och information verkar vara överens om att data är råa uppgifter utan sammanhang och tolkning. Tänk att du tittar på en massa siffror men inte vet, eller bryr dig om, vad de står för. Vidare är man överens om att information är data som har ett sammanhang och tolkning.

Hur uppkom distinktionen?

Det kan vara intressant att veta hur distinktionen mellan data och information kom till. Inom system- och informationsvetenskap skedde detta i skiftet mellan 70- och 80-tal. Det var när man strävade efter att få sina områden att bli respekterade som strategiska management-discipliner. Man ville få företagsledningar att se data som en strategisk tillgång och lanserade därför en tänkt process med en transformering och filtrering från data via information till kunskap och ibland till och med ända till visdom.

Bild från gapingvoid.com

Synsättet har genom åren kritiserats som en alldeles för mekanisk och förenklad syn på kunskapsprocessen i en organisation. Visst spelar data och information en roll i kunskapsskapandet men sammanhangen är mycket mer dubbelriktade och sammansatta.

Se till exempel David Weinbergers artikel ”The Problem with the Data-Information-Knowledge-Wisdom hierarchy” och Patrick Lambs bloggartikel  “From Data, with Love”.

Det var i sammanhanget som är beskrivet ovan som en del började kalla datamodeller för informationsmodeller och Data Management för Information Management. Förmodligen för att få företagsledningars uppmärksamhet. Av någon anledning slog det språkbruket igenom i Sverige men inte i USA.

Som så ofta handlade det alltså mer om politik och revirpinkande än om någon verklig insikt.

Idag, ett halvsekel senare, kan man tro att ordens statusordning har kastats om. ”Data” har fått en ny laddning. Trenduttryck som ”Data is the new oil”, ”Data driven enterprise”, ”Data Science” och “Chief Data Officer” vittnar om att data inte längre ses som någon tråkig mekanisk infrastruktur.

Detta var en liten historisk bakgrund. Låt oss återgå till distinktionen mellan data och information. 

Vad är sammanhang och tolkning?

Om vi för diskussionens skull godtar att data blir till information vid den tidpunkt då den kläs på med ett sammanhang och en tolkning. När inträffar då denna punkt i processen? Problemet kommer då vi ska bestämma vad vi egentligen menar med sammanhang och tolkning. Vad är tolkning och sammanhang? När sker tolkningen av data? När sätts data i sitt sammanhang? Dessa frågor kan först verka ha enkla svar men blir vid en närmare betraktelse meningslösa.

Redan när data samlas in görs det i ett sammanhang som är känt och ges direkt en tolkning genom hur den hanteras.

Låt mig ta ett exempel. En givare av något slag ger ett mått på något, säg värdet ”23”. Någonstans där värdet från givaren registreras bör det nödvändigtvis finnas inbyggd kunskap om sammanhang och mening med mätningen. Man vet kanske att det är en temperaturgivare och att det är grader Celsius. Man vet var givaren sitter och därmed inte bara att det är lufttemperatur utan också på vilket ställe lufttemperaturen är registrerad. Utöver detta vet man också redan vid registreringen vilken tidpunkt värdet registrerades. Allt detta är mening och sammanhang för datapunkten och registreras alltså med en gång, bara genom vad det är för slags sensor och var den sitter. Om man ska vara strikt kan man hävda att det aldrig är frågan om rådata i egentlig mening. Om vi kan vara överens om detta så är det alltid fråga om information, ända från då den registreras.

Så, en sådan distinktion vi tidigare gjorde blir meningslös. I så fall, med det resonemanget, finns aldrig data, bara information. 

Vad det beträffar de modeller vi gör så blir det väl då alltid frågan om informationsmodeller. Ty där bryr vi oss alltid om meningen med de data vi hanterar.

Låt oss pröva ett annat synsätt. Kanske vi kan se det som att data blir till information först när någon människa har tagit hand om de insamlade data, gett det en ännu mer utarbetad tolkning. Om vi tänker oss att man samlat in lufttemperaturer under en tid och jämför med andra år och därmed kan säga att det varit en ovanligt varm marsmånad i år. Är det först då det blir information? I så fall hanterar vi vanligen inte alls information i våra informationsmodeller. Informationen uppstår först i de analyser och slutsatser som dras efter ett mänskligt bearbetande, och hanteras typiskt som text i en rapport av något slag.

Det är tydligt att vi har att göra med ett kontinuum där övergången från data till information är helt och hållet flyttbar. Den rör sig beroende på vad man lägger i begreppen ”sammanhang” och ”mening”.

Data och information på samma gång?

Vi kan i stället se det hela på ett annat sätt. Vi kan lämna resonemanget med en tänkt process, det vill säga föreställningen att data övergår till att bli information vid någon bestämd punkt. Istället kan vi se det så att samma insamlade siffror är både data och information samtidigt beroende på vilka aspekter vi för tillfället fokuserar på. När vi pratar om megabytes eller megabits per sekund så bryr vi oss inte om vare sig mening eller sammanhang. Då pratar vi om lagring eller transport av data, utan att bry oss om vad de står för. Men när vi verkligen vill titta på och förstå vad dessa data betyder ser vi det som information.

Det är det synsättet jag har fastnat för. Det är helt analogt med andra mänskliga områden. Om jag kör lastbil så kanske jag bara bryr mig om hur många ton och kubikmeter gods jag har. Men för mottagaren är det inte bara gods utan angivna mängder av specifika varor.

Några siffror är inte antingen data eller information utan både och, beroende på vilket perspektiv jag har för stunden. Distinktionen är ingen inneboende egenskap hos uppgifterna utan skillnaden ligger i betraktarens öga.

Problem med begreppet ”information”

Ett annat problem med termen ”information” är att den kan leda fel. Begreppet information leder närmast tankarna till sådant som ostrukturerad text och bild, det vill säga sådant som vi inte direkt hanterar i vårt skrå. Våra informationsmodeller visar ju endast sån information som är strukturerad som poster i en lista. Repeterbar abstraherad information, strukturerad för någon form av informationsprocessande. Termen ”data” ringar på ett bättre sätt in vad det handlar om än den alltför breda termen ”information”. I stora delar av världen kallas följaktligen det vi gör vanligen för ”Data Models”, ”Data Modeling”, ”Data Management” och så vidare.
”Information Management” står vanligen för en managementdisciplin, det vill säga hur man leder en verksamhet med information i centrum, alltså något helt annat.

Mer eller mindre synonymer?

Egentligen är väl distinktionen inte så viktig. Jag vill se termerna ”data” och ”information” som mer eller mindre synonyma. I varje fall i det sammanhang vi arbetar. Jag säger oftast ”data” eftersom jag anser att det leder tankarna lite mera rätt. Utom då det gäller modeller. Då säger jag vanligen ”informationsmodeller”. Inte så konsekvent språkbruk kanske, det är mest av gammal vana, och utan närmare eftertanke.

Vad säger du: data eller information? Gör du det som jag, av gammal vana eller har du reflekterat över vad orden egentligen står för?

/Peter Tallungs. IRM

Nästa artikel i ämnet informationsarkitektur publiceras torsdag 8 april. Då handlar det om Datamanagement – hela kedjan.
Vill du prenumerera på denna artikelserie? Registrera din mailadress här.

7 Kommentarer
  1. Torbjorn Ryber
    Torbjorn Ryber says:

    Jag brukar se en informationsmodellen som en beskrivning utifrån ett användarperspektiv. Den bör se ut på et sätt som går att förstå även av icke-tekniker.

    Datamodellen har jag sett mer som den tekniska beskrivningen av hur vi väljer att lagra data i en fysisk databas.

  2. Lars Taxén
    Lars Taxén says:

    Peter,

    Ännu en utmärkt artikel! Det du tar upp berör själva fundamentet för disciplinen Information Systems, som ju funnits nu i många decennier. Men man har ännu inte kommit överens om vad ”information” är, vilket man ju kan tycka är rätt märkligt för en disciplin som har det som forskningsobjekt. Det finns åtminstone fyra olika uppfattningar enligt en forskare (Boell, 2017):

    • The physical stance, where information “is seen as a fundamental property of the material world”,
    • The objective stance, where information “is seen either as stimuli or knowledge that exists independently, outside of humans”
    • The subjective stance, where information is “something that is appropriated by a subject”
    • The sociocultural, where “information is specified by a social context determining what is regarded as information”

    Men det finns en möjlighet till – att information är något unikt personligt, som varje individ utvecklar beroende på situationen. Om jag t.ex. är på hemväg i min bil tillsammans med en vän och ser en kyrka längre fram, så vet jag att jag ska svänga höger bakom den för att komma hem. Synintrycket från kyrkan (data) bildar tillsamman med mina tidigare erfarenheter information om hur jag ska agera. Men min vän, som kanske är religiös, ser kyrkan (samma data) som en påminnelse om gudstjänsten på söndag.

    I det här synsättet på information blir distinktionen mellan data och information viktig. Om alla som deltar i en modellering tolkar modellen (data) olika (vilket man gör), så är vi tillbaka till grundproblemet i dina artiklar – hur gör vi bäst för att få en så bra samsyn om modellen som möjligt.

    Lars

  3. Peter Tallungs
    Peter Tallungs says:

    Svar till Torbjörn Ryber
    Jo, det är sant, så brukar modellerna benämnas i Sverige.

    Fast informationsmodellen bör inte vara endast för de direkta användarna av applikationen utan ett gemensamt språk för alla parter i verksamheten.
    Jag har också ofta jobbat för att informationsmodellen blir inte bara för att benämna information i en databas utan för att skapa ett gemensamt språk för företeelserna i en verksamhet, inklusive egenskaper, egenskapsvärden och relationer. Ja till och med kan den fånga verksamhetsregler och snart sagt hela verksamhetslogiken. Det vill säga att informationsmodellen beskriver verksamheten (vilket inkluderar den information/data som behövs för att hantera företeelserna i verksamhetens domän.)
    Fast då måste vi lämna många av dagens begränsningar i hur vi gestaltar modeller och och gå vidare i utvecklingen av vårt område. Det är detta jag vill skriva om i denna artikelserie. Vad det innebär i mer praktiskt hänseende kommer i senare artiklar.

  4. Peter Tallungs
    Peter Tallungs says:

    Svar till Lars Taxén
    Tack för din genomgång av vilka teoretiska hållningar man kan ha till begreppet ”information”.

    Du exemplifierar hur samma data (synintrycket av en kyrka) kan leda till olika information (vilken föreställning synintrycket ger i betraktarens hjärna).

    Jag håller med. Fast jag vill ändå lägga till att punkten i tiden där data övergår till att få kontext och mening flyttas beroende på vad vi menar med kontext och mening.
    Jag ger här ett exempel på en annan tolkning.
    Det som retinan tar emot är ju endast skurar av fotoner, det vill säga data. Det blir en bild först då syncentrum har satt samman, sorterat, valt ut, mönstermatchat, skilt det som verkar betyda något från det som verkar vara irrelevant. Det vill säga att syncentrum gör ett fantastiskt omfattande arbete med att omvandla rådata till information (kontext och mening). Man kan möjligen till och med hävda att en sortering och ett urval sker redan i retinan. Till exempel har experiment med kattungar visat att deras retina är särskilt känslig för smala viftande linjer, som råttsvansar.

    I exemplet ser de två betraktarna båda bilden av en kyrka. Det borde kunna ses som samma information i båda fallen.
    Att det sedan blir olika tankar till följd av den informationen kan man hävda är exempel på hur samma information kan leda till olika kunskap hos olika individer (återigen beroende på kontext, men nu tillförs inte kontext i syncentrum utan i ”högre” kognitiva centra, omedvetet eller medvetet).

    Det är det jag vill säga med att övergången från data till information sker i olika punkter beroende på vad man lägger i begreppen kontext och mening. Jag tror att det är mer rätt att se allt data som att det har mening och kontext redan från början. Fast det kan variera var och när vi bryr oss om vilken mening och kontext det har.

    Fast detta är bara en teoretisk diskussion. I vilket fall är vi helt överens om att vi ska gör allt för att våra modeller ska befordra en krispig dialog och utforskande mellan alla parter. Det vill säga att modellen ska bli ett gemensamt språk för alla parter. Det gäller både hur vi ritar och hur vi skriver. Det gäller framför allt hur vi jobbar med våra modeller.

    Det betyder inte nödvändigtvis att vi i alla lägen har samsyn, men det betyder att vi i varje fall inte i onödan ska missförstå varandra. Då återstår de diskrepanser som finns i våra uppfattningar som är intressanta och lärorika i stället för jobbiga och hindrande, som bara beror på att vi pratar förbi varandra. Dialogen blir just en bra dialog, respektfull och intressant och inte ett ofruktbart bråk.

  5. Lars Taxén
    Lars Taxén says:

    Bara ett kort tillägg. Vad skulle det t.ex. ha för konsekvenser om vi överger förställningen om att mening och kontext är något som data har, och i stället ser mening och kontext som något som varje individ tillskriver data? Min uppfattning är att sådan diskussion är allt annat än ”bara teoretisk”. Jag tror tvärtemot att den är helt avgörande för hur vi ska komma tillrätta med de praktiska problemen vi möter i vardagen. Din artikelserie är ju en utmärkt början för få igång en diskussion om detta. Frågan är väl bara hur vi håller den vid liv efter dina artiklar.

  6. Peter Tallungs
    Peter Tallungs says:

    Svar till Lars Taxén.
    Intressant tanke, men jag hänger inte riktigt med.

    “Mening” inom meningsteorin är ju ett språkligt uttrycks betydelse, innebörd eller referens. Ett språkligt uttryck, till exempel en text kan alltså ha en mening. Man kan väl (i det enklaste fallet) säga att avsändaren ”kodar” ett meddelande genom att uttrycka den i någon slags syntax, till exempel text, för att kunna bevara eller sända meddelandet. Sedan avkodar mottagaren meddelandet så samma mening kan uppstå hos mottagaren. Själva kodningen och avkodningen beror av kontext och kan bli mer eller mindre rätt.

    Det måste ju inte heller handla om mänskliga språk utan att vilken form av meddelande (och därmed meddelande) som helst kan kodas för att sändas eller bevaras.

    Vi tänker oss vanligen sändare och mottagare som människor, men samma gäller ju för alla sociala varelser. Till exempel dansar ett bi för att meddela de andra bina riktning och avstånd till nektar.
    Sändare och mottagare behöver inte alls ha ett medvetande. De kan vara maskiner byggda av människor, tex en termostat som styr ett värmeelement, kodar ett meddelande om att det är dags att dra på värmen för att temperaturen har sjunkit under börvärdet.
    Det finns också exempel i naturen. T.ex. hur bukspottskörtel signalerar med hjälp av insulin till musklerna att ta upp blodsocker. Eller hur den fullständiga instruktionen att tillverka ett djur eller en växt kodas och lagras i DNA för att packas upp och via RNA användas av regosoler för att tillverka proteiner och bygga en ny individ.

    Om vi säger ”meddelande” menar vi ju något rakt och enkelt, men även något sammansatt och mer eller mindre mångtydigt tolkningsbart fungerar på samma sätt, fast blir förstås både mer mångtydigt och då på ännu fler sätt beroende av kontext. Till exempel en roman, en dikt, en teckning.

    Eller en informationsmodell. Fast där har vi, liksom inom allt skapande, att jag själv både sänder och tar emot. Jag formar ett material på samma sätt som alla designers gör. Och vi har också samskapande vilket gör att det handlar om många individer som omväxlande och samtidigt sänder och tar emot.

    Fast nu kanske jag övertolkar dig. Du kanske bara menar att det som händer i deltagarnas huvuden är det intressanta. Att det är det som är resultatet, hur modellen avkodas sin mening. Och att vi ska vara uppmärksamma på att tolkningen kan vara olika, speciellt om vi inte modellerat tillsammans.
    I så fall är jag med dig.

  7. Lars Taxén
    Lars Taxén says:

    Sändare-mottagare modellen bygger på synen att vi i hjärnan har ett arkivskåp av begrepp, termer, föreställningar osv, som vi använder när vi kodar och skickar ett meddelande till någon annan. För att mottagaren ska avkoda och förstå meddelandet rätt krävs att hen har samma arkiv av begrepp, termer, föreställningar, osv i sin hjärna. Den här modellen, dvs att kommunikation är en transport av tankar via meddelanden mellan två hjärnor (kallad ”telementation” av vissa forskare), är ohållbar.

    Alternativet är uppfattningen att en text inte har någon mening; den är bara en uppsättning svarta prickar ordnade på ett särskilt sätt. Likaså har något jag yttrar ingen mening; det handlar bara om att jag via mina neurobiologiska förmågor sätter en akustisk våg i rörelse. Vad som händer med texten och yttrandet är helt upp till den som läser texten / hör yttrandet. Mening, information, kunskap blir det bara när någon individ tolkar dessa i ett sammanhang från sina personliga erfarenheter.

    Det här innebär t.ex. att Rosetta-stenen, som gjorde det möjligt att förstå hieroglyferna, bara var en sten med konstiga ingraveringar när den hittades 1799 (den hade t.o.m. använts som byggnadsmaterial!). Hade inte Champollion och andra lyckats tolka ingraveringarna, hade den förblivit en sten som alla andra.

    Det här innebär förstås inte att det som finns utanför hjärnan saknar betydelse. Tvärtom, mening, information, kunskap, osv för en individ kan bara byggas i samspel med omgivningen; i den kontext där individen verkar. Hieroglyferna var oundgängliga för de forntida egypterna, men är helt oväsentliga för att strukturera våra samhällen idag.

    Tillämpat på informationsmodellering så betyder det alternativa synsättet att samspelet mellan individer och modell är avgörande för att mening och information ska utvecklas. Modellering innebär alltså inte att vi ”lagrar” mening, information, eller kunskap i modellen. De kan bara utvecklas hos individerna, och är unika för varje individ.

    Det här är svårt att se eftersom sändar-mottagare modellen är så inkörd i allt vårt tänkande om kommunikation. Jag har inga som helst illusioner om att det kommer att ändras på kort sikt. Men i längden måste vi överge den om vi ska komma vidare i vårt tänkande om modeller och modellering. Det är i alla fall min bestämda övertygelse…

Lämna en kommentar

Want to join the discussion?
Dela med dig av dina synpunkter!

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *