Vad vi kan lära oss av den bästa graf som någonsin ritats
Den amerikanske statistikern och grafikern Edward Tufte har skrivit fem böcker om hur man på bästa sätt förmedlar information och kunskap med hjälp av grafik. Den 150 år gamla grafen ovan är med hans ord: ”Probably the best statistical graphic ever drawn”. Men vad menar han med det? Vi som gör modeller kan lära oss något här.
/Peter Tallungs, IRM 2022-08-11
Grafen i fråga är en schematisk karta som visar de succesiva truppförflyttningarna under Napoleons ryska kampanj 1812–13, det vill säga den franska invasionen av Ryssland. Den har staplar för flöden och är av en typ som vi idag kallar för flödeskarta. Den är ritad av den franske arméingenjören Charles Joseph Minard år 1869. Minard räknas idag som en av de som betytt mest för utvecklingen av statistisk grafik, det vill säga hur man presenterar numeriska värden med hjälp av diagram.
Vad Minards graf visar
Grafen är alltså till sin grund en schematisk karta. Längst till vänster ser vi floden Njemen, vid polsk-tyska gränsen, som en tunn slingrande nord-sydlig linje. Där samlade fransmännen i juni 1812 den största arméstyrkan dittills i historien, 422 000 man av många nationaliteter. Den ljusröda stapeln visar hur den franska armén rycker fram mot Moskva, och den svarta stapeln visar återtåget från Moskva ett halvår senare. Bredden på den ljusröda och den svarta stapeln representerar styrkans storlek och antalet man vid tillfället. Vi kan se hur stapeln smalnar av när man tågar österut. Ryssarna brände foder, säd och ibland hela bondbyar i förväg så att den gigantiska armén fick svårt att föda sig. Kosacker anföll i små snabba attacker, dag som natt. Vi kan se i grafen hur man skickade ut hjälptrupper för att försöka ta itu med kosackförband och skydda flanken (sidan) och kön (bakändan) av denna marscherande jättekoloss.
Ryssarna hade två stora arméer men undvek direkt batalj och drog sig undan hela tiden. Dels på grund av att de två generalerna inte riktigt samarbetade, men också av klok taktik. Så Napoleon fick inte till den drabbning han hade tänkt sig. Han skickade förgäves propåer till tsaren att komma och göra upp. Strax före Moskva möttes man dock till slut i ett slag, slaget vid Borodino, som Tolstoj skildrar i ”Krig och Fred”. Borodino blev inte till ett avgörande utan fransmännen intog Moskva med de 100 000 man som man hade kvar. Huvudstaden var folktom, befolkningen hade utrymts, och tsar Alexander vägrade att skriva på något avtal så inte heller detta kunde ses som en seger. Staden råkade i brand, vintern var på väg och Napoleon tvingades att vända hemåt i oförrättat ärende.
Den svarta stapel som visar reträtten under vintermånaderna är länkad till en temperaturskala i nederkanten. Det var mycket kallt, man svalt och frös. Man kan se hack där stapeln plötsligt blir smalare. Det var vid flodövergångar som innebar förluster. Man rev bondgårdar för att få bromaterial. En sådan övergång kunde ta flera dagar. Kosacker anföll under tiden och det blev ofta panik på bron. Soldater och vagnar, tungt lastade med byte, försvann ner genom isen.
Till slut, sex månader efter man lämnat Moskva var det en spillra på 10 000 man som sågs komma tillbaka över isen på Njemen. Det står en notering i grafen: ”Kosackerna korsar den frusna Njemen i galopp, när de driver ut de spridda resterna av Napoleons stora armé.”
En flodövergång blev särskilt dramatisk: 28 november: Övergången över Berezina.
Häftigt ansatta av fienden kom fransmännen till floden Berezina i närheten av Borisov utan medel att komma över, eftersom Napoleon hade låtit bränna upp hela sin broträng bara sex dagar tidigare. Man skaffade material genom att riva ett par hus vid stranden, och vid Studianka, 40 km ovanför Borisov, slogs under stora svårigheter två broar med bockar såsom stöd. Övergången försiggick i tämligen god ordning, tills ryssarna började anfalla på morgonen 28 november, båda 9:e kåren som skulle skydda övergången och de redan överkomna trupperna.
Då uppstod bland de under föregående natt anlända hoparna av marodörer med hästar och vagnar en förfärlig oreda och trängsel, varunder tusentals människor klämdes ihjäl, nedtrampades eller drunknade bland drivisen i floden.
Marskalk Victor, som kommenderade eftertrupperna, drev flera gånger fienden tillbaka och räddade hären från fullständig undergång. Den 29e på morgonen stacks broarna i brand. De som inte kommit över, rusade i förtvivlan ut på de redan brinnande broarna. Många omkom därvid i lågorna eller i floden. Fransmännen förlorade under dessa dagar 10 000 fångar och en stor del av trossen, men blott några få kanoner. Av 70 000 man kom endast 40 000 över floden.
Minard hade ett budskap med grafen, att visa hur meningslöst krig var, genom att visa hur många meningslösa förluster fälttåget förde med sig.
Varför är Minards graf så bra?
Detta var bakgrundshistorien. Nu till det egentliga ämnet. Varför anser Edward Tufte att Minards graf är så bra? Tufte har ägnat sitt liv åt att fundera på hur man på bästa sätt gör antal och mängder begripliga med hjälp av grafer av olika slag. Han sammanfattar det han kommit fram till i sex principer. I sin bok ställer han Minards graf mot dessa principer, och resultatet är följande.
Princip 1: Visa jämförelser, kontraster och skillnader
Den fundamentala frågan att besvara i statistisk undersökning är ”Jämfört med vad?”. Det viktiga är att göra intelligenta och relevanta jämförelser.
Minards flödeskarta visar framför allt hur och när de franska truppstyrkorna decimeras. Vi kan jämföra bredden av flödeslinjen vid olika punkter för att få föreställning om hur stor skillnaden är vid olika tidpunkter.
Princip 2: Visa orsakssammanhang, mekanismer, förklaring, systematisk struktur
Orsakerna till varför soldaterna blir färre är kanske inte framgår så tydligt i Minards flödeskarta. Men vi ser till exempel att vinterkylan (i motsats till vad som ofta påstås) inte var någon huvudorsak till det franska debaclet. Men Minard visar i varje fall en möjlig orsak till just de förluster som sker under återtåget: vinterkylan. Temperaturskalan är i Réaumur som har samma nollpunkt som Celsius men där 10 grader Réaumur = 12,5 grader Celsius.
Princip 3: Visa multivariabel data, det vill säga sambandet mellan flera variabler som var och en representerar en dimension
Det är när man ställer samman olika dimensioner i en och samma graf som den blir intressant, menar Tufte.
Minard sammanför flera dimensioner av data som tillsammans berättar en historia.
Minards graf har följande fem dimensioner, det vill säga typer av data, som den sammanställer:
- Var
Geografin, det vill säga var armén befinner sig vid varje tillfälle. Dels genom att det finns en tänkt ej utritad nord-syd- och ost-väst-skala och dels genom att vissa orter och floder är utmärkta.
- Storleken av armén
Vid varje tillfälle, antal soldater, dels som bredden på stapeln, dels med siffror bredvid stapeln.
- Framryckning eller reträtt
Röd eller svart stapel.
- När
Datum vid tillfället.
- Temperaturen
Vid tillfället (under återtåget endast).
De fem variablerna, eller dimensionerna, visas med distinkt klarhet. Det finns ingen jargong eller dimridåer i grafen menar Tufte.
Nästan alla de intressanta sammanhang vi försöker förstå är multivariabla till sin natur. Tufte pratar om ”escaping flatland” det vill säga att man med olika grafiska medel försöker visa fler dimensioner i sina grafer än de som den tvådimensionella ytans två axlar ger en direkt möjlighet till.
Princip 4: Integrera text, siffror, bilder och diagram fullständigt
Minard menar att det är viktigt att kombinera olika presentationsformer och att verkligen göra det i samma bild. Text och bild stödjer varandra och kommunicerar tillsammans mera effektivt än var och en för sig.
Minard kombinerar olika presentationsformer i samma bild. Karta, staplar som bildar flödeslinjer, text, samt statistiskt diagram (temperaturskalan i nederkanten).
Minard använder sig av en ljus, tunn omättad färg på flödeslinjen för att ortnamnen ska synas igenom. Det är en teknik som är vanlig i kartor.
Princip 5: Dokumentera
Tufte framhåller att trovärdigheten i en presentation är beroende av kvaliteten och integriteten hos upphovsmannen och dennes källor. Därför är det viktigt att presentationen har dokumentation så man som läsare kan bedöma innehållet. Det är inte bara författare som ska namnges utan även sponsorer så att man kan bedöma intressen och agendor bakom presentationen. Man bör även redovisa källor, noggrant redovisa skalor och andra detaljer.
Minard har tagit med följande dokumentation:
- Titeln
Säger vilken typ av graf det är: figurativ karta och vad det avbildar: De successiva truppförlusterna hos franska armén under den ryska kampanjen 1812–1813.
Tufte menar att vi alltid bör sätta en noggrann och detaljerad titel på det vi producerar. - Vem som har gjort grafen
- Namn och befattning
- När och var den gjordes
- På vems uppdrag och bekostnad
- Vilka källorna är
Minard namnger fem källor. Informationen kommer alltid från någon. Läsaren bör informeras om vem. - Antaganden som gjorts
- Förklaring av färgkodning och skalor
- Beskrivning av vad grafen vill visa
- Vem som tryckt och publicerat grafen.
Vi glömmer ofta att ange den typen av metadata i våra modeller. Det är viktigt för att rätt kunna bedöma och använda en graf, speciellt i efterhand.
Om man publikt anger författarskap så signalerar det till läsaren att någon har tagit ansvar för analysen. Och omvänt, frånvaron av uppgift om författare signalerar att man inte står för det grafen visar. Läsare kan ta kontakt med namngivna författare. Och det räcker inte med företagsnamn. Det är människor som gör saker inte företag. Minard signerade alltid sina grafer. Odokumenterade presentationer är alltid suspekta, menar Tufte.
Princip 6: Innehåll är viktigast
Minard lyfter fram data, låter det tala för sig själv. Det finns inga onödiga dekorationer eller effekter. Allt som är där är data. Han använder minsta möjliga bläck. Färgsättningen är sparsmakad. Den röda färgen är tunn och transparent. (Det är en viktig princip att använda så lite bläck dom möjligt för att presentera så mycket data som möjligt. Tufte kallar det ”black-ink-ratio”. )
Det effektivaste sättet att förbättra en graf är att se till att få bättre data. Dekoration kan aldrig rädda dåligt innehåll. Allt som är där, är där för att lyfta fram innehållet.
Grafen har ett budskap, ett ärende, den berättar en historia. De bästa graferna har en tydlig idé om vad de vill visa. Minard nämner inte ”Napoleon”. Han är gammal soldat och vill visa vad ett fälttåg betyder i praktiken för soldaterna, de skadade, döda, tillfångatagna och deserterande.
Tufte har gjort Minards graf viral
Tufte har gjort Minard och framförallt denna graf berömd. Studenter på statistikutbildningar beställer te-koppar med Minards graf som motiv. Det händer att man har Minards graf som tatuering.
Det finns också de som har försökt förbättra grafen med hjälp av moderna medel som tredimensionella tekniker. Men jag har inte sett något som jag tyckt varit lyckad. Detta visar att vi inte behöver avancerade tekniker för att göra riktigt bra presentationer.
Vad kan vi lära oss? Så här tillämpar jag Tuftes sex principer.
För många år sedan, på jakt efter sätt att utveckla hur vi gestaltar modeller, plöjde jag Tuftes böcker. Jag tycker att hans principer har hjälpt mig. Det har stärkt mig i mina egna försök och tankar. Jag menar att dessa är i högsta grad tillämpliga även för oss som inte gör statistiska grafer utan informationsmodeller, förmågekartor och liknande. Jag ska försöka formulera och exemplifiera på vilket sätt jag har använt mig av dessa principer.
Du kan se resultat av detta i exempel i många tidigare artiklar jag skrivit, även om jag inte alltid refererat till Minard och Tufte. Och fler artiklar kommer framöver. Kanske kan detta också inspirera dig som läser detta.
- Tillämpning av Princip 1: Visa jämförelser, kontraster och skillnader.
Många verksamheter jag arbetat i har haft flera parallella produkt- eller avtalsstrukturer, eller liknande. En del har slagit samman flera företag men ändå fortsatt med separata produktstrukturer. Då har vi skapat en gemensam generisk produktstuktur för att kunna ha en gemensam rapportering och uppföljning. Men vi har ändå behållit de lokala strukturerna för den operativa användningen. Då har de olika delarna av verksamheten fått översätta till den gemensamma begreppsapparaten och strukturerna i sin rapportering. Då har det varit viktigt att i informationsmodellen parallellt visa både de olika lokala strukturerna och samtidigt den generella. Då har jag i ER-diagrammet ritat de olika strukturerna parallellt bredvid varandra så man tydligt ser vilka begrepp som har motsvarighet och ibland att det saknas motsvarighet. Det har varit mycket värdefullt och jag har svårt att se hur man skulle kunna hantera det bättre.
- Tillämpning av Princip 2: Visa orsakssammanhang, mekanismer, förklaring, systematisk struktur
Orsakssammanhang kanske inte är direkt synliga i den typen av modeller jag och mina kollegor gör, vad jag kan komma på. Men mekanismer, förklaringar och systematiska strukturer går till kärnan av det vi visar.
- Tillämpning av Princip 3: Visa multivariabel data
Det här är samma som att våra modeller kan, om vi är skickliga, ordna de företeelser vi beskriver i flera dimensioner samtidigt. Det är viktigt att vi utvecklar den förmågan. Riktigt intressanta grafer ställer samman flera dimensioner säger Tufte, och jag håller med. Jag kommer att ge exempel på detta i senare artiklar.
- Tillämpning av Princip 4: Integrera text, siffror, bilder och diagram fullständigt
Jag strävar efter att kombinera text (strukturerad text) och diagram (olika slags diagram) så mycket det bara går. Jag har visat exempel på detta i en artikel om detta ”Informationsmodellering – Integrera text och grafik” som publicerades 2022-06-23.
- Tillämpning av Princip 5: Dokumentera
Det här är något jag försöker tänka på. Ett sätt att tänka är att en modell alltid är ett dokument och ett dokument har alltid sådan metainformation: Titel, vem som har gjort dokumentet och när, vad det handlar om och så vidare.
- Tillämpning av Princip 6: Innehåll är viktigast
I artikeln ”Maximera innehållet – men snåla med bläcket!” publicerad 2022-06-16 har jag skrivit mer om Tuftes idé runt en minimalistisk design och också givit exempel på hur jag tillämpat detta. Det är den ena sidan av principen, att inte skymma det viktiga innehållet med onödigt bläck. Den andra sidan av principen, att man ska ha något viktigt att visa över huvud taget, det är ett helt annat ämne som går till botten med vad vi gör som informationsarkitekter och varför. Hur ska jag kunna en kort och enkel behandling av det ämnet? Jag tror att det är bäst att hela denna artikelserie på till dags dato 64 artiklar får ge svar på vad min syn är om detta.
Vad tror du?
Vad säger du om Tuftes sex principer? Saknar du någon? Vilka principer tillämpar du när du modellerar? Hur resonerar dina principer med Tuftes?
/Peter Tallungs, IRM
#Informationsarkitektur, #Modellering