Enige tijd geleden las ik een artikel in het blad Fietssport van de Nederlandse Toerfiets Unie (NTFU) waarin zij trots vertelde over de groei die hun ledenaantal de afgelopen jaren door had gemaakt. Om dit verhaal te ondersteunen was de onderstaande grafiek aan het artikel toegevoegd.
Voor het gemak heb ik hem even nagemaakt in Excel. Ik heb de waarden geschat en in een tabel gezet. Nadat ik vervolgens een lijngrafiek ervan maakte kwam exact de grafiek tevoorschijn die in het magazine stond.
In eerste oogopslag is er nogal wat mis met deze grafiek wat hem lastig te lezen maakt:
- De legenda is omgekeerd ten opzichte van de lijnen in de grafiek
- De verticale as begint niet bij 0 (later meer hierover)
- Er staat 1 t/m 12 als labels bij de horizontale as
En dit zijn puur esthetische problemen. Welk bericht wil de schrijver eigenlijk overbrengen. 35% stijging staat erbij vermeld, maar hoe zie ik dat terug in de grafiek? Deze grafiek ondersteund zijn verhaal wat mij betreft niet echt, of de schrijver maakt er op z’n minst een zoekplaatje van.
Dus tijd om wat verbeteringen aan te brengen aan de visualisatie. Eerste de esthetische problemen aanpakken.
- Excel biedt beperkte mogelijkheden om de legenda aan te passen en ik vond geen geschikte plaats rondom de grafiek die direct duidelijk maakte welke lijn overeenkomt met welk jaar. In plaats daarvan heb ik daarom de het jaartal als label bij de lijn gezet.
- Het is goed gebruik om de assen bij 0 te laten beginnen, maar in dit geval vind ik dat het wegneemt van de leesbaarheid als je dat doet, de lijnen komen in dat geval veel te dicht bij elkaar te staan. We starten de as dus gewoon op 35000.
- Een simpele verbetering die de leesbaarheid vergroot is niet de nummers van de maanden te tonen, maar de namen of afkortingen.
- De datapunten heb ik veranderd zodat deze boven de maatstreepjes staan. Dit is een heel subtiel verschil maar dit komt omdat ik er vanuit ga dat de waarde die getoond wordt de eindstand van de maand is (en daarmee de beginstand van de volgende maand). Als je de waarde tussen de maatstreepjes zet dan wordt de suggestie gewekt dat het om een gemiddelde waarde gaat, wat ik onwaarschijnlijk beschouw.
- De kleuren kun je ook nog afstemmen op een eventuele styleguide, maar deze laat ik nu zo.
Bovenstaande aanpassingen maken de grafiek al wat leesbaarder. Maar ondersteund het het verhaal van de schrijver? Natuurlijk is te zien dat over de jaren heen het aantal leden toeneemt, maar is dat wel duidelijk zichtbaar op deze manier? Stel dat we een visualisatie kiezen die gebruikelijk is bij het presenteren van de koers van een aandeel?
Leuk, anders, maar nog niet een goede ondersteuning van het verhaal wat mij betreft. Een volgende stap om de leesbaarheid te vergroten is het weglaten van details. Waarom zouden we aantallen per maand laten zien als we geïnteresseerd zijn in de groei die in een aantal jaren heeft plaatsgevonden? Begrijp me niet verkeerd, de details bevatten interessante inzichten, maar niet om de groei te laten zien. Vandaar de volgende presentatie:
Met dezelfde informatie (de ledenaantallen) zijn nog andere metrics te maken, bijvoorbeeld de absolute en procentuele groei per jaar. Hierin wordt zichtbaar dat er een gestage groei van de groei is.
Met deze informatie is er nog een ander soort visualisatie te maken om de groei van het ledenaantal weer te geven. We plussen en minnen het aantal leden ten opzichte van een startaantal.
Als laatste de volgende visualisatie. De details van de maanden die we net weggelaten hebben tonen wel een mooi patroon wat elk jaar terug komt en wat zichtbaar wordt als we de gemiddelde groei per maand visualiseren.
Ik heb geprobeerd te laten zien dat er diverse mogelijkheden zijn met de cijfers in de grafiek. De keuze voor een visualisatie en het detail aan informatie wat getoond moet worden is heel erg afhankelijk van het verhaal dat je probeert te vertellen.
(overigens heb ik de geclaimde groei van 35% niet kunnen vinden in de onderliggende gegevens…)