Sanne blauw

Hoe verdedig je jezelf tegen misleidende data?

Sanne Blauw is econometrist en journalist bij De Correspondent waar ze schrijft over data en statistiek. De correspondent is een onafhankelijk en advertentie-vrij platform, dat voornamelijk artikelen publiceert die verder kijken dan het nieuws van de dag en focussen op achtergrond, trends en analyse. Vanuit haar opleiding weet Sanne maar al te goed hoe veel mensen gegevens misbruiken om te bewijzen dat wat ze zeggen waar is, terwijl dat niet zo is. Een fenomeen dat jammer genoeg in bijna iedere organisatie de werkelijkheid is. Tijdens haar presentatie op Conversion Hotel 2017 deelde ze de 5 meest gebruikelijke fouten bij het interpreteren van gegevens.

Sanne Blauw

Sanne Blauw @ CH2017

Data helpt ons de wereld om ons heen te begrijpen. Precies om deze reden is het nieuws ook gek op cijfers. Maar hier gaat iets mis. Nummers worden vaak verkeerd weergegeven of verkeerd geïnterpreteerd door politici en journalisten. En dat is gevaarlijk aangezien ze de mening van veel mensen beïnvloeden.

Journalisten gebruiken cijfers vaak om hun argumenten te onderbouwen. Vanuit hun professionaliteit hebben ze geleerd voorzichtig te zijn met hun bronnen, maar helaas zien we deze voorzichtigheid niet terug in de selectie en presentatie van data. De data zelf is onschuldig, maar zodra mensen data proberen te interpreteren kan er van alles mis gaan. Iets dat grote gevolgen kan hebben voor ons wereldbeeld. Volgens Sanne Blauw moeten journalisten en politici om precies deze reden hun kennis over statistiek en de interpretatie van data vergroten.

De 5 meest gebruikelijke fouten bij het interpreteren van gegevens

  • The good looking graph: Vervormde gegevens in je grafiek zullen de interpretatie van de volledige gegevens beïnvloeden. Haal je bijvoorbeeld de laatste drie staven weg uit een grafiek of start je een grafiek niet op 0 dan kan het beeld ineens compleet anders zijn.
  • The polluted poll: je steekproef is in veel gevallen vertekend door de mensen die hebben gereageerd op bijvoorbeeld je enquête.
  • The overconfident decimal point: Hiervan is sprake wanneer numerieke gegevens worden gepresenteerd op een manier die betere precisie impliceert dan gerechtvaardigd is. Omdat nauwkeurigheid een voorwaarde is voor betrouwbaarheid leidt dit vaak tot een overschatting van de betrouwbaarheid. Maar het is helaas niet zo eenvoudig om nauwkeurige resultaten te vinden, dus trek je conclusies niet te gemakkelijk.
  • The not so spectacular statistics (Tom cruise-statistieken): Cijfers kunnen indrukwekkend zijn, maar alles is afhankelijk van context. We moeten ons altijd afvragen in welke context we de inhoud plaatsen.
  • The cocky correlation: Je zult altijd correlaties vinden als je ernaar op zoek gaat. Dit is absoluut de gevaarlijkste van alle gebruikelijke fouten bij het interpreteren van gegevens. Correlatie is geen causaliteit.

Ook als webanalist deel je constant je bevindingen en probeer je dit op de meest aantrekkelijke en duidelijke manier te doen. Het is daarom goed om altijd even stil te staan bij de presentatie van je data.

Wil je meer weten over Conversion Hotel of de presentatie van Sanne Blauw? Klik dan hier voor meer informatie over de conferentie, de sprekers, de slides en aantekeningen van de presentaties tijdens Conversion Hotel 2017.

Sanne Blauw

Reacties (1) Schrijf een reactie

  1. Interresante blog Sanne, ik merk vaak dat er in de politiek vaak cijfers worden gegeven om voordelen aan te kaarten. Waardoor mensen en journalisten het klakkeloos overnemen

    Beantwoord

Geef een reactie

Verplichte velden zijn gemarkeerd met een *.