Let op de ‘Spooktraffic’ in je webanalytics pakket

Dagelijks kijken we in ons webanalyticspakket naar bezoekersaantallen, conversieratio’s, bounce-percentages etc. om op basis daarvan onze online business bij te sturen. Maar weet je eigenlijk wel zeker dat de bezoekers waarop je je aannames baseert wel échte bezoekers zijn? Het aandeel ‘spooktraffic’ wordt volgens onderzoek namelijk steeds groter. En dat kan onze analyses behoorlijk beïnvloeden.

36% van al het webverkeer is ‘non-human’

Volgens onderzoek van comScore is tegenwoordig 36% van alle webtraffic ‘non-human’. De welbekende search bots zijn hierin ook meegenomen maar er zijn er meer. Het aandeel niet-menselijke webtraffic lag in 2011 nog rond de 6% volgens comScore. Een flinke stijging dus. Het is daarom belangrijk je webanalyticspakket ‘schoon’ te houden. Je rekent jezelf anders te rijk – in het geval van bezoekersaantallen – of te arm, kijkend naar conversie- en bounce ratio’s.

In onderstaande grafiek zie je de impact van bot traffic die opeens arriveert, een periode dagelijkse traffic aflevert en ook weer plotseling vertrekt (dit voorbeeld is van een grote Nederlandse website).

spooktraffic1

Helaas werd hier pas gedetecteerd dat ‘non-human traffic’ de totalen verstoorde toen de spooktraffic plotseling wegviel (en niet toen deze aanving). Je kunt je dan in allerlei bochten wringen om business oorzaken aan te wijzen voor een teruglopend bezoekersaantal, terwijl de verklaring simpelweg ligt in een vervuild analyticspakket.

Non-human traffic, of spooktraffic, kan de resultaten van je websiteanalyse beïnvloeden.

Hoe herken ik spooktraffic?

Niet-menselijke traffic kun je het makkelijkste herkennen in de ‘technische’ rapportages in Google Analytics. Google zorgt er uiteraard voor dat de belangrijkste search spiders al worden uitgesloten in Analytics. Maar vele andere ‘smart bots’ niet. Die zul je echt zelf moeten uitsluiten.

De makkelijkste manier om deze spooktraffic te herkennen is om te kijken naar het ‘Service Provider’ rapport in Analytics (Doelgroep / Technologie / Netwerk / Serviceprovider). Fake traffic kenmerkt zichtzelf in deze rapportage door 100% nieuwe bezoekers, het aantal pagina’s per bezoek is 1, de bounce rate 100% en de tijd op de pagina 0 seconden. De herkomstbron is ‘Direct’ dus de data op voorhand segmenteren naar ‘Alleen Direct verkeer’ helpt in de zoektocht naar spooktraffic.

spooktraffic2

Wat kan ik doen aan deze spooktraffic?

De enige manier om er vanaf te komen is om dit verkeer via een ‘Filter’ te verwijderen uit de Google Analytics rapportages. Een filter in Google Analytics werkt echter niet op historische data dus hoe sneller je de spooktraffic uitsluit, hoe zuiverder je rapportages blijven.

spooktraffic3

Zorg er dus voor dat je met regelmaat je Analytics systemen controleert op spooktraffic. Het kan je analyse aardig in de weg zitten, de resultaten vertekenen en met terugwerkende kracht filter je het niet weg uit Analytics. Wees waakzaam!

Reacties (19)

  1. reinoutw@hotmail.com'

    Nice! Leuk artikel. Om het ‘historische’ probleem op te lossen zou je ook kunnen werken met een segment / filter in je rapportage, op basis waarvan je de data die voldoet aan de botkenmerken eruit haalt / los van je normale data ziet?

    Ik zit overigens even te kijken op één van m’n eigen sites en zie wel een paar honderd providers die voldoen aan die kenmerken…

    [edit] om precies te zijn: 332 😀

    • eganvandoorn@gmail.com'

      Dank voor je aanvulling Reinout. Een segment werkt natuurlijk ook voor historische traffic. Alleen moet je er steeds aan denken om deze aan te zetten 🙂

  2. johan@growingpeople.nl'

    Interessant, nooit bij stilgestaan.

    Als ik het in m’n rapporten opzoek zie ik wel erg veel service providers die aan deze criteria voldoen. Daar zitten ook de Basisschool Weidebloem en Camping de Helfterkamp bij..

    Wat hebben deze camping en deze basisschool dan voor bots die mijn site bezoeken?

    • eganvandoorn@gmail.com'

      Dank je wel voor je reactie Johan. Het gaat uiteraard wel om providers die relatief veel traffic sturen en allemaal aan deze kenmerken voldoen. Een enkele bezoeker kan natuurlijk best 100% nieuw, 1 pagina bekijken en daarmee 0 seconden de site bezoeken. Dat is geen ‘bot’.

  3. jorden.lentze@gmail.com'

    Hoi Egan,

    Nice!Leuk artikel 🙂

    Weet je misschien ook hoe Omniture met bots omgaat?

    En ga je ook weer naar #measurebowling?

  4. contact@riannejacobs.nl'

    Interessant artikel, Egan!

    Toevallig stuitte ik afgelopen week op een botje. Het viel me op dat bij een van de events die getracked wordt wel heel vaak dezelfde invoer gegeven werd in een veld waar om plaatsnaam wordt gevraagd. Even verder zoeken bleek dit een tooltje dat door IT wordt ingezet en waarmee om de 5 minuten wordt getest of de site nog goed werkt. Uiteraard direct uitgefilterd.

    Deze bot laat echter andere waarden zien dan die jij in je artikel aangeeft: wel 100% nieuwe bezoeken, maar een bounce percentage van maar 49% en 10,25 pagina’s per bezoek.

    Naar aanleiding hiervan ben ik even verder gaan kijken en ook microsoft corp laat bij mij andere waarden zien: bounce van 99,56%, 1,02 pagina per bezoek.

    Mijn advies is dus om niet exact te filteren op de door jouw gegeven waarden, maar even door de serviceproviders heen te lopen. Filter op alle providers die een conversieratio van 0,00% laten zien (bij een e-commercesite). Zitten hier serviceproviders tussen met behoorlijke bezoekaantallen? Neem die even verder onder de loep.

    • eganvandoorn@gmail.com'

      Dank je wel voor je reactie en aanvulling Rianne. Ik kwam toevallig bij een opdrachtgever ook recentelijk een ‘scraper’ tegen die continue een aantal pagina’s van de site doorliep om bepaalde content te bereiken (meer dan 1 pagina dus).

  5. efusemarketing@gmail.com'

    Hi Egan,

    Top tip. De teller staat bij mij op 1000+ die voldoen aan jouw criteria. Meting is over een periode van 1 maand.

    Mij is alleen niet helemaal duidelijk hoe ik deze er nu uit ga filteren. Wat moet ik nu invullen bij ‘Filterpatroon’?

    Bij voorbaat dankbaar

    • eganvandoorn@gmail.com'

      Hoi Jan Daan, Dank je wel voor je reactie. 1000+ klinkt als veel. Check goed of het om ‘non human’ traffic gaat. Het gaat dan uiteraard wel om de grotere volumes. Eén enkele bezoeker kan natuurlijk best aan de kenmerken voldoen en toch een ‘echte’ bezoeker zijn.

  6. info@phonextra.nl'

    Ik heb dezelfde vraag als JanDaan. Ik het vakje filterpatroon mogen maar 255 teken… En in 450 servicepr0viders…. Dat zijn bijna 9000 tekens, excl. spaties… Dus als jullie svp stap voor stap kunnen uitleggen hoe het moet, graag…

  7. info@phonextra.nl'

    Ik heb dezelfde vraag als JanDaan. Ik het vakje filterpatroon mogen maar 255 teken… En ik heb 450 servicepr0viders…. Dat zijn bijna 9000 tekens, excl. spaties… Dus als jullie svp stap voor stap kunnen uitleggen hoe het moet, graag…

Reacties zijn gesloten.