Funda.nl: Meer dan 1.000.000 unieke pagina’s per dag, wat moet je ermee?
Een klein stukje geschiedenis
Een krap jaar geleden liep het contract met Omniture HBX af en besloten wij over te stappen op Google Analytics (GA). Het overstappen van een grote “industry standard” tool als HBX naar het gratis GA was voor een high traffic site als funda best spannend. We hebben hier dan ook veel geleerd. Dit is ook de reden dat ik mijn ervaringen over de migratie en enkele “best practices” met jullie wil delen. Ik heb het idee dat er best veel “grote” site’s zijn die best wel willen overstappen, maar het nog niet durven.
Wat moet je met meer dan 1.000.000 unieke pagina’s per dag?
In het verleden werd de web analytics (WA) tool zodanig ingericht dat deze alles, maar dan ook alles, meette. Iedere klik en pagina op site werd gelogd in HBX. Het idee was om eerst alles te meten en daarna maar eens te gaan kijken wat we met de data zouden gaan doen. De vragen zouden vanzelf wel onstaan was het idee. Helaas bleek zo’n overload aan data voor niemand werkbaar. De gebruikersvragen bleken namelijk vrij globaal te zijn. Bijvoorbeeld: Hoeveel zoekopdrachten worden er gedaan per site onderdeel en hoeveel huizen worden er bekeken per onderdeel van de site. Veel diepgaander vragen dan dit kwamen niet aan de orde. Verder liet de gebruikers interface van HBX ook behoorlijk te wensen over. Dit was mede de reden dat WA weinig leefde onder de mensen.
Makelaars hebben een eigen statistieken omgeving los van WA tools. Hiermee kunnen zij zien hoe vaak een huis onder andere gevonden en bekeken wordt. Deze informatie wordt door hen gebruikt om onder andere aan klanten door te geven. Wij slaan dus weldegelijk specifieke data op, maar hebben deze niet nodig voor dagelijkse analyse vraagstukken.
Tag je pagina’s
Toen wij geconcludeerd hadden dat wij geen behoefte hadden zoveel data was gelijk één van de grootste drempels om met GA in zee te gaan overwonnen. GA kent namelijk een limiet van 50.000 unieke pagina’s per dag. Boven de 50.000 worden de pagina’s opgeslagen onder de content sectie “Other”. In ons geval, tijdens een test, liep dit getal al snel op tot ruim boven de 200.000.000 pagina’s. In eerste instantie waren wij in de veronderstelling dat er nog data in een queue stond en later wel ingelopen zou worden.

We besloten om alle soorten pagina’s te gaan benoemen in een tagging document. Dit resulteerde in een lijst van ~300 verschillende pagina namen. Denk hierbij aan bijvoorbeeld de resultaatlijst, object overzicht pagina, object foto pagina, kaart, homepage, etc.. Deze pagina namen werden voor alle onderdelen van de site (koop, huur, nieuwbouw, recreatie, etc.) zoveel mogelijk gelijk gehouden. Dit om de leesbaarheid te bevorderen. Ook hebben we ons best gedaan om de naamgeving zo duidelijk mogelijk te maken en in lijn te laten met woorden/termen die wij binnen funda gebruiken.
Enkele voorbeelden
Object detail pagina van een huis in de Eerste Helmersstraat 79 in Amsterdam:
GA tag: “pageTracker._trackPageview(“koop/nvm/object-overzicht”);”
GA tag in detail
- koop: “koop” onderdeel van de site
- nvm: makelaarsvereniging, we hebben er meedere
- object-overzicht: Objecte overzicht pagina
Resultaatlijst van een zoekopdracht in Amsterdam tussen 450.000 en 550.000:
GA tag: “pageTracker._trackPageview(“koop/resultaatlijst”)”
GA tag in detail:
- koop: “koop” onderdeel van de site
- resultaatlijst: zoekresultaten pagina

Pagina vergeten te taggen?
Het kan natuurlijk altijd voorkomen dat een pagina geen tag heeft. Dit kan bijvoorbeeld gebeuren doordat:
- het betreft een nieuwe pagina;
- je bent hem domweg vergeten;
- url van de pagina is anders (geworden);
- case sensitivity van het url.
In deze gevallen zorgen wij er voor dat deze pagina niet wegvallen in GA, maar een default tagname krijgen. Deze default tagname begint altijd met “niet_gecategoriseerd_” gevolgd door het URL.
Bijvoorbeeld: “/niet_gecategoriseerd_http://www.funda.nl/fout/ObjectNotFound.aspx?zoekurl=~/koop/”
Op deze manier verlies je pagina’s niet uit oog. Zo nu en dan gaan we lijst met “niet_gecategoriseerd_” pagina’s door en geven deze dan de juiste tagname.

Nadelen?
Tja, niet echt. Er zijn een paar functies die niet meer werken zoals de site overlay en de links in GA naar de desbetreffende pagina op funda. Dit omdat het virtuele pagina’s zijn geworden.
Tagging document
Mocht je geinteresseerd zijn in deze methode, dan heb ik een voorbeeld van het tagging document online gezet. Dit document kun je gebruiken om tagnames samen te stellen. Geef een site onderdeel en een naam van de pagina op en in de laatste kolom verschijnt dan de javascript GA tag.
Tijdens de implementatie hebben wij veel lol gehad van het tooltje genaamd WASP. Deze plugin nestelt zich in Firefox en laat je razendsnel zien in de sidebar welke informatie meegegeven wordt aan GA. Voordeel is dat je niet constant ´view source´ hoeft te doen. Voor de geavanceerde gebruikers. Je kunt zelfs een script maken van pagina´s die WASP moet aflopen. De resultaten worden dan netjes in een logfile weggeschreven.
Aart Nicolai, 13 jaar werkzaam in de internet wereld, waarvan de afgelopen 6 jaar bij funda.nl. Bij funda ben ik verantwoordelijk voor Web Analytics en Business Intelligence. Hiernaast ben ik project manager voor verschillende leuke...
Lees verder »Nieuwsbrief
Voortdurend op de hoogte van het laatste analytics en optimalisaties nieuws met onze nieuwsbrief!
Gebruik je al GhostRec?
Deze Screen recording software wordt in Nederland onder andere gebruikt door
Lees meer over GhostRecAangeboden door AboutAnalyticsNieuwste reacties
- the pilatesbiz: Hi there! Quick question thats entirely off topic. Do you know how to make your site mobile friendly? My web site looks...
- Leendert: Als ik het nu zo kijk heeft independer dit met de lening site wel aangepast. Ik vind dit een interessante materie. Al...
- Jan de Vries: Dank Michel voor je tip!
- Michel Kompanje: Leuke site om in de gaten te houden is http://visual.ly/. Binnenkort kun je hier op een gemakkelijker manier je eigen...
7 reacties
Leuk om te zien hoe jullie zijn omgegaan met deze berg aan data. Wat ik me wel afvraag: zijn de vragen op dit moment nog steeds zo beperkt als in de tijd dat jullie HBX hadden draaien? Met andere woorden: voldoet Google Analytics nog steeds? Of hebben jullie nog BI/MI tools om deze vragen te beantwoorden?
[webanalist_mode]Bij het horen van de getallen (maar ook bij het zien welke informatie – niet – wordt gemeten) beginnen mijn handen te jeuken
[/webanalist_mode]
Complimenten voor de gedurfde stap en de complexe uitvoering daarvan. Nu denk ik wel dat niet de tool bepaalt hoe de organisatie met de waardevolle data omgaat maar de integratie van Web Analytics als geheel bepaalt hierin het succes. Hebben jullie ook deze processen opnieuw bekeken en hierin verandering aangebracht? Wat zijn na kostenbesparing de andere benefits die jullie hebben ervaren?
Verstandig om het zo te doen. Erg leuk om te lezen; exact dezelfde situatie (ook voor een huizensite) heb ik zelf ook aan de hand gehad bij een klant.
De oplossing was ongeveer hetzelfde: geef pagina’s een functionele naam. Zoekresultaat, objectdetail, fotopagina, mail-naar-een-vriend, etc.
Verder hadden we dimensies aangemaakt voor object-id, prijs, lokatie, makelaar. Gebruikte tool was Moniforce webSensor.
Zo konden we makkelijk makelaars van informatie voorzien over het kijkgedrag voor hun objecten, bezoekers typeren, populariteit op prijsklasse/locatie bepalen, etc.
Bedankt voor het delen van de ervaringen, dit soort showcases zijn altijd leuk om te zien.
Ik heb wel een aantal vragen:
Hebben jullie ook custom variables (en hadden jullie deze ook bij de HBX implementatie) en event tracking ingezet?
Is Google Analytics ook vergeleken met Yahoo Analytics voordat de beslissing gemaakt werd?
Bedankt voor de enthousiaste reacties en vooral ook leuk omte zien dat er meerdere site’s in dezelfde situatie verkeerden als wij.
@Reinout: Door het inzetten van GA is aantal de vragen groter geworden. Vroeger kon bijna niets zonder een consultant in te schakelen. Tegenwoordig besteed ik tijd aan workshop en persoonlijke uitleg om data naar boven te halen. Dit wordt erg gewaardeerd. Je ziet dit ook in het soort vragen wat je krijgt, deze worden geavanceerder. Verder hebben we ook een BI omgeving waar we al onze productie databases op aangesloten hebben. Deze wordt met name gebruikt voor omzet/afzet vraagstukken alsmede object informatie. Het plan is wel om GA data er op den duur in te stoppen.
@Jan de Vries: Mee eens, maar het gebruik van een gebruiksvriendelijke tool en de bekende Google interface hebben zeker bijgedragen aan het succes binnen het bedrijf. Verder is het zo dat de GA community zo veel groter is dan de meer gesloten communities van HBX bijvoorbeeld. Je kunt veel sneller schakelen. Processen hebben we verder niet veranderd, maar hebben mensen slechts betere tools gegeven. Met behulp van workshops willen we de kennis paraat houden.
Andere voordelen: beter en meer gebruik, sneller nieuwe features installeren denk aan bijvoorbeeld video tracking.
@Donovan van der Roest: Custom variables hebben we nog niet ingezet. Ik moet nog even onderzoeken wat ik precies wil meten. Er is wel behoefte om gebruikers van de site in te delen in bepaalde groepen. Denk aan bijvoorbeeld fun zoekers t.o.v. serieuze zoekers of mensen die harde of zachte leads hebben gegenereerd hebben. Met event tracking zijn we serieus bezig, in mijn volgende blog zal ik daar een stuk over schrijven. We hebben daar leuke ervaringen mee. in HBX hebben we wel getracht om iets te doen met custom variables, maar dit is nooit goed van de grond gekomen.
YWA is ook ter sprake gekomen. Het mooie was dat je user’s kan volgen. Omdat de toekomst YWA onzeker is, hebben we er niet voor gekozen.
Dank voor je snelle reactie en mooi om te zien dat het dit jullie heeft gebracht
. En jij kan je nu bezig houden, samen met de mensen, met het vertalen van data naar actions en insights zoals het hoort. Nogmaals Top en bedankt voor het delen.
Bedankt voor je reactie Aart, ik ben zeer benieuwd naar de vervolg artikelen!