Det sorte hullet: Cookies disabled
I webanalyse er det ett begrep som står helt sentralt, nemlig cookies.
Men hvordan vil de besøkende som blokkerer cookies kunne påvirke statistikken?
Les også blogginnleggene «Hva er cookies?» og «Hvordan du bruker cookies» fra 2013.
Knytter hendelser til profiler
Når det gjelder webanalyse benyttes cookies for å knytte flere enkeltstående hendelser til forskjellige brukerprofiler.
Tidslinje - med cookies
La meg illustrere dette med en tidslinje hvor fire forskjellige brukere genererer til sammen ti sidevisninger på et nettsted fra kl. 12:01 til kl. 12:10:
Av dette kan vi utlede denne statistikken:
Sidevisninger | 10 |
Unike besøkende | 4 |
Sidevisninger per besøkende | 2,5 |
Fluktfrekvens | 25 % |
Tid brukt per side | 3:20 |
Tid brukt per besøk | 6:40 |
Tidslinje - uten cookies
Uten cookies ville den samme tidslinjen sett slik ut, hvor det fargerike mangfoldet er redusert til en anonym rekke av sidevisninger:
Og da ville statistikken fortalt oss dette, hvor egentlig bare antall sidevisninger kan slås fast med sikkerhet:
Sidevisninger | 10 |
Unike besøkende | 1-10 |
Sidevisninger per besøkende | 1-10 |
Fluktfrekvens | 0-100 % |
Tid brukt per side | Kan ikke regnes ut |
Tid brukt per besøk | Kan ikke regnes ut |
Når cookies er blokkert
Det finnes sikkert mange grunner til å blokkere cookies i nettleseren. Ofte er ikke dette bevisste valg man gjør selv, men valg Steve Jobs eller IT-sjefen din har gjort for deg.
Hvis vi går ut fra at den «grønne figuren» på tidslinjen vår har blokkert cookies, så vil tidslinjen se slik ut:
Hvordan vil dette påvirke statistikken vår?
Antall sidevisninger kan vi regne ut slik som før, det er fortatt 10.
Men hva med antall unike besøkende?
Vi kan gjøre rede for «blå», «rød» og «gul», men står igjen med 4 sidevisninger fra en eller flere brukere som blokkerer cookies.
Bak disse fire anonyme sidevisningene kan det skjule seg både 1, 2, 3 og 4 unike besøkende.
Forholdsregning
Metoden for å finne ut hvor mange unike besøkende som skjuler seg bak de anonyme sidevisningene er å ta i bruk forholdsregning.
To datasett
Vi deler først inn hele statistikken vår i to separate datasett:
- D1 - Sidevisninger med cookies
- D2 - Sidevisninger uten cookies
Det neste vi gjør er å regne ut statistikken for datasettet D1 alene, uten data fra D2:
D1 | |
Sidevisninger | 6 |
Unike besøkende | 3 |
Sidevisninger per besøkende | 2,0 |
Fluktfrekvens | 33 % |
Tid brukt per side | 4:00 |
Tid brukt per besøk | 6:00 |
Forutsetter lik atferd
Når vi har regnet oss frem til statistikken for D1 gjør vi noe som kan få store følger for den endelige statistikken:
Vi forutsetter at det er lik atferd for brukerne i de to datasettene.
Vi vet allerede at det i datasettet D2 var 4 sidevisninger, og nå forutsetter vi også at det var 2,0 sidevisninger per besøk.
Nå kan vi ta i bruk de fantastiske husketrekantene mine og gå løs på følgende ligning:
Unike besøkende | = | Sidevisninger |
Sidevisninger per besøk |
Unike besøkende | = | 4 | = | 2,0 |
2 |
Med andre ord finner vi at det var 2 unike besøkende i datasettet D2. Legger vi sammen de unike besøkende i de datasettene D1 og D2 finner vi at det totalt var 5 unike besøkende.
Implikasjoner
«There are three kinds of lies: lies, damned lies, and statistics.»
Dette var et veldig lite og avgrenset eksempel med 10 sidevisninger og 4 brukere, men det viser likevel at statistikk kan lyve:
Sannhet | Beregnet | |
Sidevisninger | 10 | 10 |
Unike besøkende | 4 | 5 |
Sidevisninger per besøkende | 2,5 | 2,0 |
Fluktfrekvens | 25 % | 33 % |
Tid brukt per side | 3:20 | 4:00 |
Tid brukt per besøk | 6:40 | 6:00 |
Dette eksempelet er veldig teoretisk og matematisk, og ulike webanalyseverktøy kan ha ulike metoder for å håndtere slike avvik, for eksempel ved at besøkende som ikke støtter cookies utelates helt fra statistikken eller at man har kommet opp med mer sofistikerte beregninger enn det jeg har gått gjennom her.