Det sorte hullet: Cookies disabled

I webanalyse er det ett begrep som står helt sentralt, nemlig cookies.

Men hvordan vil de besøkende som blokkerer cookies kunne påvirke statistikken?

Les også blogginnleggene «Hva er cookies?» og «Hvordan du bruker cookies» fra 2013.

Knytter hendelser til profiler

Når det gjelder webanalyse benyttes cookies for å knytte flere enkeltstående hendelser til forskjellige brukerprofiler.

Tidslinje - med cookies

La meg illustrere dette med en tidslinje hvor fire forskjellige brukere genererer til sammen ti sidevisninger på et nettsted fra kl. 12:01 til kl. 12:10:

cookiefritt-ingen-anonyme.png

Av dette kan vi utlede denne statistikken:

Sidevisninger 10
Unike besøkende 4
Sidevisninger per besøkende 2,5
Fluktfrekvens 25 %
Tid brukt per side 3:20
Tid brukt per besøk 6:40

Tidslinje - uten cookies

Uten cookies ville den samme tidslinjen sett slik ut, hvor det fargerike mangfoldet er redusert til en anonym rekke av sidevisninger:

cookiefritt-alle-anonyme.png

Og da ville statistikken fortalt oss dette, hvor egentlig bare antall sidevisninger kan slås fast med sikkerhet:

Sidevisninger 10
Unike besøkende 1-10
Sidevisninger per besøkende 1-10
Fluktfrekvens 0-100 %
Tid brukt per side Kan ikke regnes ut
Tid brukt per besøk Kan ikke regnes ut

Når cookies er blokkert

Det finnes sikkert mange grunner til å blokkere cookies i nettleseren. Ofte er ikke dette bevisste valg man gjør selv, men valg Steve Jobs eller IT-sjefen din har gjort for deg.

Hvis vi går ut fra at den «grønne figuren» på tidslinjen vår har blokkert cookies, så vil tidslinjen se slik ut:

cookiefritt-noen-anonyme.png

Hvordan vil dette påvirke statistikken vår?

Antall sidevisninger kan vi regne ut slik som før, det er fortatt 10.

Men hva med antall unike besøkende?

Vi kan gjøre rede for «blå», «rød» og «gul», men står igjen med 4 sidevisninger fra en eller flere brukere som blokkerer cookies.

Bak disse fire anonyme sidevisningene kan det skjule seg både 1, 2, 3 og 4 unike besøkende.

Forholdsregning

Metoden for å finne ut hvor mange unike besøkende som skjuler seg bak de anonyme sidevisningene er å ta i bruk forholdsregning.

To datasett

Vi deler først inn hele statistikken vår i to separate datasett:

  • D1 - Sidevisninger med cookies
  • D2 - Sidevisninger uten cookies

cookiefritt-to-datasett.png

Det neste vi gjør er å regne ut statistikken for datasettet D1 alene, uten data fra D2:

D1
Sidevisninger 6
Unike besøkende 3
Sidevisninger per besøkende 2,0
Fluktfrekvens 33 %
Tid brukt per side 4:00
Tid brukt per besøk 6:00

Forutsetter lik atferd

Når vi har regnet oss frem til statistikken for D1 gjør vi noe som kan få store følger for den endelige statistikken:

Vi forutsetter at det er lik atferd for brukerne i de to datasettene.

Vi vet allerede at det i datasettet D2 var 4 sidevisninger, og nå forutsetter vi også at det var 2,0 sidevisninger per besøk.

Nå kan vi ta i bruk de fantastiske husketrekantene mine og gå løs på følgende ligning:

Unike besøkende = Sidevisninger
Sidevisninger per besøk

Unike besøkende = 4 = 2,0
2

Med andre ord finner vi at det var 2 unike besøkende i datasettet D2. Legger vi sammen de unike besøkende i de datasettene D1 og D2 finner vi at det totalt var 5 unike besøkende.

Implikasjoner

«There are three kinds of lies: lies, damned lies, and statistics.»

Dette var et veldig lite og avgrenset eksempel med 10 sidevisninger og 4 brukere, men det viser likevel at statistikk kan lyve:

Sannhet Beregnet
Sidevisninger 10 10
Unike besøkende 4 5
Sidevisninger per besøkende 2,5 2,0
Fluktfrekvens 25 % 33 %
Tid brukt per side 3:20 4:00
Tid brukt per besøk 6:40 6:00

Dette eksempelet er veldig teoretisk og matematisk, og ulike webanalyseverktøy kan ha ulike metoder for å håndtere slike avvik, for eksempel ved at besøkende som ikke støtter cookies utelates helt fra statistikken eller at man har kommet opp med mer sofistikerte beregninger enn det jeg har gått gjennom her.

Svend Asbjørn Sylling, 27. februar 2015

Bloggen fra Sylling Hardcode