Relevans har stor verdi

Optimalisering på innhold, ikke nøkkelord.

Nedenfor vises en helt typisk artikkel på nettavisen Liernett. Artikkelen handler om Jordbæreventyret, et arrangement i Sylling.

Denne artikkelen har blitt merket med både relevante kategorier (seksjoner) og etiketter (nøkkelord, tags). Etikettene er blant annet «Jordbæreventyret» og «Sylling».

artikkel.jpg
http://www.liernett.no/5499-jordbaerkonge-hekser-og-troll-i-sylling

Nederst i hver artikkel på Liernett vises det et utvalg andre artikler som man ønsker at leseren skal fatte interesse for. Her har det blitt vist artikler som er tilknyttet samme kategorier og etiketter.

Men kan man gjøre det bedre enn dette?

Jeg har tidligere tatt i bruk søkefunksjonalitet som baserer seg på Full text search. I et slikt søk gjennomgås alle ordene i samtlige artikler og resultatet som returneres er basert på hvor stor relevans det er mellom søkeordene og ordene i artiklene.

Hva om jeg gjør det samme for å vise artikler som er relatert til det man nettopp har lest? Jeg brukte den samme logikken, men i stedet for å bruke en søkestreng som brukeren oppgir i søkefeltet, tok jeg utgangspunkt i hele den leste artikkelens innhold. Jeg tok tittel, innledning og brødtekst, strippet det for all html og brukte det som søkestreng i stedet.

Det så ut til at dette ga bedre relevans enn kategorisering gjort av redaksjonen. Men for å kontrollere at dette faktisk ga økt respons valgte jeg å kjøre en A/B-test:

Jeg kjørte 50 % av sidevisningene med standard løsning (kategorier og etiketter) og 50 % med løsningen basert på fulltext og relevans. Jeg målte klikkene på de forskjellige løsningene med aktivitetssporing i Google Analytics.
Forsøket ble gjort på samtlige av Liernetts artikler.

Etter 19 dager er resultatet ganske klart:
Den nye løsningen basert på relevans fikk nærmere dobbelt så høy klikkprosent.

Den gamle løsningen fikk 50 % av visningene og 34 % av klikkene.
Den nye løsningen fikk også 50 % av visningene, men hele 66 % av klikkene.
Dette betyr en økning på hele 92 %.

Gammel løsning (venstre) og ny løsning (høyre) for artikkelen nevnt innledningsvis:
bunnsiste.jpg

Jeg har også en ny løsning på gang:
Hvilke artikler man har lest logges i en cookie, og man vil da ikke få presentert disse artiklene igjen. Mer om dette eksperimentet kommer senere.

Svend Asbjørn Sylling, 8. november 2011

Bloggen fra Sylling Hardcode