Hvor mye trafikk får du fra ChatGPT? Her er tallene og metodene
Stadig flere spør: «Gir ChatGPT egentlig trafikk til nettsider?» Svaret er mer nyansert enn man skulle tro - og ja, det kan måles. Her viser jeg hvordan jeg har gjort det, og hva tallene sier.
This blog post is also available in English version
Hva er utm_source og hvordan brukes det av ChatGPT?
Fra høsten 2024 begynte ChatGPT å legge til utm_source
i nettadressene da det ble lenket til de ulike kildene, noe som gjorde det mulig for nettstedene å se denne trafikken i sin statistikk.
Kjapp digresjon: Visste du at utm
er en forkortelse for Urchin Tracking Module? Analyseverktøyet Urchin ble kjøpt av Google i 2005 og fikk året etter navnet Google Analytics. I dag er utm_source
, utm_medium
og utm_campaign
de facto standard for å måle nettrafikk, ikke bare i Google Analytics, men med de fleste analyseverktøyene på markedet.
Dette er hva ChatGPT legger til på noen av de utgående lenkene sine:
https://example.com/mitt-fantastiske-innhold?
For nettstedet jeg tok for meg i april var det kun 18 sessions fra oktober til april som ble registrert som slik trafikk. Altså kun 18 ganger noen klikket seg fra et ChatGPT-resultat og inn til nettstedet mitt.
I samme periode hadde nettstedet rundt 9500 sessions, så trafikken fra ChatGPT utgjorde kun 0,2 % av totaltrafikken.
Bot-trafikk: Mye aktivitet – men lite synlig
Men viser denne statistikken hele sannheten? Er nettstedet mitt praktisk talt usynlig for AI? Er det virkelig null aktivitet?
Nei, for her kommer robotene inn i bildet.
En viktig bestanddel av Internett slik vi kjenner det i dag er roboter, også kjent som bots. Dette er et tema jeg også var innom da jeg skrev om robots.txt i 2013.
Tilbake i 2013 var det stort sett bare crawling for indeksering i søkemotorer disse robotene utførte, og det var et fåtall ulike bots.
Nå 12 år senere har dette endret seg drastisk, og det er utallige forskjellige roboter som surfer rundt på nettet med ulike formål, slik som:
- Crawling av sideinnhold for søkemotorer som Google og Bing
- Sjekk av ads.txt for bekrefte gyldighet for annonseplasseringer
- Sjekk av metadata for å kunne generere en forhåndsvisning når du mottar en lenke på f. eks. Teams eller iMessage
- Crawling og kategorisering av innhold for ulike annonesplattformer
- Skraping av innhold for bruk til analyse og ymse andre formål
En bot fungerer slik at den åpner en nettside, går gjennom innholdet og gjør en handling basert på dette. Denne handlingen kan være å sende innholdet videre for indeksering i en søkemotor. Eller det kan være å lære opp AI-modeller som ChatGPT.
På en drøy måned sjekket disse 107 ulike botene 150 000 nettsider.
Men hva skjer når ChatGPT sjekker en nettside «på direkten» for deg, basert på din instruks?
Slik logget jeg ChatGPTs nettsidebesøk
Trafikk fra bots dukker ikke opp i Google Analytics eller lignende verktøy, da det er trafikk som ofte har liten verdi og skaper mye støy. Og også fordi det teknisk sett ikke lar seg måle med JavaScript.
Men for å komme litt mer til bunns i hvordan ChatGPT oppfører seg ved sjekk av en nettside startet jeg logging av alle gangene en nettside ble lastet av en nettleser som identifiserte seg selv som en bot.
Dette er informasjon man kan trekke ut fra serverlogger, men i mitt tilfelle logget jeg dette i en egen database hver gang en side ble «levert» til en bot. Jeg logget IP-adresse, useragent, URL på nettsiden som ble forespurt og tidspunkt. Stort mer informasjon enn dette er ikke tilgjengelig.
På en drøy måned registrerte jeg hele 107 ulike bots som lastet sidene mine. Og dette var kun de som innholdt «bot» i sin useragent, slik som denne:
Mozilla/5.0 (compatible; Awario
Jeg klarte å identifisere tre ulike bots fra OpenAI som var innom sidene mine:
Bot | Logget useragent |
---|---|
ChatGPT-User | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/ |
GPTBot | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPT |
OAI-SearchBot | Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36; compatible; OAI-Search |
OAI-SearchBot | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; OAI-Search |
Det viser seg at førstnevnte, ChatGPT-User, er den boten som sjekker en nettside for deg «på direkten».
Her er en prompt som spør etter Sandtjern i Finnemarka:
Det som skjer i bakgrunnen når man ber ChatGPT om noe slikt er at den:
- Først vil sjekke et gammelt blogginnlegg om Sandtjern
- Deretter en infoside om Sandtjern
- Og til slutt gjerne også forsiden til selve nettstedet
Og alt dette kan man logge, noe som vil gi et godt bilde av etterspørselen for innholdet, innsikt i hvilket innhold som trender og oversikt over eventuelle forskjeller mellom «menneskelige» sidevisninger og sidevisninger av AI-roboten fra ChatGPT.
Hvor mye menneskelig trafikk kommer fra ChatGPT?
Vil man ta dette et steg videre kan man importere denne trafikken til GA4, slik at «menneskelig» trafikk og ChatGPT-trafikk kan vises side om side.
Det jeg gjør er å gruppere sidevisningene innenfor 5 sekunders intervaller for å lage noe som ligner på sessions eller users: Hvis ChatGPT spør etter 3 nettsider, slik som i eksempelet med Sandtjern i Finnemarka, innenfor 1-2 sekunder, så er det rimelig å anta at disse 3 sidevisningene er relatert til en og samme person og prompt på den andre siden. Altså 3 sidevisninger og 1 user.
Eksempel på rapport som benyttes av Liernett:
Som rapporten i GA4 viser er antall visninger generert av mennesker og antall visninger generert av ChatGPT ganske lik og også jevnt fordelt over tid.
Bryter jeg ned antall users på tid gjennom døgnet de siste 28 dagene følger disse tallene hverandre enda jevnere:
Type nettsted og innhold betyr noe
I eksempelet overfor med Liernett er det omtrent like mye trafikk som ChatGPT genererer som det vanlige besøkende genererer. Men her er det verdt å merke seg at Liernett er et nettavis-arkiv med over 7000 artikler med mye tekst og informasjon. Hvor mye trafikk ulike typer nettsteder har fra ChatGPT vil nok variere i stor grad.
For de andre nettstedene hvor jeg utførte samme eksperiment var resultatet noe annerledes, hvor sidevisninger generert av ChatGPT-prompts utgjør rundt 10 % av totalen:
Klikkprosent og hva det egentlig sier
Innledningsvis stilte jeg spørsmål om hvor mange besøkende et nettsted egentlig får fra AI-modeller som ChatGPT.
Svaret er at det kan være forsvinnende få personer som ender opp inne på nettstedet ditt.
Men som jeg har vist er det teknisk mulig å måle etterspørselen og hvor ofte ChatGPT bruker nettstedet ditt som kilde.
Og har man gjort det kan man regne seg frem til en form for klikkprosent: Hvor mange ganger var du oppgitt som kilde? Hvor mange ganger endte det med et (menneskelig) besøk?
Klikkprosent | = | Sessions med utm_source=chatgpt.com |
Sessions fra ChatGPT-User bot |
Hvis Liernett på 4 uker hadde 1200 sessions fra ChatGPT-User bot, som hadde ledet til 6 sessions (klikk) fra chatgpt.com ville det gitt en klikkprosent på 0,5 %:
6 | = | 0,5 % |
1200 |
Det er først når man kan måle dette over tid og optimalisere mot denne typen trafikk at dette virkelig blir interessant.
Feilkilder og begrensninger du bør kjenne til
Caching: Det er verdt å merke seg at man ikke vet 100 % hvordan en LLM (Large Language Model) som ChatGPT fungerer, til tross for at de oppgir noe informasjon om sine bots. For eksempel er det sannsynlig at noe innhold kanskje hentes fra sider som nylig er cached. Men mine tester viser at det som hovedregel sjekkes minst én side når nettstedet er brukt som kilde.
Andre AI-modeller: Det finnes mange andre AI-modeller enn ChatGPT, ikke minst AI Overview fra Google. Jeg logger alle disse også, men her har det vært noe mer utfordrende å bringe på det rene hvilke bots som eventuelt er direkte knyttet til instrukser fra brukere og hvilke som er knyttet til ordinær crawling. Jeg har for eksempel registrert 24 ulike useragents fra Google.
Manglende utm_source: Selv om ChatGPT begynte med utm_source høsten 2025 har det ikke vært alle lenker som har fått dette hele tiden. Det skilles mellom lenker som dukker opp inne i selve svaret fra ChatGPT, lenker som oppgis som kilder og lenker som listes under «Mer». Sistnevnte fikk først utm_source nå helt nylig (april-mai 2025).
Manglende bots: Det kan også være andre bots som ikke inneholder bots i sin useragent, og derfor heller ikke logges av meg. Et eksempel var Perplexity.ai som jeg i begynnelsen ikke logget, da dette var deres useragent:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Perplexity-User/1.0; +https://perplexity.ai/perplexity-user)
Samtykke: Vanlige (menneskelige) besøkende blir bare målt i Google Analytics når det er gitt samtykke til dette. I mine tall har jeg helt enkelt oppjustert trafikktallene basert på en samtykkefrekvens på 91 % for alle nettstedene. Trafikk generert av bots krever ingen samtykke, da det ikke inneholder persondata.
Mine hovedfunn
- ChatGPT genererer ofte trafikk – men det er oftest bot-trafikk
- Faktisk menneskelig trafikk er lav (ofte <1?%)
- Ved å logge bot-aktivitet får du bedre innsikt enn med Google Analytics alene
- Måling av ChatGPT-klikkprosent gir nye muligheter for optimalisering