Hoe werkt Google? Ontdek hoe zoekresultaten worden gegenereerd

Hoe werkt Google? Ontdek hoe de zoekresultaten worden gegenereerd

Op mijn blog lees je veel over zoekmachine-optimalisatie en wat je er zelf zoal aan kunt doen. Maar hoe zit de grootste zoekmachine nu in elkaar en hoe werkt die? Dat is ook wel eens interessant om te weten.

Waarom Google?

De focus op Google is omdat deze zoekmachine met overmacht de grootste is. In Nederland sowieso, met rond de 90% marktaandeel in de zoekopdrachten op desktop (dat schommelt wel wat) en met zelfs fors meer dan 90% op mobiel. Wereldwijd liggen de percentages wat lager, waar vooral in de VS nogal wat onduidelijkheid en discussie over is.

Bing en DuckDuckGo in opkomst

Er zijn 2 zoekmachines in opkomst op het moment: Bing en DuckDuckGo. DuckDuckGo is een privacyvriendelijke zoekmachine, die daarom in relatieve zin fors groeit. In absolute zin is het marktaandeel van DuckDuckGo te verwaarlozen. Wat niet wil zeggen dat er geen potentie in zit.

Bing is van Microsoft en wordt gepusht door Microsoft aan gebruikers van Windows. De standaard zoekmachine in Windows en de persoonlijke assistent Cortana in Windows is uiteraard Bing. En op wat andere stiekeme manieren probeert Microsoft hun browser Edge en zoekmachine Bing stiekem wel wat af te dwingen. Ook Bing zit daardoor ietsje in de lift. Niettemin blijft Google veruit de grootste zoekmachine ter wereld. En hoe werkt die dan?

Posities zijn geen vast gegeven

Eigenlijk verwacht ik dat dit wel een dooddoener voor je is. De posities in Google zijn geen vast gegeven. Er komen nieuwe webpagina’s bij, er verdwijnen webpagina’s, er wordt gewerkt aan verbetering van de vindbaarheid van webpagina’s… En dan zijn er nog zaken als personalisering van de zoekresultaten. Op die personalisering kom ik nog terug, eerst neem ik je mee in het proces waarmee die posities nu worden bepaald.

Het proces van de zoekmachine: crawlen, indexeren en ranken

Zoekresultatenpagina’s ontstaan nadat een gebruiker een zoekopdracht invoert in een zoekmachine. En die SERP (Search Engine Results Page; de afkorting van deze term wordt het meest gebruikt door de specialisten) is weer het resultaat van een complexe berekening, waar het algoritme van een zoekmachine aan ten grondslag ligt. Het begint met het crawlen van webpagina’s, die worden geïndexeerd en daarna een positie krijgen (ranken) door het algoritme dat aan het werk gaat op basis van die zoekopdracht.

Het proces van een zoekmachine in 3 stappen: crawlen, indexeren en positioneren (ranken)

Het proces van een zoekmachine in 3 stappen weergegeven: crawlen, indexeren en positioneren (of ‘ranken’). Een beeld uit een van mijn presentaties.

Iedere zoekmachine zijn algoritme

Het is niet voor niets dat je bij Bing of DuckDuckGo (iets) andere zoekresultaten krijgt dan bij Google. Iedere zoekmachine heeft het algoritme anders ingericht, wat dus tot andere resultaten leidt.

Maar nu door naar die 3 stappen: crawlen, indexeren en ranken.

Crawlen: zonder links gebeurt het niet

Het hele proces begint dus met crawlen. Dat is het doorzoeken van webpagina’s op hun content. Let op dat ik het hier expliciet over webpagina’s heb. Google indexeert geen websites, maar webpagina’s. Iedere webpagina wordt gecrawld door Googlebot om zo te bepalen welke relevante informatie erop staat. Maar hoe weet Googlebot welke pagina’s er te crawlen zijn? Door links.

Links leiden Googlebot naar nieuwe pagina’s

Zonder wegwijzers vind je de weg niet zomaar. Links naar pagina’s zijn als wegwijzers. Door de wegwijzers weet Googlebot waar nieuwe pagina’s staan. Dat kunnen externe links zijn, interne links of links in de sitemap. Zorg er dus altijd voor dat webpagina’s die je geïndexeerd wilt hebben op zijn minst in de sitemap komen.

Pagina in de sitemap

Het ligt aan je CMS hoe je pagina’s aan de sitemap toevoegt. Als je Yoast SEO gebruikt en daarmee ook je sitemap genereert, kun je dat via ‘Geavanceerd’ in de Yoast box aangeven. Je kunt daar dan daar onder “Sta zoekmachines toe om deze Bericht te tonen in zoekresultaten?” kiezen voor “Nee”, waarmee je de pagina op noindex zet en deze niet wordt opgenomen in de sitemap. Als het goed is staat dit standaard op “Ja”, waarmee je aangeeft dat de pagina mag worden opgenomen in de index.

De XML sitemap van Letterzaken

Voorbeeld van een sitemap, in dit geval van Letterzaken.

Indexeren: de bibliotheek wordt gevuld

Nadat de webpagina is gecrawld, komt deze in de index. Dat is de enorme bibliotheek waar al die pagina’s in komen te staan. Pagina’s die op noindex staan worden niet opgenomen in de index. Deze index is dus het enorme archief waar Google uit put om resultaten weer te geven wanneer iemand een zoekopdracht ingeeft in de zoekmachine.

Ranken: iedere zoekopdracht is een nieuwe berekening

Nadat iemand een zoekopdracht in de zoekmachine invoert, wordt de index razendsnel geraadpleegd en genereert de zoekmachine op basis van het algoritme een zoekresultaat. Deze rangschikking (in het Engels ‘ranking’, je zou het ook positioneren kunnen noemen) is iedere keer weer een nieuwe berekening. Dat kan in principe iedere keer een ander zoekresultaat opleveren voor exact dezelfde zoekterm.

Een ander zoekresultaat voor exact dezelfde zoekterm?

Hoe kan het dat dezelfde zoekterm een totaal ander zoekresultaat kan opleveren? Dat begint in ieder geval al met het feit dat iedere zoekopdracht dus een nieuwe berekening is. Daarbij worden in die berekening allerlei factoren gewogen. Factoren die een rol spelen in deze verschillen zijn:

  • Apparaat waarop de zoekopdracht wordt ingevoerd (pc, mobiel)
  • Klikken op resultaten in eerdere zoekresultaten
  • Ingelogd zijn met je Google account
  • Locatie

Klikken op eerdere zoekresultaten kun je soms zelf wel terugzien, omdat er dan onder het resultaat staat “U heeft deze pagina eerder bezocht op ../../….” Deze zoekresultaten kunnen in dat geval hoger worden geplaatst dan in een eerder zoekresultaat. Ik zie dit niet als personalisatie, het draait niet heel erg om de persoon. Die personalisatie is minder dan het voorheen is geweest.

Gepersonaliseerde zoekresultaten: hoe zit dat nu?

Er is dus sprake van personalisatie. In het voorgaande voorbeeld zat 1 item dat ik nog onder personalisatie zou scharen, dat is ‘ingelogd zijn bij Google’. Verder is er ooit sprake geweest van verregaande personalisatie, waarbij jij totaal andere zoekresultaten te zien kreeg dan iemand die bij wijze van spreke naast je kon zitten. Zocht jij op ‘Egypte’, dan kreeg je nieuws en geschiedenis, omdat je geïnteresseerd was in politiek, nieuws en geschiedenis. De andere persoon kon dan bijvoorbeeld juist resultaten zien met reizen, omdat die reislustig was.

Die personalisatie kom ik nauwelijks meer tegen, jij nog wel?

Het algoritme: 3 pijlers

Het algoritme van Google bestaat uit 3 pijlers:

  • Content
  • Techniek
  • Autoriteit (of populariteit)

Ik heb er expres geen nummers voor gezet, omdat er geen hiërarchie in zit. Soms zullen de signalen uit de ene pijler zwaarder wegen dan de andere, en in een andere situatie is het weer andersom. Meer over de 3 pijlers schreef ik al in het artikel “Wat is SEO en wanneer begin je ermee?”

Het gaat veel verder…

Die 3 pijlers zijn de bovenste laag, daaronder zitten vele honderden tot duizenden factoren en signalen. En die wijzigen ook regelmatig, omdat de hele wereld continu verandert. Zo is het toenemende gebruik van mobiele telefoons een ingrijpende verandering in de wereld. En daar ontstond de Mobile friendly update uit. En veiligheid op internet wordt steeds belangrijker, wat weer tot resultaat had dat Google HTTPS als ranking signaal ging meewegen. En zo blijft het maar doorgaan.

Continue updates, dagelijks zelfs

Google heeft meerdere keren aangegeven dat er dagelijks updates plaatsvinden. Sommige klein, andere groot. Grote updates krijgen namen mee, vaak gegeven door SEO’ers die deze update hebben ontdekt.

Google Search Liaison bevestigt op Twitter dagelijks wijzigingen te doen

Telkens maar weer algoritme-updates. Om jou het beste zoekresultaat te geven. Want anders stap je toch zo over op een ander zoekmachine?

Heb je nu een beeld van het proces en de algoritmes? Of rijzen er nog vragen? Laat het weten in een reactie, ik ben heel benieuwd.

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

You have to agree to the comment policy.

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.