Google algoritme

Een algoritme is een computerprogramma, dat wiskundige formules gebruikt wordt om webpagina’s en zoekopdrachten te analyseren en te categoriseren. Google noemt deze algoritmes classifiers. De input voor een algoritme (kenmerken van zoekopdrachten en webpagina’s) noemt Google signalen.

Google gebruikt meer dan 500 algoritmes om zoekresultaten samen te stellen. Deze algoritmes hebben betrekking op zaken als kwaliteit, taal en spelling, de zoekopdracht, personalisatie, tijd en locatie. Het ranking algoritme bepaalt de volgorde van pagina’s in de zoekresultaten.

Google algoritme

Sommige algoritmes worden eens in de zoveel tijd gestart, bijvoorbeeld als ze veel rekenkracht vergen. Andere algoritmes werken realtime, direct na het vinden van een pagina of het geven van een zoekopdracht. Google streeft naar algoritmes die volledig geautomatiseerd functioneren, maar er zijn ook (vaak nieuwe) algoritmes, die nog handmatig gestart worden.

Signalen als input voor algoritmes

Google gebruikt meer dan 200 signalen om de meeste relevante sites met de beste reputatie bij een zoekopdracht te vinden. Om de concurrentie voor te blijven en om misbruik en manipulatie te voorkomen, houdt Google deze grotendeels geheim.

Wel duidelijk is dat de links naar een website (PageRank) belangrijk zijn, evenals de inhoud, kwaliteit en reputatie van de site. Er zijn ook signalen met een negatieve invloed. Dat zijn signalen, die er op wijzen dat een site op een oneerlijke manier probeert een goede positie in Google te behalen.

Voorbeelden van algoritmes

Alhoewel de algoritmes van Google geheim zijn, lichten ze soms wel een tipje van de sluier op. Bekende algoritmes zijn bijvoorbeeld:

  • PageRank: PageRank ziet links naar een pagina als een aanbeveling. Veel relevante links vanaf betrouwbare sites verbeteren de positie in de zoekresultaten.
  • RankBrain: een lerend systeem op basis van kunstmatige intelligentie, dat de bedoeling van een zoekopdracht probeert te begrijpen en de zoekresultaten op basis daarvan aanpast.
  • Query Deserves Freshness: een algoritme, dat de zoekresultaten (tijdelijk) aanpast als er grote en belangrijke nieuwsfeiten zijn (breaking news).
  • Panda: het Panda algoritme geeft websites met een lage kwaliteit een lagere positie in de zoekresultaten.
  • Penguin: het Penguin algoritme zorgt dat websites geen voordeel hebben, als ze met gekochte links hun positie in de zoekresultaten proberen te verbeteren.
  • Pagina layout: pagina’s waarbij je veel moet scrollen om de hoofdinhoud te vinden (bijvoorbeeld door een overdaad aan advertenties), krijgen een lagere positie.

Verder is er een algoritme voor spellingscontrole, een algoritme om in te schatten in welke taal een pagina is geschreven, een algoritme dat zoekresultaten personaliseert, een algoritme dat concepten achter zoekopdrachten of pagina’s herkent, een algoritme om te achterhalen wat de officiële website is voor een merk of bekende persoon en nog veel meer.

Testen en verbeteren van de algoritmes

Google toetst regelmatig of de algoritmes de juiste kwaliteit leveren en zoekt continue naar verbeteringen. Bijvoorbeeld door quality raters in te zetten of door experimenten uit te voeren. Elk jaar vinden er 1000-en testen plaats en worden er zo’n 500 wijzigingen in de algoritmes doorgevoerd.

Zie voor meer informatie: www.google.com/insidesearch/howsearchworks/algorithms.html