Zoekindex

Google verzamelt informatie van miljarden webpagina’s. Via de zoekindex is deze informatie snel te vinden. De zoekindex bevat woorden en verwijst naar de webpagina’s, die deze woorden bevatten. Dit is vergelijkbaar met een index achterin een boek. Via de index vind je snel de juiste bladzijde, zonder het hele boek te hoeven lezen.

Google zoekindex

Google’s index is meer dan 100 miljoen gigabyte groot en omvat inmiddels (in 2016) 130 biljoen (130.000.000.000.000) pagina’s. Elke URL is in de ogen van Google een aparte pagina. Als dezelfde pagina meerdere URL’s heeft, staat hij meerdere keren in de index.

De index is opgeknipt in groepen van miljoenen pagina’s. Google noemt deze groepen shards (scherf of fragment). Voor het complete internet zijn er 1000-en shards.

Een zoekopdracht in Google wordt naar alle shards gestuurd. Elke shard berekent een relevantiescore en stuurt de pagina’s met de hoogste score terug. Deze lijsten worden daarna gecombineerd, op basis van relevantiescore gesorteerd en als zoekresultaat gepresenteerd.