English? Click here -> How Google searches 30 trillion web pages, 100 billion times a month
Hoe verwerk je 100 miljard zoekopdrachten per maand?
Google geeft een inside peek hoe het zoeken via Google nu eigenlijk werkt.
Zoeken begint natuurlijk met het crawlen en indexeren, en Google zegt dat het web nu 30 biljoen unieke afzonderlijke pagina's heeft. Dat is 30 keer zoveel als vijf jaar geleden: Google rapporteerde in 2008 dat het web slechts een biljoen pagina's behelste.
Google zegt dat de informatie van die 30 biljoen pagina's in de Google-index nu zo'n 100 miljoen gigabytes oplag in gebruik neemt. Dat is ongeveer duizend terabyte, zo'n drie miljoen 32GB USB-sticks.
Om te testen hoe goed de zoekopdrachten daadwerkelijk presteren gebruikt Google mensen: zogenaamde search evaluators. Veertig duizend keer per jaar controleren Google testers de resultaten van de zoektechnologie, ze bekijken hoe het werkt en geven suggesties over hoe en waar te verbeteren.
En hoe zit het met link/pagina spam?
Google zegt dat het site eigenaren zo'n 40,000-60,000 per maand meedeelt wat zij zien als spam of dat ze zijn gehackt.
Voor een zeer uitgebreide en mooie uitleg in het Engels zie Google.