Eckdaten einer Suchmaschine
Ziel: eine Suchmaschine 100 Mio. indizierten Dokumenten und 5 Mio Suchanfragen / Monat

Festplattenplatz:
  • je Dokument ~ 25 kB + 5 kB Metainformationen => 3 TB Festplattenspeicher

Netzwerk Crawler:
  • alle drei Monate vollständige Aktualisierung aller Seiten
  • Netzwerk Overhead: 20% => 1,2 TB / Monat
  • 1 Tag = 16 Stunden
  • 35 Mio. Dokumente / Monat => 20 Dokumente / Sekunde crawlen => 4 Mb/s Bandbreite

Frontend:
  • 5 Mio. Suchanfragen / Monat, 1 Tag = 12 Stunden => 4 Anfragen / Sekunde