Zusätzliche Informationsquellen
Die automatisch erzeugten Daten reichen in der Regel alleine nicht aus, um die Relevanz eines Ergebnisses zu bewerten. Die Informationen stehen in einem gewissen Kontext, der auch bei der Indizierung beachtet werden muss.
Weitere Informationsquellen sind:
  • Analyse der Linkstruktur (Stichwort: Page-Rank)
  • Zusätzliche Felder durch die Autoren (Meta-Tags, Dublin-Core-Tags)
  • Zuordnung der Website zu Kategorien in Internet-Verzeichnisse (Dmoz, Yahoo)
  • Manuelle Kennzeichnung
  • Kennzeichnung durch Communities (z.B. Yahoo-Groups)
  • Nutzung von Thesauri, Lexika
  • Gramatikalische Analyse der Sprache