Die automatisch erzeugten Daten reichen in der Regel alleine nicht aus, um die Relevanz
eines
Ergebnisses zu bewerten. Die Informationen stehen in einem gewissen Kontext, der auch bei der
Indizierung beachtet werden muss.
Weitere Informationsquellen sind:
- Analyse der Linkstruktur (Stichwort:
Page-Rank)
- Zusätzliche Felder durch die Autoren
(Meta-Tags, Dublin-Core-Tags)
- Zuordnung der Website zu Kategorien
in Internet-Verzeichnisse (Dmoz, Yahoo)
- Manuelle Kennzeichnung
- Kennzeichnung durch Communities (z.B.
Yahoo-Groups)
- Nutzung von Thesauri, Lexika
- Gramatikalische Analyse der Sprache