Startseite
|
Inhalt
|
Übersichtsmap
Internet-Suchmaschinen: wie kommen sie zu ihren Daten?
Michael Nebel
michael@nebel.de
Startseite
Einleitung
Suchverhalten im Internet
Eine perfekte Suchmaschine?
Informationsquellen im Internet
Grenzen von Suchmaschinen
Funktionseinheiten einer Suchmaschine
Wie werden Websites gefunden?
Grenzen des Crawlers: Deep-Web
Problematische Seiten
Daten aus Sicht des Parsers
Zusätzliche Informationsquellen
Geschäftsmodelle für Suchmaschinen
Marktanteile
Von Google lernen
Aktuelle Entwicklungen
Bessere Suchmaschinen?
Suchmaschinenoptimierung (SEO)
Werbung und Webspam
Ergebnis-Manipulation
Links
Kontakt
Daten aus Sicht des Parsers
Nachdem die Daten über den Crawler eingesammelt worden, müssen sie analysiert werden. Die Suche setzt in der Regel auf Schlagworten auf. Die Aufgabe des Parsers ist die Überführung der Rohdaten in einen indizierbaren Text.
Rohdaten
->
Dekodierung
->
- >
Text-Extraktion, Feld- Erkennung
Link-Erkennung
->
->
Indizierbarer Rohtext
Link-Liste für den Crawler
Seitenanfang
nebel.de
Letzte Aktualisierung:
22.02.2006