Kataloge und Volltextsuche
Die Suche im Internet wird im wesentlichen von zwei verschiedene Prinzipien
dominiert: Die Volltext-Indexierung durch Suchmaschinen und die systematische
Erschliessung in redaktionell betreuten Katalogen.
Der Schlüssel zum erfolgreichen Suchen im Internet liegt in der vernetzten
Struktur des World Wide Web. Die einzelnen Websites sind untereinander durch
sogenannte Links verknüpft. Dadurch entsteht ein System, das mit einem
Spinnennetz verglichen werden kann. Dies machen sich auch die sogenannten
Suchrobots zu nutze. Die Robots sind die automatisierten Arme der Suchmaschinen.
Sie folgen anhand der Linkstruktur einzelnen Bahnen und indexieren den Inhalt
der Seiten. Diese Prozedur findet in regelmässigen Abständen statt.
Findet der Robot beispielsweise einen Link auf eine neue Seite, kann er
diesem folgen, um anschliessend den Inhalt der Seite zu erfassen. Gerade
bei der Inhaltsindexierung gibt es aber bei den Suchmaschinen wesentliche
Unterschiede. Einige erfassen nur den Titel und die ersten Absätze
eines Dokumentes, andere wiederum nehmen alle Daten in den Speicher auf.
Eine weitere Möglichkeit der Robots ist es, sich auf die HTML-Codierung
eines Dokumentes zu konzentrieren. Bei Maschinen, die das ganze Dokument
erfassen, wird zwischen jenen unterschieden, die nur Schlüsselwörter
registrieren - HotBot, Excite oder Webcrawler - und den anderen die jedes
Wort erfassen -AltaVista, Infoseek. Bei letzteren würde auch eine Suche
in der Art "Hund und Katze" zum Erfolg führen.
Die Art der Datenerfassung spielt auch beim sogenannten Ranking eine grosse
Rolle. Selbstverständlich fällt es einem automatischen Computer-
oder Webprogramm schwer, die Qualität und den Inhalt der gefundenen
Seiten richtig einzuschätzen. An diesem Punkt kommen die Kataloge ins
Spiel. Ein Katalog, auch Verzeichnis genannt, erfüllt den selben Zweck
wie eine Suchmaschine. Er soll uns helfen im Internet das Gewünschte
zu finden. Der Vorteil der Kataloge ist es, dass die Fülle der erfassten
Seiten von menschlicher Hand und mit gesundem Menschenverstand sortiert
wird. Kataloge erkennt man zumeist daran, dass man auf der Hauptseite aus
verschiedenen Unterverzeichnissen auswählen kann. Die Betreuer der
Site haben Rubriken wie Sport, Wissenschaft oder Politik geschaffen, um
dem Suchenden besseren berblick zu gewährleisten. Häufig bieten
Kataloge auch etwas an, das aussieht wie eine Suchmaschine. Darin begrenzt
sich die Suche dann auf die Seiten, die im Verzeichnis erfasst sind.
Jedes der beschriebenen Suchsysteme hat seine Vor- und Nachteile. Man kann
sogar soweit gehen und sagen, dass dies auf jeden einzelnen Suchdienst zutrifft.
Es gibt im Internet mittlerweile eine überwältigend grosse Anzahl
an Suchmaschinen und Katalogen und es wäre utopisch, wenn man hier
nur die Hälfte nennen wollte. Deshalb beschränken wir uns im Folgenden
darauf, einige Bekannte vorzustellen. |
Diese Site ist ein Auszug einer Proseminararbeit,
die an der Uni Zürich entstanden ist. Wer sich für das Thema interessiert,
findet die Arbeit hier als Word-Datei zum Download.
Für Fragen oder Anregungen reicht ein Mail an die Autoren:
Michael Bachmann
und
David Witassek |