Stefan Karzauninkat
Nicht nur Anfänger werden bei der Recherche im Internet von den Suchmaschinen häufig mit wertlosen Treffern überschüttet. Doch mit ein wenig Know-how bringt man die Suchknechte dazu, die gewünschten Ergebnisse zu liefern - wenn man nicht gleich einen anderen, spezialisierten Fahnder einsetzt, der sich für viele Aufgaben besser eignet.
Wie es um die Recherchekenntnisse der Surfer bestellt ist, lässt sich sehr gut feststellen, wenn man sie bei der Suche beobachtet. Einige Suchmaschinen ermöglichen dies. Fireball beispielsweise zeigt mit seiner Funktion 'Live-Suche' eine permanent aktualisierte Auswahl von Suchanfragen. Neben hochinteressanten Einblicken in die Hobbys der Benutzer ('+mountainbike +tour +reise'), ihre Probleme ('isdn howto') und saisonal besonders angesagte Themen ('winterreifen') offenbart die Live-Suche auch, dass viele Benutzer die Bedienung des Suchhelfers nicht richtig beherrschen.
Sie verknüpfen Suchbegriffe falsch ('ehe und gewalt') oder suchen nach viel zu allgemeinen Ausdrücken ('Autos'). Wer solche ungenauen Suchbegriffe vorgibt, der darf sich nicht wundern, dass er mit Hunderttausenden von Treffern erschlagen wird - von Reiseangeboten inklusive Mietwagen über einen Kleinanzeigendienst bis hin zu einer Übersicht der LKW-Fahrverbote in Europa reicht das Sortiment der angebotenen Verweise unter den ersten zehn Treffern. Ob der Benutzer das wirklich alles finden wollte?
Noch eine zweite Tatsache wird sehr deutlich, wenn man den Fireball-Benutzern auf die Finger schaut: Viele suchen mit der allgemeinen Volltextsuchmaschine nach Informationen, die sie auf anderen, spezialisierten Diensten in besser aufbereiteter Form und vollständiger erhalten. Informationen über 'Frauenärzte' liefert beispielsweise der Gesundheitsdienst Lifeline, 'Kuchenrezepte' findet man in einer der einschlägigen Datenbanken wie der Rezeptsammlung der Unix-AG an der Universität Kaiserslautern oder auf dem Server einer einschlägigen Zeitschrift wie 'Meine Familie und ich'.
Bevor ein Surfer also vorschnell einen Recherchebegriff in eine der Suchmaschinen eintippt, sollte er sich genau überlegen, wo er sucht. Häufig führt gerade nicht die Suche mit einer der Volltextsuchmaschinen oder gar einer Metasuchmaschine am schnellsten zur Antwort, sondern die Recherche nach einem Spezialangebot, das die benötigte Information bereithält. Mittlerweile gibt es Hunderte von Spezialdatenbanken mit Internetanschluss, die jedermann kostenlos offen stehen.
Darüber hinaus sollte der Suchende genau erwägen, über welche Informationen er bereits verfügt und was genau er sucht. Je spezieller er den Suchbegriff wählt, desto geringer ist die Wahrscheinlichkeit, dass dieser Begriff in einem anderen Zusammenhang vorkommt als in dem gewünschten. Das schöne Wort Buttermilchproduktion zum Beispiel ist dermaßen einem bestimmten Fachgebiet zuzuordnen, dass es kaum in einem falschen Zusammenhang vorkommen kann - es sei denn, das Wort wurde schon mal als Beispiel gebraucht. In solchen Fällen ist es sinnvoll, eine Suchanfrage zu starten, die eine möglichst breite Datenbasis erfasst. Metasuchmaschinen sind hierfür besonders geeignet. Es kann (wie im genannten Beispiel) vorkommen, dass selbst Metasucher nur eine Hand voll Einträge finden.
Aber selbst Fachbegriffe kommen hin und wieder in unterschiedlichen Zusammenhängen vor. Wer feststellt, dass eine breit angelegte Metasuche zu viele Ergebnisse liefert, muss diese einschränken. Leider lassen Metasucher keine allzu komplizierten Verknüpfungen von Suchbegriffen zu, sodass es notwenig werden kann, zu einer normalen Volltextsuchmaschine zu wechseln. Dort kann der Surfer dann auf der gesamten Klaviatur der Filtermöglichkeiten spielen.
Hier ist eine Vorauswahl nach dem Suchraum sinnvoll: Suchmaschinen mit internationalem Datenbestand müssen die Webadressen weltweit durchkämmen, deutschsprachige Suchdienste, die ihre Dokumente nach der verwendeten Sprache filtern und nur passende Seiten aufnehmen, können die Gesamtzahl an Einträgen für diesen etwas kleineren Suchraum leichter aktuell und weitgehend komplett halten.
Das Problem mit der Suche im Netz besteht inzwischen weniger darin, überhaupt einen Treffer zu finden, als vielmehr, viel zu viele irrelevante Fundstellen gelistet zu bekommen. Folglich bleibt keine andere Wahl, als sich mit den Möglichkeiten zu befassen, eine Suche einzugrenzen. Die Funktionen dazu sind je nach Suchdienst höchst verschieden. Die Tabellen auf Seite 170 geben einen Überblick über die wichtigsten Befehle.
Als Quasi-Standard kann man aber die booleschen Operatoren benutzen, die mit wenigen Ausnahmen so gut wie jede Suchmaschine beherrscht. Die UND-Verknüpfung zweier oder mehrerer Begriffe, die das Vorhandensein sämtlicher Begriffe in den Trefferdokumenten erzwingt, funktioniert über ein Pluszeichen '+', das jedem einzelnen Begriff unmittelbar voranzustellen ist. Bleibt das Pluszeichen weg, so handelt es sich um eine ODER-Verknüpfung, bei der nur mindestens einer der verknüpften Begriffe enthalten sein muss. Das Minuszeichen '-' schließt einen Suchbegriff explizit aus. Auch dieses Zeichen muss unmittelbar vor dem betreffenden Wort stehen.
Trunkierungen ermöglichen es, nach Wortstämmen zu suchen, indem der Suchbegriff an passender Stelle einfach 'abgekürzt' wird. Die meisten Maschinen verwenden hierzu den Stern '*': Die Suche nach Auto* findet dann beispielsweise Automobil, Automotor, Autobahn et cetera. Genauso nützlich ist die Möglichkeit, mehrere Wörter zu einer Phrase zusammenzufassen. Hierzu werden meist Anführungszeichen verwendet: "Katz und Maus" findet genau diese Zeichenkette inklusive der Leerzeichen und nicht die einzelnen Wörter.
Einige Suchmaschinen bieten die Suche in Feldern an; dies sind Informationen über besondere Teile eines HTML-Dokuments. Anhand der HTML-Tags lassen sich für besonders prägnante Teile einer Seite wie Titel, Überschriften oder Meta-Tags auswählen und suchen - interessant, wenn man zum Beispiel eine Site wieder finden will und sich noch an bestimmte Elemente erinnern kann.
Leider ist die Suche in manchen Feldern inzwischen problematisch geworden. Sendungsbewusste Seitenanbieter benutzen sie zum so genannten Suchwort-Spamming: Hierbei baut man an entsprechender Stelle ein Übermaß an Wortwiederholungen oder irrelevante Informationen in die jeweiligen Seiten ein. Die Indizierungssoftware der Volltextsuchmaschinen kann das nur bedingt erkennen. So kann es passieren, dass mancher Recherchierende ganz und gar auf den Holzweg gelockt wird.
Das passiert vor allem bei populären Themen, ganz besonders bei beliebten Schauspielerinnen und vielen anderen im Rampenlicht stehenden attraktiven Damen, beispielsweise Sportlerinnen wie Steffi Graf. Wer über Stars nachforschen möchte, ohne in glibberige Abgründe abzurutschen, der sollte einen Katalog oder eine spezielle Suchmaschine benutzen. Gerade für Cineasten gibt es erstklassige Angebote, zum Beispiel die Internet Movie Database.
Viele Suchmaschinen bieten komfortable weitere Einschränkungsmöglichkeiten an. Es lohnt sich, einmal einen Blick auf die erweiterten Funktionen zu werfen: 'Advanced Search', 'Detailsuche' oder 'mehr Optionen' sind Links, hinter denen sich eine ganze Reihe weiterer Konfigurationsmöglichkeiten verbergen (zu den Details der speziellen Suchfunktionen einzelner Suchmaschinen siehe c't 23/99, Seite 170). Ein wichtige Möglichkeit ist die Eingrenzung auf einen bestimmten Erstellungszeitraum; so lassen sich Verweise auf veraltete Dokumente ausblenden. Auch der gezielte Ausschluss von Domains kann sinnvoll sein - vor allem dann, wenn viele Treffer auf einer einzelnen Website das Gesamtergebnis durcheinander bringen.
Trotz der großen Datenbestände und pfiffigen Konfigurationsmöglichkeiten sind Volltextsuchmaschinen nicht immer das geeignete Werkzeug. Mit Sachverstand zusammengestellte Kataloge bieten einen komplett anderen Suchansatz: Hier geht es nicht um Zeichenketten und logische Operatoren, sondern tatsächlich um die Inhalte der Sites. Wenn nicht nur ein spezieller Begriff das Recherchethema kennzeichnet, sondern es von allgemeiner Natur ist, dann bestehen gute Chancen, einige Verweise dazu in einem Katalog zu finden.
Bei Katalogen muss man zwischen Stich- und Schlagwörtern unterscheiden: Schlagwörter sind die Begriffe, nach denen die Kataloghierarchie aufgebaut ist. Zu jedem Eintrag verzeichnet ein Katalog eine kurze, von der jeweiligen Redaktion verfasste Beschreibung: die Stichwörter. Die Volltextsuche der Kataloge durchsucht sowohl Schlag- als auch Stichwörter. Daher treten hier andere inhaltliche Bezüge als bei Volltextsuchmaschinen auf. Zur Verwirrung trägt zusätzlich bei, dass viele Kataloge durch eine Kooperation mit einer Volltextsuchmaschine auch dann Treffer auflisten, wenn es keine im eigenen Verzeichnis gibt. Die Suche wird einfach an die Suchmaschine 'durchgereicht'. Deren Ergebnisse präsentiert das Verzeichnis im eigenen Layout, sodass man sehr genau hingucken muss, um herauszufinden, wer denn nun tatsächlich den Treffer gefunden hat und an welcher Stelle weitergesucht werden muss.
Die Möglichkeiten, sich mit spezialisierten Rechercheuren zu ganz bestimmten Themen zu informieren, werden immer vielfältiger. Dabei reagiert das Netz sehr schnell auf neue Trends. Beispiel MP3: Sehr schnell, nachdem das neue Musikformat populär wurde, entstanden auch spezielle Suchdienste wie MP3.com. Mittlerweile gibt es Dutzende MP3-Suchmaschinen - auch die großen wie Lycos bieten entsprechende Recherchefunktionen - und sogar schon Meta-MP3-Suchmaschinen wie MP3 Meta. Eine Übersicht gibt [1].
Wie aber an die Spezialisten herankommen? Auch hierfür gibt es spezielle Verzeichnisse. Diese Eintrittspforten in die Welt der Fachrechercheure werden zu Unrecht noch wenig beachtet. Zwei amerikanische Quellenkataloge dümpelten lange als spröde Linklisten umher und mauserten sich erst vor kurzem zu umfassend sortierten 'Hubs'. Eine heißt auch gleich so: The Big Hub. Der 'große Mittelpunkt' listet, nach Kategorien sortiert, zirka 2000 Datenbanken und Verzeichnisse. Der Schwerpunkt liegt auf amerikanischen Quellen. Umfassend und gut gepflegt findet man dort auch kleine und exotische Suchdienste wie die Datenbank des Primate Info Net, einem Netzwerk für Primatenforscher. Ein anderes großes Verzeichnis internationaler Suchdienste ist Beaucoup. Und weil auch Spanisch als Weltsprache eine wichtige Rolle spielt, sei auch eine Spanisch sprechende Suchmaschinen-Suchmaschine erwähnt: Buscopio hat nach eigenen Angaben etwa 3000 Suchdienste gelistet: internationale nach Ländern und spanische nach Themengebieten sortiert.
In Deutschland war Klug-Suchen das erste Verzeichnis von Datenbanken und speziellen Suchmaschinen und ist auch heute noch das umfangreichste. Mit jeweils mehreren Hundert deutschsprachigen Infoquellen listen die Verzeichnisse Linky und der Katalog der Suchfibel zwar weniger Einträge, dafür kommentieren und bewerten sie diese aber ausführlicher. Das Verzeichnis Search.de setzt den Schwerpunkt auf wissenschaftliche Sites. Von dort erreicht der Surfer Dutzende wissenschaftlicher Datenbanken.
Weitere gute Startpunkte für Suchen - die sich auch offline fortsetzen können - stellen Bibliotheken dar. Ihre zum Teil kryptischen Interfaces für die Suche werden zunehmend durch komfortable Zugänge ersetzt. Im bibliografischen Werkzeugkasten am Universitätszentrum Nordrhein-Westfalen findet sich eine umfassende Sammlung an Verweisen zu allen Themen, die auch nur irgendetwas mit Gedrucktem zu tun haben. Der Karlsruher virtuelle Katalog ist der Einstieg zur Recherche in Bibliotheksdatenbanken, Zeitschriftendatenbanken und vielem mehr. Hier kann man sich genauso verlieren und in Bücher vergraben wie in einer herkömmlichen Bibliothek.
Die Tabelle auf dieser Seite gibt einen Überblick über deutsche und internationale Suchdienste-Metaverzeichnisse und Spezialkataloge (siehe auch [2, 3, 4]). Für einige gängige Recherchegebiete stellen wir im Folgenden eine Auswahl bewährter kostenloser Informationsquellen vor. Bei professionellen, umfassenden Recherchen kann es sich aber auch lohnen, ein kostenpflichtiges Angebot zu konsultieren. Alle großen Datenbankanbieter machen ihr Angebot auch über das Internet zugänglich. Der Kasten auf Seite 176 stellt die einzelnen Dienste vor.
Leider sind nicht alle großen Enzyklopädien im Internet erreichbar. Allerdings könnte sich das bald ändern, nachdem der Herausgeber der Encyclopaedia Britannica angekündigt hat, sein Nachschlagewerk komplett kostenlos zugänglich zu machen. Microsofts Encarta ist schon länger zum Nulltarif online, aber nur in einer Light-Version. Das deutschsprachige Meyers Lexikon ist auf drei zeitgleiche Benutzer beschränkt - weitere Informationshungrige, die auf das Angebot zugreifen wollen, werden abgewiesen. Ein Online-Rechtschreiblexikon findet sich bei Lycos.
Informationen über ein bestimmtes Produkt oder ein Unternehmen sucht man am besten auf dem Webserver der Firma. Kaum ein Unternehmen kann es sich heute noch erlauben, vollständig ohne Webpräsenz dazustehen, viele Firmen haben gelernt, dass ein gut sortierter Server mit viel nützlicher Information eine gute Werbung ist. Wenn man die Website eines Unternehmens unter www.<firmenname>.de oder www.<firmenname>.com nicht findet (beziehungsweise www.<firmen name>.co.uk bei britischen oder www.<firmenname>.com.tw bei taiwanischen Firmen): macht nichts - bei URLs, die den Firmennamen in irgendeiner Form beinhalten, hilft Amnesi. Die Suchmaschine fahndet im Datenbestand der landesweiten Domainregistrierer. Dabei vergleicht sie auch Zeichenketten mit ähnlicher Schreibweise. So lässt sich ein Domainname ermitteln, den man nur noch ungefähr in Erinnerung hat.
Apropos Domainregistrierung. Oft ärgert man sich, dass Webseitenanbieter es unterlassen, eine Kontaktadresse anzugeben. Ein kurze Anfrage mittels Whois beim Denic oder dem für .com, .net und .org verantwortlichen amerikanischen Dienstleister Network Solutions schafft schnell Klarheit über den Besitzer der Adresse. Inzwischen gibt es auch die Möglichkeit, via Meta-Whois nachzuforschen; die deutsche Metasuchmaschine mit dem schönen Namen Metaspinner bietet ein solches Interface an.
Falls die Suche über die URL nicht zum Erfolg führt: Für die Recherche nach Firmen bietet das Web mittlerweile etliche Branchenbücher, zum Beispiel die Gelben Seiten. 1Jump, das sich bescheiden 'The Ultimate Business Portal' nennt, kennt die Firmenadressen von einer Million Unternehmen weltweit. Wer liefert was? beantwortet das gleichnamige Online-Produktverzeichnis. Auch bei der Orientierung auf dem virtuellen Markplatz helfen Spezialisten: Shop-Verzeichnisse wie Shop.de oder das neue wowowo.de führen zum Online-Händler der Wahl, Auktionsportale wie auctionsearch.de kennen das Angebot sämtlicher Online-Auktionatoren und erlauben die Suche darin.
Viele große Magazine, Tages- und Wochenzeitungen sind mit überragenden Infoseiten im Netz, die sich prima zur Recherche tagesaktueller Themen eignen. Die bekannten Magazine wie Spiegel, Stern, Focus und andere bieten News des Tages und teilweise auch spezielle Inhalte ausschließlich online. Die Suchfunktionen erstrecken sich teilweise auch auf die Artikel der gedruckten Ausgabe.
Auch Tageszeitungen veröffentlichen eine große Zahl der in der Printausgabe erscheinenden Artikel im Netz. Mehr oder weniger gut versteckt findet sich bei vielen Tageszeitungen auch eine in der Regel kostenlose Recherchemöglichkeit im Artikelarchiv. Das gilt auch für international renommierte Blätter wie die New York Times, die Washington Post, Le Monde oder die Financial Times.
Da die Zahl der Zeitungen mit Online-Präsenz im deutschsprachigen Raum bereits dreistellig geworden ist, gibt es spezielle Nachrichtensuchmaschinen, die Online-Angebot vieler Publikationen tagesaktuell, teilweise sogar in halbstündigem Rhythmus, indizieren. Paperball spezialisiert sich auf die deutschsprachigen Medien und lässt auch kleine und lokale Blätter nicht aus. Paperazzi bietet sogar die Möglichkeit, die Recherche auf Artikel auszudehnen, die bereits mehrere Monate alt sind. Der News-Sucher sendet auf Wunsch auch einen persönlich konfigurierbaren Newsletter zu. Paperboy sucht auch in internationalen Zeitungen. Allerdings geraten seine Zusammenfassungen der jeweiligen Artikel dort manchmal wenig aussagefähig. Alle genannten Nachrichtensucher ermöglichen es dem Nutzer, ein persönliches Profils einzurichten und stellen ihm nach diesen Vorgaben bei jedem Besuch eine Auswahl von Artikeln zusammen.
Gemessen an der zur Verfügung stehenden Informationsfülle sind die Möglichkeiten der Online-Recherche bei Fernsehsendern eher bescheiden. Das gilt ganz besonders für die Privaten: Über ein paar launige Promi-Plaudereien und das eigene Fernsehprogramm kommt man nicht hinaus. Und selbst das lässt sich inklusive Kurzrezensionen und Tagestipps bei den Kollegen aus dem Printbereich umfassender erfragen. Die miteinander konkurrierenden TV Movie, TV Spielfilm und TV Today bieten alle umfangreiche Suchmöglichkeiten im aktuellen Fernsehprogramm, sodass es bei diesem Überangebot letztlich nur eine Frage des persönlichen Geschmacks ist, wo man sich über das Programm informiert. Wer lieber ins Kino geht, der bekommt einen komfortablen Spielplan inklusive Kurzkritiken frei Haus: Die Kinozeitschrift Cinema bietet diesen Service bundesweit.
Viele Anfragen an Suchmaschinen drehen sich um Gesundheitsprobleme und medizinisches Fachwissen. Auch in diesen Bereichen existieren mittlerweile etliche Spezialisten. Neben wissenschaftlichen Quellen lassen sich auch populärwissenschaftlich aufbereitete Fachartikel abrufen, für das kleine Wehwehchen zwischendurch. Lifeline bietet nicht nur Informationen zu einer ganzen Reihe von Krankheiten, sondern ermöglicht es auch, direkt zum Fachmann Kontakt aufzunehmen. Dr.Antonius ist ebenfalls auf den medizinischen Laien ausgerichtet. Eine Thesaurus-basierte Suche vergleicht die eingegebenen Begriffe mit einem medizinischen Wörterbuch und übersetzt bei Bedarf die lateinischen Fachbegriffe ins Deutsche oder umgekehrt. Nebenbei bekommt man eine Reihe von Vorschlägen zur Verknüpfung und somit viele Tipps zum Eingrenzen der Suche. Wer es ganz genau wissen möchte und vom Fach ist, der kann auch die kostenpflichtigen medizinischen Datenbanken befragen (siehe c't 23/99, Seite 176).
Und wenn der PC krankt: Gerade im Bereich Computertechnik ist es sinnvoll, statt einer Volltextsuchmaschine eine spezielle Datenquelle zu befragen; allgemeine Suchmaschinen finden auf Suchanfragen aus dem PC-Bereich oft zu wenige passende Treffer (siehe c't 23/99, Seite 162). Aber es existiert bereits eine Vielzahl von Recherchequellen für PC-Nutzer. Das Angebot reicht von Abkürzungslexika wie PC Webopaedia über allgemeine Hilfestellungen zur Hardware, wie sie der PC Guide bietet, bis zu konkreten Hilfestellungen, beispielsweise in der c't-Hotline-Datenbank. c't pflegt auf seinem Server eine Verweisliste zu Online-Angeboten, die bei jeder Art von PC-Problemen helfen.
Bei weitem nicht alle Fragen lassen sich direkt über das Netz klären. Oft führt der Weg zu einem Fachmann, der möglicherweise die Antwort weiß. Experten lassen sich über wer weiss was suchen. Interessierte tragen sich dort in eine Datenbank ein und stellen ihr Wissen im Austausch zur Verfügung. Auch zu den hoch spezialisierten Fachleuten an Universitäten gibt es eine zentrale Kontaktmöglichkeit. Der Informationsdienst Wissenschaft an der TU Clausthal vermittelt Journalisten kompetente Leute aus Forschung und Wissenschaft. Natürlich gibt es online auch richtige Jobbörsen: Der Zeit-Robot wertet zum Beispiel Hunderte Stellenmärkte aus.
Last, not least seien die anderen Dienste des Internet erwähnt, die sich neben dem World Wide Web als Recherchequelle nutzen lassen. Das Usenet beispielsweise ist eine prima Quelle für die Klärung technischer Probleme. Man darf zwar nicht damit rechnen, immer sofort eine Antwort auf eine Frage zu bekommen, die man in einem Usenet-Forum stellt. Häufig finden sich in den Newsgroups aber Experten, die einem weiterhelfen können. Spezielle Suchdienste wie Deja.combieten auch hier komfortable Recherchemöglichkeiten.(jo)
[1] Thomas Schult: Das Netz ist Klang, Musik finden im WWW, c't 14/99, S. 96
[2] Jo Bager: Navigationshilfen, Websites finden, Bookmarks verwalten, c't 13/99, S. 116
[3] Jo Bager, Dr. Adolf Ebeling, Michael Kurzidim, Wegweiser für das Gratisweb, Kostenlose Dienste im Internet - ein Überblick, c't 4/99, S. 112
[4] Jo Bager: Weniger ist mehr, Internet-Suchmaschinen richtig einsetzen, c't 15/98, S. 110