Gespiegelt auf diesem server:

Wolfgang Binder

Wie findet man die Nadel im Heuhaufen?


Einführung in Suchdienste für WWW-Dokumente

Bookmarks
(auch Übersichten, deutsche Dienste, Usenet, FAQs, regionale Suchen)


Textteil


Fachübergreifende versus fachspezifische Nachweisinstrumente

Thema dieser Einführung sind Nachweisinstrumente für Internet-Informationen. Dabei liegt zum einen der Schwerpunkt auf dem World Wide Web. Zum andern beschränkt sich die Einführung auf fachübergreifende Nachweisinstrumente. Neben diesen gewinnen fachliche Nachweisdienste zunehmend an Bedeutung - in Form spezieller Suchmaschinen, fachsystematisch gegliederter Verzeichnisse oder fachlicher Informationsführer. (Letztere geben meist auf mehreren WWW-Seiten einen Überblick über fachbezogene Informationsquellen.) Optimal sind daher fachbezogene oder anwendungsorientierte Einführungen. Durch ihren Auswahlcharakter können fachliche Nachweisdienste die Suche nach relevanten Informationen in vielen Fällen erleichtern und beschleunigen. Die hier behandelten universellen Nachweisdienste bleiben dennoch in absehbarer Zeit unverzichtbare Hilfsmittel.

Aus dem großen Angebot an Diensten wurden nicht immer die meistgenannten oder bekanntesten selektiert, sondern die nach eigener Einschätzung für die verschiedenen Zwecke tauglichsten (s. Liste der Bookmarks).

Suchmaschinen versus Verzeichnisse

Ein möglichst umfassender Nachweis von Web-Dokumenten ist über Suchmaschinen möglich, die in Einzelfällen bis zu 60 Mio. Web- Seiten nachweisen. Die Sammlung bzw. Erfassung und die Erschließung der Dokumente erfolgen automatisch über Roboter, die das World Wide Web in regelmäßigen Abständen "durchstreifen". (Auf die Arbeitsweise der Roboter wird hier nicht weiter eingegangen.) Einfache Suchfragen, die aus ein oder zwei Suchbegriffen bestehen, führen hier aber i.d.R. bereits zu unübersichtlichen Treffermengen. (Natürlich gilt dies nicht für sehr spezifische Begriffe.) Als grobe Regel gilt, daß Suchmaschinen erst bei Suchfragen mit drei oder mehr Suchbegriffen einigermaßen problemlos anwendbar sind. Sie sind deshalb vor allem für die Beantwortung spezieller Fragestellungen gut geeignet.

Wie verfährt man aber bei allgemeineren Fragestellungen? Bei einer gründlichen, umfassenden und aktuellen Suche wird man auch hier auf Suchmaschinen nicht verzichten können. Einige (z.B. AltaVista) bieten sinnvolle Möglichkeiten der Einschränkung von Suchfragen. Einfacher, schneller und in vielen Fällen auch ausreichend ist die Heranziehung von Auswahlsammlungen oder "Verzeichnissen", die intellektuell erstellt bzw. bearbeitet werden. Auch diese haben Nachteile: Ihre Aktualität läßt fast immer zu wünschen übrig. Es gibt sehr viele Verzeichnisse - im Unterschied zu etwa 6 Suchmaschinen, die ernsthaft in Betracht kommen. Obwohl die meisten von ihnen eine Abfrage nach Suchbegriffen zulassen, sind sie nur beschränkt über sog. "Meta-Suchmaschinen" gemeinsam recherchierbar. Schließlich ist auch die beste Auswahl dem Verwurf der Subjektivität ausgesetzt.

Es ist nicht leicht, allgemeine Empfehlungen zu formulieren, in welchen Fällen Suchmaschinen, in welchen Verzeichnisse herangezogen werden sollten. Daher nähern wir uns dem Problem von einer mehr praktischen Seite, nämlich über Testabfragen in Meta-Suchmaschinen.

Die meisten Testfragen sind dem Bereich Gesundheit / Ernährung entnommen.

allgemeinere Suchfrage:

=> vitamins diet

Ich benutze den Suchfragen-Konverter MetaSearcher (http://metasearch.com/) und erhalte bei Yahoo - dem mit Abstand größten Verzeichnis - 19 Treffer (überwiegend kommerzielle - da Yahoo im wesentlichen auf Meldungen basiert). Die Suchmaschine AltaVista liefert ca. 30000 Treffer.

In diesem Fall empfiehlt sich zunächst die Auswertung von Verzeichnissen.

(Anmerkung: Wenn man sich für etablierte Standards oder Empfehlungen zum täglichen Vitaminbedarf interessiert, wird man dennoch eine Suchmaschine wählen müssen. Hier wird man jedoch mit noch größeren Mengen an kommerziellen Publikationen zugeschüttet. Das Beispiel ist aber sehr lehrreich, um zu demonstrieren, welche zentrale Rolle die Wahl der richtigen Terminlologie bei einer stichwortbasierte Suche spielt: Der Schlüssel-Suchbegriff lautet (für den Bereich der USA): "Recommended Dietary Allowances" abgekürzt als "USRDA". Diese werden fälschlich auch als "Recommended Daily Allowances" zitiert, so daß dieser Terminus berücksichtigt werden sollte. Schließlich gibt es auf den USRDA basierende Empfehlungen mit der Bezeichnung "Reference Daily Intakes". - Erst ausgerüstet mit diesem Wissen, über das man entweder bereits verfügt, oder für das man Lehrgeld in Form von Recherchezeit bezahlen muß, kann man sinnvolle Suchanfragen formulieren. -

Das einfache Rezept: "Bei speziellen Suchfragen benutze man Suchmaschinen, bei allgemeineren Suchfragen Verzeichnisse", wird hier ausdrücklich nicht propagiert.)

spezielle Suchfrage:

=> oat bran cholesterol lower*

(Das "*" wird von AltaVista als Trunkierzeichen interpretiert und von Yahoo ignoriert.)

Yahoo liefert keine Treffer ( =>automatische Weiterleitung der Suchfrage an die Suchmaschine AltaVista, die ca. 300 Treffer liefert). Ist eine Suche bei Yahoo erfolglos, so sind i.d.R. auch in anderen Verzeichnissen keine Treffer zu erwarten. In diesem Fall muß eine Suchmaschinen-Suche durchgeführt werden.

Aufschlussreich ist das Auftreten von Doubletten in Meta- Suchmaschinen bei speziellen und allgemeinen Suchfragen. Doubletten, d.h. Dokumente, die von verschiedenen Suchmaschinen ermittelt werden, werden z.B. von der Meta-Suchmaschine MetaFind in der alphabetischen Sortierung angezeigt. Das Auftreten von Doubletten ist ein sicheres Indiz dafür, daß der Einsatz von Suchmaschinen angezeigt ist, da sich unter den TOP-Treffern verschiedener Suchmaschinen auch identische Dokumente befinden sollten. Bei allgemeineren Suchfragen hängt es dagegen weitgehend vom Zufall bzw. den Feinheiten des Ranking-Algorithmus (Sortier- Algorithmus) ab, welche Treffer zuerst angezeigt werden, so daß Doubletten hier nur selten zu erwarten sind.

Beispielsuchen (o.g. Suchanfragen) mit der Meta-Suchmaschine MetaFind bestätigen diese Erwartung.


Meta-Suchmaschinen (allgemein)

In meiner Einführung nehmen Meta-Suchmaschinen im Vergleich zu anderen Einführungen einen relativ breiten Raum ein. Dies möchte ich zunächst kurz begründen bzw. motivieren:

Die Lösung des Problems sind Meta-Suchmaschinen, die die Suchfragen zur parallelen Bearbeitung an einzelne Suchdienste weiterleiten, die Ergebnisse sammeln und geeignet präsentieren. Bei diesen einzelnen Suchdiensten handelt es sich überwiegend um Suchmaschinen (Roboter), teilweise aber auch um Verzeichnisse.

Recherchen über Meta-Suchmaschinen werden häufig abqualifiziert als provisorische Suchen mit dem kleinsten gemeinsamen Nenner, die bestenfalls für sog. "quick-and-dirty"-Suchen geeignet sind. Zumindest in den Fällen, in denen Meta-Suchmaschinen auf Suchmaschinen zugreifen, ist diese Sicht aber nicht zutreffend. Praktisch alle Suchmaschinen haben so etwas wie eine "Standardsuche", bei der die Suchbegriffe gleichberechtigt eingegeben und bezüglich der Suche - je nach Suchtyp - "locker" oder auch "fest" miteinander verknüpft werden. (Diese etwas metaphorische Ausdrucksweise werde später noch präzisieren.) In den Fällen, in denen eine solche Standardsuche ausreichend ist - dies betrifft einen großen Teil der Suchfragen - , kann man auch gleich über mehrere Suchmaschinen suchen: Die besten 100 Treffer aus mehreren Suchmaschinen sind i.a. relevanter als die ersten 100 Treffer einer einzigen Suchmaschine. Ist die Suchfrage aber komplex oder spezifisch, sprechen die Gründe im Einzelfall meist dafür, eine ganz bestimmte Suchmaschine zu benutzen und nicht mehrere sukzessiv.


Meta-Suchmaschinen über Suchmaschinen u n d Verzeichnisse:

Wie schon erwähnt, gibt es Meta-Suchmaschinen, die nicht nur Parallelsuchen in verschiedenen Suchmaschinen durchführen, sondern auch suchbare Verzeichnisse einbeziehen. Ein Beispiel hierfür ist die Suchmaschine Dogpile (http://www.dogpile.com/). Damit besteht die Möglichkeit, unabhängig vom Charakter der Suchfrage eine "Standardsuche" über Suchmaschinen und Verzeichnisse laufen zu lassen. Dogpile erlaubt die Einrichtung eines individuellen Standardprofils aus 23 Angeboten, die auch Newsgroups und FTP abdecken. Inwieweit man diese übergreifende Form der Suche standardmäßig nutzt, ist u.a. eine Sache des persönlichen Geschmacks und der Erfahrung.

Es ist aber zweckmäßig, Suchmaschinen und Verzeichnisse getrennt zu behandeln, da es unterschiedliche Anwendungsschwerpunkte gibt, und vergleichende Übersichten nur innerhalb der jeweiligen Gruppe sinnvoll sind.


Meta-Suchmaschinen über Suchmaschinen

Der verbreitetste Einsatzbereich von Meta-Suchmaschinen sind parallele Suchen in Roboter-basierten Suchmaschinen.

Charakterisierung der grundlegenden Suchmodi (Suchmaschinen):

Zunächst sollen die Sucharten charakterisiert und analysiert werden, die mehr oder weniger allen Suchmaschinen gemeinsam sind, und die man deshalb unter dem Terminus "Standardsuche" zusammenfassen kann.

Die beiden Typen der Standardsuche finden sich auch bei den Meta- Suchmaschinen wieder:

Beide Suchtypen (inklusive Varianten) werden in der folgenden Übersicht erläutert:

Standard-Suchmodi (Übersicht)

"fuzzy-AND-Suche"

Suchbegriffe:

S1

S2

S3

S4

S5

Treffer-Nr.

1

x

x

x

2

x

x

x

x

x

4

x

x

x

.

x: Suchbegriff kommt im Dokument vor

"Ranking" (Sortierung) nach folgenden Kriterien:

Variante: +/-Syntax (u.a. AltaVista, InfoSeek, Excite)

Beispiele:

+S3 : S3 soll in den Treffern vorkommen

-S5 : S5 soll nicht in den Treffern vorkommen

Wirkung: siehe o.g. Tabelle

UND-Verknüpfung:

Spezialfall der +/-Syntax:

=> +S2 +S3 bewirkt UND-Verknüpfung der Suchbegriffe S2 und S3 - ermittelt werden die Treffer 2 und 4 der Tabelle


Nach diese Vorbemerkungen stelle ich drei Meta-Suchmaschinen vor, die über Suchmaschinen suchen.


MetaFind

http://search.metafind.com/

Parallelsuche in folgenden

Suchmaschinen 

mit max.Treffern

Altavista 

10

Ultraseek (Infoseek) 

25

Excite 

10

Hotbot 

50

OpenText 

10 

WebCrawler 

10

Von den mehr als 100 Treffern stammen 25 von Ultraseek, die als Suchmaschine mit den relevantesten Treffern gilt.

Unverbunden eingegebene Suchbegriffe werden hier standardmäßig mit UND verknüpft.

Anmerkung zur Phrasensuche:

Mehr-Wort-Suchbegriffe oder Phrasen - z.B. "operations research" - werden in der Suchmaschinen-Syntax üblicherweise wie vorstehend durch "..." gekennzeichnet. So gekennzeichnete Phrasen-Suchbegriffe werden von den meisten Meta-Suchmaschinen akzeptiert und weitergeleitet.

MetaFind bietet 3 Sortieroptionen an:

Zu jedem Treffer werden die Suchmaschine und deren Treffernummer angezeigt.

Am Ende der Anzeige erscheinen die aktuellen Links zu den einzelnen Suchmaschinen sowie die weitergeleiteten Such-Statements.


Pro Fusion

http://www.designlab.ukans.edu/profusion/

Parallelsuche in folgenden Suchmaschinen:

Ideale Suchmaschinenauswahl. Die Treffermenge besteht i.d.R. aus mehr als 80 Treffern. Die Zahl der Treffer pro Suchmaschine schwankt zwischen 10 und 20. Daneben ist es auch möglich, unter diesen Suchmaschinen individuell auszuwählen.

Es werden standardmäßig fuzzy-AND-Suchen durchgeführt. Hiervon abweichend kann bei entsprechender Suchmaschinenauswahl (AltaVi sta, InfoSeek, Excite) auch die +/-Syntax verwendet werden, z.B. um eine UND-Verknüpfung zu realisieren.

Alle Treffer werden in einer Liste mit einheitlichem Ranking (!) zusammengeführt.

Besonderheit:

Pro Fusion bietet eine Funktion "Broken Link Detection" an, mit automatisch überprüft wird, ob die ersten 5, 10, 15, 20, 25 ... Links erfolgreich angeklickt werden können.


Inference Find (iFind)

http://www.inference.com/ifind/

Es werden bis über 130 Dokumente nachgewiesen. Die Treffermengen schwanken gelegentlich.

In der "Inference Find Product page" werden folgende Suchmaschinen genannt: AltaVista, Excite, Infoseek, Lycos, WebCrawler, Yahoo. Möglicherweise sind diese Suchmaschinen aber nur als Beispiele zu verstehen, da die Treffermengen zu zwei Testrecherchen offenbar keine Ergebnisse der Suchmaschine Ultraseek (Infoseek) enthielten.

Die Motivation, Inference Find zu benutzen, liegt vor allem in der intelligenten Art, in der ein Teil der Treffer unter nicht-trivialen Schlagwort-Überschriften zu Gruppen zusammengefaßt wird. Dabei werden teilweise neue und überraschende Zusammenhänge sichtbar. Die Trefferanzeige zu der Suchfrage => cholesterol heart disease enthält z.B. die Gruppen "Omega-3 Fatty Acids" und "High Blood Pressure". Die nicht in den Schlagwort gruppen enthaltenen Treffer werden (über den Domainnamen) in Gruppen nach Typ und Herkunft zusammengefaßt.

Inference Find ist vielleicht weniger für die systematische Suche zu empfehlen, ist aber auf jeden Fall eine interessante Ergänzung.


Einzelne Suchmaschinen

Gründe, um einzelne Suchmaschinen zu benutzen, sind:

Um zu einer Beurteilung der bekanntesten Suchmaschinen zu gelangen, habe ich die folgende vergleichende Übersicht erstellt. Es fehlt die Suchmaschine Hotbot, die nach Suchfunktionen und Größe am ehesten Excite vergleichbar ist (die in verschiedenen Quellen für die wissenschaftliche Nutzung aber als weniger bedeutend eingestuft wird).

Suchmaschinen-Vergleich

SM

Größe
(Seiten)
Mio. 

Sucherfolg
(Trefferzahlen von Testrecherchen - skaliert) 

Relevanz 

Suche

Anzeige

AltaVista

>31

10

**

*

*** TBF

UltraSeek

25-50

4-6

*

**

** TF

*

Excite

50(=URLs?)

6-8

*

*

* B

**

Lycos

1+/-

**

OpenText

15-25

1

WebCrawler

>1

0.5

*

Erläuterungen:

Größe:

vgl. "Searching the Web - Systematic overview over indexes" (http://www.ub2.lu.se/tk/websearch_systemat.html#detai) mit überwiegend aktuellen Daten - die Zahlen von OpenText und WebCrawler sind geschätzt bzw. hochgerechnet.

Trefferquoten:

basierend auf den Ergebnissen von 17 Testrecherchen - i.d.R. mit drei oder mehr Suchbegriffen -, deren Treffermengen denen konventioneller Literaturrecherchen entsprechen. (In den vielen Fällen werden bei Vergleichstests von Suchmaschinen Einzel-Suchbegriffe oder einfache Suchbegriffskombinationen verwendet. Die dabei erzielten hohen Trefferzahlen - nicht selten mehr als 1000 - haben aber keine praktische Bedeutung, so daß Vergleiche auf dieser Basis irrelevant sind.)

Die Ergebnisse weichen z.T. von dem ab (vgl. die Spitzenposition von AltaVista), was man aufgrund der Datenbankgröße erwarten sollte. Sie werden aber durch eine russische Untersuchung ("Best search engines for finding scientific information... - http://www.chem.msu.su/eng/comparison.html) gestützt.

Relevanz:

Die Bewertung der Relevanz ist das Resümee einer Reihe publizierter Tests.

Suche:

T

Trunkierung oder Wortstammsuche

Boolesche Suchlogik (einschl. logische Klammern)

F

Feldsuche

In der Gesamtwertung liegt AltaVista vorn gefolgt von Ultraseek und Excite. Die Einführung folgt dieser Reihenfolge.


AltaVista

Simple Search: http://altavista.digital.com/

Adv. Search: http://altavista.digital.com/cgi-bin/query?pg=aq

AltaVista wird von der Fa. Digital Equipment betrieben und seit Dezember 1995 angeboten.

Es wird eine "Simple Search" und eine "Advanced Search" angeboten.

Simple Search:

Die Suchbegriffe werden hier unverknüpft eingegeben ("fuzzy-AND- Suche"). Die +/-Syntax (s.o.) kann verwendet werden. Suchbegriffe können (mit "*") trunkiert sowie auf bestimmte Felder eingeschränkt werden (s. Advanced Search).

Suchbeispiele unter "Suchmaschinen versus Verzeichnisse" - s.o.

Advanced Search:

Die Advanced Search benutzt Boole'sche Operatoren und ist konkurrenzlos hinsichtlich der angebotenen Suchoptionen. Verschiedene Suchbegriffe müssen durch Operatoren verknüpft werden. Die Suchoptionen werden anhand einer Beispielrecherche erläutert (Thema: "cholesterinsenkende Naturprodukte in der gesunden Ernährung").

Eingabe in das Feld "Selection Criteria":

("oat bran" or "red wine" or "fish oil") and diet* near cholesterol and not com

=> ~200 Treffer

Erläuterungen zu den Suchbegriffen:

"...": Phrase (Mehr-Wort-Suchbegriff) - diese Notation ist weitverbreitet, bei AltaVista ist aber auch die unverknüpfte Eingabe möglich

* : Trunkierung (Das * kann 0-5 Zeichen ersetzen und sowohl am Ende als auch im Innern eines Worts verwendet werden.)

zu den Operatoren:

"or" und "and" werden als bekannt vorausgesetzt (alle Operatoren können hier klein geschrieben werden).

"near" ist eine Verschärfung von "and" insoweit, als die Suchbegriffe nur durch maximal 10 andere Worte getrennt sein dürfen. (Der Wortabstand kann bei verschiedenen Suchmaschinen variieren.)

"and not" ist bei AltaVista (wie auch bei anderen Suchmaschinen) anstelle des gewohnten NOT zu verwenden. ("AND NOT" ist die in der Informatik übliche und korrekte Bezeichnung.)

"com" steht hier für den Domainnamen "com". Der Domainname, der in der URL vor dem ersten (einfachen) Schrägstrich steht, bezeichnet den Typ des Servers - hier einen "kommerziellen" Server.

Suchfrage:

Die Treffer zu der Suchfrage sollen also mindestens einen Begriff (genauer Mehr-Wort-Begriff) aus der Klammer enthalten, ferner den Begriff "diet" oder (z.B.) "dietary" - aber nur wenn dieser innerhalb eines Wortabstands von 10 Worten zusammen mit "cholesterol" auftritt. Außerdem werden keine Dokumente auf kommerziellen Servern gewünscht. (Ohne diese Einschränkung erhielte man ca. 500 Treffer).

Sortierung:

Betrachtet man die angezeigten Treffer, so wird man nach der Mühe der Formulierung die Ergebnisse der hochgelobten Suchmaschine etwas enttäuschend finden. Der Grund ist der, daß sie unsortiert sind. Im Feld "Results Ranking Criteria" muß noch ein Sortierbegriff eingetragen werden. Als solchen kann man z.B. "cholesterol" oder "fish" wählen. Die Ergebnisse werden dann entsprechend Relevanz-sortiert ; es werden aber jeweils nur solche Treffer angezeigt, die den Sortierbegriff auch enthalten.

Anmerkung: AltaVista akzepiert auch wesentlich kompliziertere Suchfragen wie im genannten Beispiel, nur kann man dann häufig nicht mehr sortieren (Meldung: "no documents match the query").

Ein Ranking ist auch nicht möglich, wenn in der Suchanfrage eine Einschränkung auf Felder erfolgt. (So hätte man anstelle von nur "com" eigentlich präziser "domain:com" eingeben müssen - s.u.).

Der Ausschluß kommerzieller Server ist im vorliegenden Fall ein guter Trick, um irrelevante Treffer auszuschließen. Eine andere Möglichkeit - häufig die "letzte Möglichkeit" - ist die Einschränkung über den Bereich "Date". AltaVista bietet die Möglichkeit, einen Suchzeitraum zu definieren. Das "Datum" eines Dokuments ist dabei das, welches im "Document Info" von Netscape unter "last modified" angezeigt wird. (Bei der Datum-Eingabe bitte genau das Muster beachten - auch den ersten Buchstaben des Monats groß schreiben!)

Feldsuche:

Wie bereits erwähnt, können Suchbegriffe auf bestimmte "Felder" beschränkt werden. So werden mit "title:fahrrad" nur Dokumente ermittelt, in denen "Fahrrad" im Title Tag des HTML-Dokuments vorkommt. Die Eingabe erfogt stets in der Reihenfolge <Feldbezeichnung>:<Suchbegriff>.

Ein anderes wichtiges Feld für Wort-Suchbegriffe ist "anchor". Mit dieser Feldbezeichnung werden Dokumente ermittelt, bei denen der Suchbegriff im Text eines Links vorkommt.

Bezüglich der mit den URLs verknüpften Felder haben wir schon das Feld "domain " kennengelernt. Eine häufige Anwendung ist die Beschränkung auf einzelne Länder. So wird mit "...and domain:de" eine Suche auf deutsche Dokumente bschränkt.

Zwei weitere Felder werden wir am Beispiel einer sog. "Zitatsuche" kennenlernen:

Angenommen, man möchte wissen, welche WWW-Seiten auf Angebote der UB Bielefeld verweisen. Die zugehörige Suchfrage lautet:

link:www.ub.uni-bielefeld.de and not url:www.ub.uni-bielfeld.de

(oder in der Simple Search: +link:... -url:... ).

Mit "link" werden verweisende Seiten ermittelt, mit "url" werden verweisende Seiten der UB Bielefeld ausgeschlossen.

Weitere Details können den Hilfetexten von AltaVista entnommen werden.

Groß- und Kleinschreibung und Verwendung von Akzenten:

Generell ist die Eingabe von Suchbegriffen in Kleinschreibung zu empfehlen: Sobald ein Buchstabe groß geschrieben wird, werden sämtliche Buchstaben des betreffenden Wortes exakt auf Groß- und Kleinschreibung überprüft. Andere Varianten der Schreibweise werden dann nicht ermittelt! Entsprechendes gilt für Akzente.


Ultraseek (Infoseek)

http://infoseek.com/Home?pg=ultra_home.html

Ultraseek gehört zu den größten, leistungsfähigsten und schnellsten Suchmaschinen. Sie ist seit Mitte 1996 in Betrieb als Teil des Suchmaschinendienstes Infoseek Corporation. Infoseek ist auch der Name des Vorgängers von Ultraseek. In den meisten Suchmaschinen-Übersichten hat man den alten Namen beibehalten. Bei Relevanz-Tests wird Ultraseek durchweg an erster oder zweiter Stelle genannt.

Unverbunden eingegebene Suchbegriffe werden nach der fuzzy-AND- Logik gesucht. Die Suchmöglichkeiten können über die +/-Syntax erweitert werden (s.o.). Phrasensuchbegriffe werden durch "..." gekennzeichnet. Auch Bindestrichbegriffe, z.B. signal-to-noise ,

und Namen (aufeinanderfolgende Worte mit großen Anfangsbuchstaben), z.B. John December, werden als Phrasen interpretiert.

Ultraseek hat keine Trunkierfunktion, verfügt aber über eine (automatische) Wortstammsuche - allerdings nur für englische Begriffe. Man kann sich i.d.R. darauf verlassen, daß Singular- und Pluralformen zusammengeführt werden, auch unregelmäßige (mouse - mice). (Ausnahmen bilden Wörter mit geringen Trefferzahlen, z.B. "poset", die offenbar noch nicht erfaßt wurden. Bei diesen müssen Singular- und Pluralformen einzeln gesucht werden.) Bei den Verben werden offenbar nur kurze Flexionsendungen berücksichtigt. Mit prevent werden auch prevents und prevented mitgesucht, aber nicht preventing oder preventive . Im großen und ganzen kann die Wortstammsuche bei Ultraseek aber als akzeptabler Ersatz für die fehlende Trunkiermöglichkeit betrachtet werden.

Muster-Suchfrage:

=> oat "red wine" oil diet dietary +cholesterol -vegetarian

"dietary" wird nicht automatisch mitgesucht und muß separat eingegeben werden.

ƒhnlich wie bei AltaVista können auch bei Ultraseek Sortierbegriffe für die Trefferanzeige vorgegeben werden (worauf merkwürdigerweise nur selten hingewiesen wird). Der Sortierbegriff muß mit | an das Such-Statement angehängt werden, z.B.

=> phytochemicals|olive => phytochemicals|antioxidant usw.

Wie bei AltaVista können Suchbegriffe auf bestimmte Felder beschränkt werden. Das Angebot an Feldern (s. Hilfetext) ist aber weniger differenziert. Eine "Zitatsuche" ist auch hier möglich (Eingabe wie in der Simple Search von AltaVista - s.o.).

Bei der Anzeige bietet Ultraseek auch die Möglichkeit einer einzeiligen Trefferanzeige an, bei der dann Portionen von jeweils 20 Treffern betrachtet werden können - anstelle von sonst nur 10 (mit Beschreibung). Dies ist manchmal hilfreich, um Trefferlisten

schneller durchchecken zu können.

Es bleibt noch darauf hinzuweisen, daß Ultraseek auch eine empfehlenswerte Suchmaschine für die Suche in Usenet (Newsgroup- Beiträge) ist - wegen des Umfangs und vor allem wegen der Ausführlichkeit der Trefferanzeige.

Außerdem ist Ultraseek die einzige Suchmaschine, in der man separat nach FAQs (Extrakte der Newsgroup-Diskussionen) suchen kann.


Excite

http://www.excite.com/

Excite von Architext Software ist neben Ultraseek und AltaVista eine der größten - vermutlich die größte Suchmaschine.

Wie bei Ultraseek gibt es nur ein Eingabefeld. Es können sowohl Boolesche Operatoren (AND, OR, AND NOT) verwendet werden als auch die bekannte +/-Syntax. Phrasensuchbegriffe werden auch hier durch "..." gekennzeichnet.

Die Eignung von Excite für gezielte Suchen wird erheblich dadurch eingeschränkt, daß weder eine Trunkierfunktion noch eine Wortstammsuche angeboten wird. Die Suchen führen dennoch i.a. zu akzeptablen Ergebnissen aufgrund eines Suchkonzepts, das sich "Intelligent Concept Extraction Searching" nennt. Dies bewirkt, daß zusammen mit den eingegebenen Suchbegriffen statistisch korrelierte Begriffe mit gesucht werden. Der Vorteil ist der, daß dadurch Dokumente als relevant eingestuft werden, die man sonst vermutlich nicht entdeckt hätte (in einigen Fällen führt das Verfahren aber auch zu "drops"). Der Nachteil ist die fehlende Transparenz des Verfahrens.

Interessant ist, daß man die Gewichtung eines Suchbegriffs erhöhen kann, indem man ihn doppelt eingibt - s. Suchbeispiel. (Bei anderen Suchmaschinen wird die doppelte Eingabe ignoriert.)

Gründe, die Suchmaschine Excite zu benutzen, sind vor allem zwei Sonderfunktionen:

1. "More-like-this"

Erweist sich ein einzelner Treffer als besonders relevant, so läßt sich durch Anklicken des Links "More-like-this" eine ƒhnlichkeitssuche durchführen. Dabei werden für das Dokument charakteristische Suchbegriffe identifiziert und intern zu einer Suchanfrage kombiniert, die zu inhaltlich ähnlichen Treffern führt. Manchmal lohnt es sich, ein mit einer anderen Suchmaschine ermitteltes Dokument in Excite noch einmal nachzurecherchieren, um ähnliche Dokumente dazu zu ermitteln.

Primärsuche (Thema: Tabellarische Funktionsübersichten zu Suchmaschinen, die die Proximity Search enthalten"):

=> proximity yes yes

"More-like-this-Suche" für den Titel "Web search tools"

2. Excite bietet eine Sortieroption: "View by Web Site" an, bei

der die Treffer nach den Servern sortiert sind. Dadurch ist es möglich, Dokumente auf besonders relevanten Servern zu identifizieren - auch eine Möglichkeit, um "die Spreu vom Weizen zu trennen".

Anzeige:

Die Anzeige ist insofern beachtenswert, als die Summaries nicht mechanisch dem Anfang des Textes entnommen werden, sondern aufgrund einer statistischen Analyse des Dokuments besonders aussagekräftige Sätze ausgewählt werden.

Wie bei Ultrassek können die Summaries auch "abgeschaltet" werden - mit der Wirkung, daß man wieder 20 Treffer anstelle von sonst nur 10 angezeigt bekommt.


Summarische Charakterisierung der Suchmaschinen Lycos, Opentext und WebCrawler

Lycos:

http://www-german.lycos.com/

Diese Suchmaschine, die, bevor es AltaVista gab, allgemein als Favourit galt, kann von der Größe her auch noch mit den heutigen Favouriten konkurrieren, verfügt aber nur über relativ beschränkte Retrievalfunktionen - insbesondere, was die Verknüpfungsmöglichkeiten betrifft.

(Die Aussage, Lycos verfüge über eine automatische Rechtstrunkierung, ist überdies irreführend: Es werden derzeit nur die nächsten 10 - keine Ziffern enthaltende - Begriffe des Datenbank-Wörterbuchs automatisch mitgesucht. Dieser Wörterbuchbereich ist aber so eng, daß damit in den meisten Fällen noch nicht einmal die "nächste" Flexionsendung erfaßt wird.)

Daß Lycos trotz der Größe bei komplexen Suchanfragen schlecht abschneidet, liegt an der fehlenden Volltextindizierung. Die suchbaren Begriffe werden in empirisch nicht genau nachvollziehbarer Weise nach der Stellung im Text (Titel, erste 20 Zeilen) und nach "Wichtigkeit" (umgekehrt zur Häufigkeit in der Datenbank) ermittelt. Die Art der Indizierung führt zu einer unter Umständen erwünschten Titelselektion bei Suchanfragen, die bei anderen Suchmaschinen zu sehr großen Treffermengen führen.


OpenText:

http://index.opentext.net/

Opentext ermöglicht die Verwendung logischer Operatoren in einer menügeführten Form. Wegen fehlender Möglichkeit der Klammerung sowie fehlender Trunkiermöglichkeit ist dies so ziemlich der einzige Vorteil. Die Trefferquoten sind aber auf niedrigem Niveau relativ stabil und betragen größenordnungsmäßig etwa 10% derjenigen von AltaVista (s. Suchmaschinen-Vergleich).


WebCrawler:

http://webcrawler.com/

Die Suchfunktionen entsprechen weitgehend denen von Excite von Architext Software, der jetzt auch der WebCrawler gehört. Bei komplexen Suchanfragen schneidet WebCrawler aufgrund der Volltextindizierung sogar besser ab als Lycos. Im Vergleich zu OpenText schwankt der Sucherfolg bei den einzelnen Suchanfragen aber relativ stark, so daß der WebCrawler für systematische Suchen weniger zu empfehlen ist. (Hier macht sich die geringe Datenbankgröße bemerkbar.)

Der WebCrawler eignet sich dagegen vorzüglich zum "Surfen" aufgrund einer Besonderheit der Rankings: Die Treffer sind in vielen Fällen Seiten, in den die Suchbegriffe nicht im Text, sondern in den Links vorkommen. Derartige Seiten enthalten in vielen Fällen auch andere Links zu gleichen oder verwandten Themen. Auf diese Weise wird man sowohl auf gute Informations- /Übersichtsseiten geführt als auch auf weitere Informationsquellen, nach denen man eigentlich gar nicht gesucht hatte.


Verzeichnisse

Übersicht

Service

Größe 

Niveau

Reviews 
Zeilen/Stil

Felder

Wertung 

UntGrup

S: suchbar

Yahoo

~500.000

+

0-2
Annotat.

cool (icon)

14-<<

S

Looksmart

150.000 

(-) 

2
deskriptiv

-

-

10-<<

S

Excite Reviews

60.000

4
populär

-

1-4

16-<<

S

Magellan 

>40.000 

(+)

10
populär

14

1-4

26

S

Cyberhound 

>30.000

+

~8
deskriptiv

30

1-4

75

S

Lycos A2Z

~22.000
meist zitierte

+

2-5
deskriptiv

-

-

16-<<

S

INFOMINE

~10.000

akad. +

2-10
deskriptiv

-

-

8-<<

S

Lycos Point Top 5%

~7.000

(-)

10
populär/deskriptiv

-

0-50

18 -<<

S

WebCrawler Select

~1.000

+

3-6
deskriptiv

-

-

17-<<

-

Planet Earth

~1.000

-

-

-

13 (-<< : science)

-

Erläuterungen:

-<< : Es sind Untergruppen hierzu vorhanden.

Mehrere Angaben (z.B. Qualifizierung der Reviews) sind der Übersicht von Greg R. Notess "Comparing the Subject Directories" (http://www.universe.digex.net/~gnotess/search/direct.html) entnommen.

Übersichten mit weiteren Verzeichnissen
und
Verzeichnis-Suche über Meta-Suchmaschinen
siehe Bookmarks (=> Verzeichnisse)


Einzelne Verzeichnisse

Yahoo

http://www.yahoo.com/

Yahoo ist mit Abstand das größte und polulärste fachlich gegliederte Verzeichnis, das aber auch als Datenbank vorzüglich suchbar ist. Der als "hierarchical hotlist database" konzipierte Dienst wurde von zwei engagierten Studenten der Stanford University geschaffen und 1994 auf einem Server der Universität angeboten. Mittlerweile beschäftigt das selbständig gewordene Unternehmen weltweit einige Dutzend Mitarbeiter. Der Originaldienst, der primär amerikanische Informationsbedürfnisse abdeckt, wurde inzwischen durch mehrere nationale Ableger mit eigenen Informationsangeboten ergänzt - so auch Yahoo Deutschland. Die Erläuterungen beziehen sich immer auf den amerikanischen Originaldienst.

Die Einträge basieren überwiegend auf Meldungen, die von Mitarbeitern geprüft, annotiert und fachlich zugeordnet werden. Yahoo benutzt aber auch einen Roboter, der verschiedene Sites nach Neuigkeiten absucht. Yahoo ist die erste Wahl, wenn man etwas sucht, von dem man noch keine ganz präzisen Vorstellungen hat, und man sich aufwendige Recherchen ersparen möchte. Wissenschaftlich relevante Informationen sind relativ gut repräsentiert. Einige Yahoo-Seiten haben einen ausgesprochenen Referenzcharakter, z.B. die Yahoo-Seiten über Suchdienste im WWW.

Die Gliederung beginnt mit 14 Hauptgruppen und umfaßt bis zu 7 Hierarchstufen (Medizin). Die Seiten zu den Großgruppen enthalten Orientierungshilfen in Form des "Subcategory Listing" (unterhalb des Eintrags "Indices"), das den gesamten Hierarchiebaum der Großgruppe abbildet, so daß man sich nicht auf gut Glück durch die einzelnen Seiten hindurchzuhangeln braucht. Die übrige Einteilung ist auf allen Seiten gleich: Ganz oben gibt es ein Eingabefeld für eine Datenbanksuche, die man wahlweise in der ganzen Yahoo- Datenbank durchführen kann oder eingeschränkt auf den aktuellen Subtree (aktuelle Seite mit Untergruppen).

Beachtet werden sollte der folgende Punkt "indices", der auf zusammenfassende Informationsquellen zum Thema der Seite hinweist. Darauf folgen - immer soweit vorhanden - die Links der Untergruppen und anderer relevanter Yahoo-Seiten ("Verweisungen" - gekennzeichnet durch @ ). Die Zahl der Dokumente ist jeweils in Klammern angegeben. Danach werden die einzelnen Nachweise (Dokumente) zum Thema der Seite aufgeführt, die auch Gopher- und FTP-Informationen sowie Newsgroups sein können. Neue Seiten und Einträge werden mit "New" gekennzeichnet.

Die Beschreibungen sind unterschiedlich ausführlich und fehlen in vielen Fällen ganz. Eine Wertung findet nicht statt - mit Ausnahme von Angeboten, die durch ein Icon (Brille) gekennzeichnet sind (früher als "cool" gekennzeichnet) und am Anfang der Titelliste stehen.

Suchkomponente:

Über den Link "Options" - neben dem Search Button auf den Yahoo- Seiten - gelangt man zu der ausführlichen Search Box. Man kann dort wählen zwischen einer Suche in Yahoo (Vorauswahl), Usenet oder Email Adresses. Der voreingestellte Suchmodus "Intelligent default" kann in AND, OR oder (exakte) Phrasensuche geändert werden. Die Einstellung "Intelligent default" erlaubt auch die Verwendung der bekannten +/-Syntax. Suchbegriffe können mit "*" trunkiert werden. Als Ergebnisse werden sowohl einschlägige Yahoo-Seiten als auch Yahoo-Dokumente angeboten. Bleibt die Yahoo-Suche ohne Ergebnis, wird die Suchanfrage automatisch an die Suchmaschine AltaVista weitergeleitet.


Looksmart

http://www.looksmart.com/

Looksmart (schon mal gehört?) ist nach Yahoo das zweitgrößte Verzeichnis. Die Dokumente werden von Editorial Teams zusammengetragen. Das Nivau der Auswahl scheint etwa dem der "Excite Reviews" oder von "Lycos Point Top 5%" zu entsprechen. Looksmart ist interessant wegen seines Java-unterstützten Layouts: Während man die Hierarcheebenen durchwandert, öffnen sich von links nach rechts Menüfenster in der Weise, daß sowohl der Suchweg als auch die aktuellen Untergruppen abgebildet werden. Die Auswahllisten (Dokumente) sind sehr selektiv, die Annotationen kurz und rein beschreibend.


Excite Reviews

http://www.excite.com/Reviews/

Hierarchisch organisiertes Verzeichnis, das neben Web-Seiten auch Usenet News, Bulletin Boards u.a. verzeichnet. Schon wegen des Umfangs sind auch relativ viele fachlich relevante Informationsquellen enthalten. Die Gliederung umfaßt bis zu 4 Hierarchiebenen, von denen die erste die Großgruppenübersicht ist. Im laufenden Monat (Juni 1997) waren verschiedene Versionen der Seiten mit und ohne Kurz-Titellisten zu besichtigen.

Die Reviews sind relativ kurz und in einem populären, journalistischen Stil von ca. 15 thematisch spezialisierten Mitarbeitern verfaßt. Sie sind mit Wertungen (icons) von 1 bis 4 versehen. Die Excite Reviews sind über mehrere Meta-Suchmaschinen suchbar.


Magellan

http://www.mckinley.com/ oder http://brain.biologie.uni-freiburg.de/Atlas/Fischbach/advsearch.html

Wegen seines umfangreichen Review- und Bewertungsystems ist Magellan eines der best etablierten Verzeichnisse - trotz seines polulären, teilweise auch unterhaltenden Charakters. Lizenznehmer sind u.a. IBM und Microsoft. Die Beratung hinsichtlich Auswahl und Erschließung obliegt einem internationalen Editorial Advisory Board, dem Fachleute aus verschiedenen Bereichen einschließlich des Hochschulbereichs angehören. Auswahl und Annotierung erfolgen durch "professional writers and editors".

Das Material ist in 26 Sachgruppen - ohne Untergruppen! - geordnet, so daß neben einem Browsing die Benutzung der Suchfunktion angezeigt ist. Magellan ist auch der Name einer Roboter-basierten Suchmaschine, in deren Suchmaske die Review- Suche integriert ist.

Die Reviews von Magellan gehören zu den umfanreichsten. Neben diesen werden Metadaten-Informationen unter 14 Headings angeboten. Die Quellen sind mit 1 bis 4 Sternen bewertet für:

Letzterer Punkt steht für innovativ, "appealing", und intellektuell-provokativ.

Durch die Integration in die Suchmaschinen-Suche werden für die Reviews-Suche die gleichen Such- und Sortierfunktionen bereitgestellt wie für die Suche im Web. Insbesondere werden die Suchergebnisse auch nach Relevanz sortiert.


Cyberhound

http://www.thomson.com/cyberhound/simplesearch.html

http://www.thomson.com/cyberhound/expertsearch.html

Cyberhound ist ein von Gale Research herausgegebenes, umfangreiches Verzeichnis. Gale Research ist ein amerikanischer Verlag, der auf von Bibliotheken bezogene Nachschlagewerke spezialisiert ist. Entsprechend orientiert sich das Verzeichnis an den Bedürfnissen der Verlagsklientel (Bibliotheken, Universitäten). Neben Web-Seiten werden auch Gopher-, FTP- und Telnet-Angebote sowie Newsgroups erfaßt und sind für die Suche auswählbar.

Die mittellangen Reviews, die in konzentrierter Form das Wesentliche beinhalten, sind Teil eines über 30 Felder umfassenden Erfassungsschemas, in denen alle nur denkbaren Typen und Formen von Metadaten erfaßt werden (LC Subject Headings, Sprache, Zeitraum, Aktualität, Länder, Publikationstypen, Formate usw.) Das Bewertungssystem umfaßt ein Overall Rating (1-4 Sterne) und zusätzlich ein differenziertes Rating (jeweils 1-4 Sterne) für:

Der Einstieg erfolgt obligatorisch über eine Suchmaske, wobei neben der Simple Search, die schon über relativ viele Optionen verfügt, auch eine Expert Search angeboten wird. In beiden Suchmodi gibt es ein Suchfeld für eine Stichwortsuche, das aber auch leer bleiben kann, wenn man - was manchmal sinnvoll ist - die "Suchanfrage" lediglich über eine Auswahl der über Pull-down-Menüs angebotenen Suchkriterien formuliert. Die fachliche Einschränkung erfolgt über 75 Großgruppen. (In der Expert Search kann zusätzlich nach LC Subject Headings gesucht werden.) Ferner ist in der Simple Search auch eine Einschränkung nach "Types of Resources" möglich (Gesellschaften, Datenbanken, Bibliotheken, Personal Sites usw.). In der Expert Search scheint Professionalität allerdings in Unsinn umzuschlagen, da fast sämtliche Aspekte des umfangreichen Erfassungsschema in einem mehrseitigen Suchmenü recherchierbar gemacht werden. Immerhin ist es aber nützlich, Dokumente nach bestimmten Rankingkriterien (z.B. "content") abfragen zu können.


Lycos A2Z

http://a2z.lycos.com/

Lycos A2Z weist die "populärsten" Seiten nach - gemessen an der Zahl der Links (in anderen Dokumenten), die auf diese hinweisen ("meistzitierte" Seiten). Diese Informationen fallen automatisch bei der Erstellung der Datenbank der Lycos-Suchmaschine an. Lycos A2Z ist ein ausgesprochen nützlicher Dienst, dessen Auswahl - da sie automatisch erfolgt - über jede Kritik erhaben ist.

Die Gliederung besteht aus 16 Hauptgruppen mit insgesamt 66 Untergruppen. Die Reviews sind informativer als die von Point Reviews, obwohl sie kürzer sind.

Das Browsing in A2Z ist wegen des Umfangs einzelner Gruppen problematisch. (Bei Problemen mit der Cache-Funktion des Browsers sollte man für das "Rückholen" bereits besuchter Seiten im Dialog besser die Funktion Save/Open File benutzen.) Die Benutzung der Suchfunktion ist insofern ärgerlich, als man als deutscher Direktbenutzer automatisch auf dem deutschen Lycos-Rechner landet, der in der Ergebnisanzeige die Reviews unterschlägt. Man vermeidet dies, indem man die Suche über eine Meta-Suchmaschine, z.B. Internet Sleuth, durchführt.


Infomine

http://lib-www.ucr.edu/Main.txt.html

Infomine ist ein beachtenswertes Verzeichnis, das von der Bibliothek der University of California at Riverside für eine überwiegend akademische Klientel erstellt wird. Infomine repräsentiert zusammen mit Cyberhound einen neuen qualitäts- und klientelbezogenen Typ von Verzeichnissen. Trotz des positiven Gesamteindrucks sind einige Sektionen (s.u.) noch unzureichend abgedeckt.

Der fachliche Einstieg erfolgt über eine von 10 Sektionen, die auf der Haupseite unter "Academically Valuable Resources In:" auszuwählen ist. Zu jeder Sektion werden drei alphabetische Einstiegslisten angeboten: Keyword List, Subject List, Title List, ferner eine "Table of Content", in der die Links zu den nachgewiesenen Quellen in größeren Gruppen zusammengefaßt sind. Jede Sektion hat ihre eigene Datenbanksuche (die häufig mehr zutage fördert als das Browsing).

Die Annotationen sind beschreibend und variieren im Umfang zwischen knapp und ausführlich.


Lycos Point Top 5%

http://point.lycos.com/categories/index.html

Der Review-Service Point Reviews wurde von Lycos übernommen und ist als selbständiges Angebot über den Suchmaschinendienst Lycos recherchierbar. Die Reviews kommen von ein bis zwei Dutzend Mitarbeitern (Motto: "Excellence is our only criterion"). Zitat aus einem Kommentar der Seite Starting Points: "Categories include both academic topics as well as recreational and fun sites." Der Schwerpunkt scheint mehr auf dem Unterhaltungscharakter, der Präsentation und dem besonderen "Pfiff" als auf dem Inhaltlichen zu liegen.

Das Angebot ist in 18 Hauptgruppen gegliedert. Die Gliederung ist weniger differenziert als die von Lycos A2Z. Die Reviews sind relativ lang, aber leider nicht immer entsprechend informativ.


WebCrawler Select

http://webcrawler.com/select/

WebCrawler Select ist die Fortführung des Review-Service "Whole Internet Catalog" innerhalb des "Global Network Navigator"(GNN)- Informationssystems des Verlags O'Reilly and Associates. Dieser war die erweiterte Online-Version des Quellenteils zu dem "Internet-Klassiker" von Ed Krol: "The Whole Internet User's Guide and Catalog". Mit WebCrawler Select wird diese Tradition einer hand-verlesenen Sammlung der besten Sites mit vorzüglichen Reviews fortgeführt. Besonders hervorzuheben ist die Review-Sektion über Suchdienste im Internet.


Planet Earth

http://www.nosc.mil/planet_earth/info_modern.html

Dieses Verzeichnis mit dem Domainnamen "mil" rangiert in Bezug auf den Umfang am Ende der Auswahl. Es handelt sich um ein hierarchisch gegliedertes Verzeichnis vom "Listen"-Typ, d.h. die Quellen werden ohne Annotationen aufgeführt. Der Einstieg erfolgt über 13 Bereiche (Räume) einer "virtuellen" Bibliothek. Nur die Bereiche Science 1+2 sind ausdifferenziert und zu empfehlen.


Guides

"Guides" steht hier für fachübergreifend organisierte Sammlungen von fach- oder themenbezogenen Informationsführern zu Internet-Ressourcen. Im Unterschied zu den Fachgruppen der "Verzeichnisse" werden hier ausgewählte Informationsquellen in einem zusammenhängenden Kontext präsentiert. Die Strukturierung der Guides geht über eine rein hierarchische Gliederung hinaus. Einige Informationsführer analysieren und kommentieren auch die Angebotssituation des Faches unter der Fragestellung "Wie findet man was zu welchem Thema?". Es werden i.d.R. nicht nur Web-Seiten, sondern auch andere Internet-Informationsquellen ausgewertet.

Wer wissen möchte: "Was gibt es an Informationen zu meinem Fachgebiet?", sollte zuerst die folgenden Informationsdienste konsultieren.


The WWW Virtual Library

http://w3.org/pub/DataSources/bySubject/Overview2.html

Die WWW Virtual Library ist der älteste Informationsdienst dieser Art, der als "verteilter Sachkatalog" realisiert ist. Er wurde von Mitarbeitern des CERN - an der Geburtsstätte des World Wide Web - kreiert. Die institutionelle Betreuung ist inzwischen an das W3 Consortium übergegangen (dem als Mitgieder namhafte, in die Entwicklung des WWW involvierte Institutionen, Organisationen und Firmen angehören).

Das Konzept der WWW Virtual Library geht von der vernünftigen Annahme aus, daß die Experten zu den einzelnen Gebieten über die ganze Welt verteilt sind, und nicht unbedingt in der Redaktion eines zentralen Nachweisdienstes. Dementsprechend liegen die Seiten zu den einzelnen Themen auf verschiedenen Servern der ganzen Welt, wo sie von unabhängigen Expertenteams betreut werden. Die Funktion des zentralen Dienstes beschränkt sich im wesentlichen darauf, diese Seiten zu einem übersichtlichen, strukturierten Angebot zusammenzufügen. Die alphabetische Liste sowie der "Subcategory Tree" weisen ca. 270 anklickbare Informationsseiten auf. Empfohlen wird der Einstieg über den Subcategory Tree (obige URL), in dem die Überschriften der Seiten so organisiert sind, daß der Eindruck einer klassifikatorischen Ordnung entsteht. (Die experimentelle Gliederung nach der LoC- Klassifikation weist demgegenüber einige Mängel und Schönheitsfehler auf.)


Argus Clearinghouse
(früher Clearinghouse for Subject-Oriented Internet Guides)

http://www.clearinghouse.net/

Der Nachweisdienst Argus Clearinghouse basiert auf einer ähnlichen Philosophie wie die WWW Virtual Library. Nur werden hier die nachgewiesenen Fächer und Themenbereiche nicht über unabhängige, externe Seitenangebote abgedeckt, sondern über gezeichnete Beiträge, die den Charakter von annotierten Bibliographien haben. In der Anfangszeit wurden viele Guides als Student Projects (University of Michigan ; School of Information and Library Studies, Ann Arbor) realisiert. Aber auch heute noch sind fast alle Autoren - darunter auch einige bekanntere - aus den USA.

In die Hauptauswahl werden nur aktualisierte Guides aufgenommen. Diese werden nach einheitlichen Richtlinien erstellt und mit Ratings von 1 bis 5 für folgende Aspekte versehen, aus denen auch die Schwerpunkte ersichtlich sind:

Die mehr als 200 Guides werden in 13 Sachgruppen aufgeführt. Einige Gebiete werden durch mehrere Guides abgedeckt.


30.Juni 1997 Wolfgang Binder

HTML-Version: Michael Behrens