Auf den Spuren der Suchmaschinen

Im Rahmen eines Projektseminars haben Studenten der HAW Hamburg ein Poster zur technischen und gesellschaftlichen Entwicklung der Suchmaschinen im Zeitraum von 1990 bis 2016 erstellt. Der Fokus liegt auf Deutschland. Bei mittlerweile eingestellten Diensten wie Altavista, Lycos oder MSN Search denkt man zwangsläufig an die ersten eigenen Schritte ins Internet Mitte der 1990er-Jahre zurück – die dank Analog-Modem ständig belegte Telefonleitung der Eltern und die teuren Internet-by-Call-Tarife inbegriffen 😉 …

Das Poster ist kostenfrei in verschiedenen Formaten hinterlegt, inkl. professioneller Posterdruck.

Digitale Bibliothek zu Südostasien

Neu im Datenbank-Infosystem (DBIS) nachgewiesen ist die kostenfreie ASEAN Digital Library (ADL).

Die ADL ermöglicht eine Suche über die digitalisierten Bestände von zehn Nationalbibliotheken aus dem Verband südostasiatischer Nationen (engl.: Association of Southeast Asian Nations, ASEAN). Nachgewiesen werden gegenwärtig über 80.000 Objekte, u. a. Bücher, Handschriften, Karten, Zeichnungen, Gemälde, Fotografien, Zeitungen, Forschungsarbeiten, sowie Audio- und Videomaterialien aus folgenden Ländern:

  • Brunei (146 Objekte)
  • Indonesien (259)
  • Kambodscha (3568)
  • Laos (12.168)
  • Malaysia (1268)
  • Myanmar (5)
  • Philippinen (9867)
  • Singapur (26.113)
  • Thailand (209)
  • Vietnam (29.337)

Das Projekt wurde vom National Library Board of Singapore (NLB) ins Leben gerufen, unterstützt vom ASEAN Committee on Culture and Information (COCI).

Die Recherche-Maske unterstützt alphanumerische Zeichen. Die ASEAN Digital Library soll laut Anbieter laufend um weitere Inhalte bzw. Partnerinstitutionen ergänzt werden.

Forschungsdatensuche von Elsevier

Neu ins das Datenbank-Infosystem (DBIS) aufgenommen wurde die kostenfreie Elsevier DataSearch.

Die im Herbst 2016 von Elsevier entwickelte Suchmaschine, befindet sich momentan im Beta-Status. Die letzte Überarbeitung fand im zurückliegenden September statt. Recherchiert werden kann nach freien Forschungsdaten (Open Data) des niederländischen Wissenschaftsverlags sowie verschiedener Open-Access-Repositorien. Aufgenommen werden u. a. Illustrationen, Tabellen und weiterführende Daten.

Gegenwärtig werden folgende Online-Ressourcen komplett oder teilweise von DataSearch ausgewertet:

  • Dryad
  • EarthChem Portal (Auswahl) der Interdisciplinary Earth Data Alliance (IEDA)
  • Harvard Dataverse
  • The Inter-university Consortium for Political and Social Research (ICPSR)
  • Mendeley Data
  • NeuroElectro
  • PANGAEA
  • ThermoML – Thermodynamic Research Center (TRC) des National Institute of Standards and Technology (NIST)
  • Verschiedene Metadaten (u. a. 4TU.Centre of Research Data, University of Cambridge, Princeton University, University of Washington, London School of Hygiene & Tropical Medicine, Médecins Sans Frontières, Smithsonian, Zenodo)
  • Tabellen, Zahlen und ergänzende Daten von Dokumenten von arXiv und ScienceDirect

Geplant ist, die Suche irgendwann ins lizenzpflichtige Angebot von Elsevier zu übernehmen.

Mit Wolfram Alpha semantisch suchen

Neu als freie Ressource in die Digitale Bibliothek gekommen ist die Suchmaschine Wolfram Alpha, über die wir in der Vergangenheit schon berichtet hatten.

Wolfram Alpha ist ein Internetdienst zum Auffinden und Darstellen von Informationen. Die auf der Software Mathematica des britischen Physikers und Mathematikers Stephen Wolfram basierende semantische Suchmaschine gibt im Gegensatz zu anderen Internet-Diensten wie z. B. Google keine Liste von themenrelevanten Websites als Ergebnis aus. Stattdessen werden dem Nutzer Daten, Grafiken oder Bilder als direkte Antworten präsentiert. Der Fokus der Inhalte liegt nahezu ausschließlich im anglo-amerikanischen Bereich und auf Anfragen aus den exakten Wissenschaften. Andere Anfragen werden i.d.R. nur unzureichend verarbeitet.

Parallel zum kostenfreien Angebot steht ein Bezahldienst zur Analyse von Daten in zahlreichen Formaten zur Verfügung.

Japans „Aufsätze-Navigator“

Der vom japanischen National Institute of Informatics (NII) herausgegebene Scholarly and Academic Information Navigator (kurz „CiNii“) ermöglicht die Suche nach Aufsätzen aus wissenschaftlichen Fachzeitschriften aller Wissensgebiete, darunter auch Einträge aus dem Zeitschriftenindex der japanischen Nationalbibliothek (National Diet Library’s Japanese Periodicals Index Database).

Gegenwärtig werden fast 15 Mio. Einträge erschlossen, darunter sowohl kostenpflichtige Aufsätze als auch kostenfreie bzw. im Open-Access-Verfahren bereitgestellte Artikel. Ebenso steht eine Suche nach Zeitschriftentitel bzw. Fachgebiet zur Verfügung. Die Benutzeroberfläche wird in englischer und japanischer Sprache angeboten.

Ein Export von bibliographischen Daten ist möglich (unterstützte Formate: BibIX, BibText und TSV).

Scientific Commons neu in der Digitalen Bibliothek – OAIster umgezogen

imagesIn die Digitale Bibliothek neu aufgenommen wurde die wissenschaftliche Suchmaschine Scientific Commons. Sie versteht sich als eine Plattform, die die Suche nach frei zugänglichen wissenschaftlichen Publikationen aus allen Fachgebieten ermöglicht. Entwickelt wurde Scientific Commons am Institut für Medien und Kommunikationsmanagement der Universität St.Gallen. Über die Suchmaschine sind derzeit mehr als 32 Millionen Publikationen von über 1000 Dokumentenservern aus 59 Ländern auffindbar (Stand: Januar 2010).
Ein besonderes Feature ist die institutionen- und archivübergreifende Identifizierung von Autoren und die Zuordnung ihrer wissenschaftlichen Publikationen sowie das Browsen im Netzwerk der Co-Autorschaften.

OAIster, die – nach Scirus – „dienstälteste“ Suchmaschine für Open-Access-Inhalte, die ursprünglich von der University of Michigan betrieben wurde, ist im Oktober 2009 an OCLC (Online Computer Library Center) übergeben worden. Die in OAIster gesammelten Daten werden zurzeit nur über den von OCLC betriebenen WorldCat gefunden. OCLC arbeitet aber an einer eigenständigen Suchoberfläche für OAIster, die für Januar 2010 angekündigt ist.

Wenn „Wolfram“ keine Antwort kennt, haben Sie vor allem falsch gefragt

wolfram_icon1 Angeblich suchen ja nur BibliothekarInnen gern – alle anderen wollen lieber gleich was finden. So oder so ähnlich ist vermutlich auch die Motivation von Stephan Wolfram zu erklären, eine neuartige Suchmaschine fürs Internet zu entwickeln, die nicht nur schnöde Referenzierungen zu Dokumenten auf verteilten Servern liefert, sondern gleich handfeste Antworten.

Stephan Wolfram, ein britischer Überflieger, der mit 20 Jahren in theoretischer Physik promovierte und danach mit spektakulären Veröffentlichungen auf sich aufmerksam machte, hat in den 1980er Jahren das Software-Paket Mathematica entwickelt, mit dem seither Forscher weltweit Gleichungen lösen oder Banker Kursprognosen erstellen (ob hier ggf. Zusammenhänge mit der aktuellen Wirtschaftskrise zu sehen sind, muss an dieser Stelle offen bzw. anderen Verschwörungstheorien überlassen bleiben).

Von dieser geballten Logik profitiert jedenfalls auch seine experimentelle Suchmaschinenentwicklung namens „Wolfram Alpha“. Die schon als vermeintlicher Google-Killer apostrophierte Anwendung – das zeigen schon wenige Testrecherchen – muss aber mit „sinnvollen“ Fragen gefüttert werden, damit der mathematisch-naturwissenschaftlich ausgerichtete „Wolfram“ brauchbare Lösungen bieten kann.

So kann man zwar zu vielem, was „rechenhaft“ ist, sich also in Zahlen ausdrücken lässt, erstaunliche Antworten bekommen (Bevölkerung von Buenos Aires, aktuelle relative Luftfeuchtigkeit, Zusammensetzung von Carbon-Stahl …), bleibt aber unverstanden, wenn Namen oder sachliche Zusammenhänge gefragt sind (Suche nach „Horkheimer“: … „Meinten Sie ‚Herkimer‘?“). Die Suche nach „World War I“ fördert immerhin die Daten von Beginn und Ende des Weltkriegs zu Tage (und die beteiligten „Protagonisten“ … „Archduke Ferdinand[!], … Woodrow Wilson, … Kaiser Wilhelm“). Zu „Dancing Queen“ fallen Wolfram „ABBA“, die schwedischen Komponisten, das Release-Date und die höchste Chart-Position ein – zu Led Zeppelin nichts mehr, außer „Music Performers“. 😉

Das semantische Web lässt also noch auf sich warten (Nova Spivack, amerikanischer Suchmaschinenguru, erklärt in einem Interview mit SPIEGEL-Online auch warum). Und: Die Datenbasis von „Wolfram“ ist gegenüber der derjenigen der führenden Suchmaschinen-Konkurrenz viel zu klein; der Fokus der Inhalte liegt nahezu ausschließlich im anglo-amerikanischen Bereich.

Damit die Webrecherche semantisch werden kann, braucht es vielleicht doch BibliothekarInnen. Denn die haben schon immer gewußt, dass für eine scharfsinnige Suche gute Metadaten erforderlich sind. Daran krankt aber auch das (Mit-mach-2.0-) Web.

Eben, wer sucht schon gern … !?

P.S. Dank an „Pit“ für den schönen Link auf https://www.searchengine-compr.com/ und die Inspiration für dieses Posting …

Die Maschine mit dem „Bing“

Seit letzter Woche online, gibt es schon jede Menge Echo auf die neue Suchmaschine, mit der Microsoft endlich gegen Google punkten will. Nachdem der letzte Anlauf („Live Search“) eher als Rohrkrepierer betrachtet werden muss, erhält „Bing“ durchaus positive Resonanz, so dass sich die geschätzten 100 Mio. EURO, die Microsoft angeblich in die Vermarktung des neuen Online-Dienstes pumpt, vielleicht als gute Investition erweisen.

Wer allerdings nach „Bing“ „googelt“ 😉 und zum ersten Treffer unter Bing.com wechselt, wird enttäuscht werden; hier erwartet einen nur die alte „Live Search“-Technologie in neuem Gewande (wie hieß es dazu unlängst humorlos in INETBIB: „Gesehen, gelacht, geloescht … „).

Interessanter und womöglich gar zukunftsweisend wird es dagegen beim US-amerikanischen „the real Bing“ (dazu am besten https://www.bing.com/?mkt=en-us direkt ansteuern!). Links neben den Suchergebnissen präsentiert „Bing“ kontextsensitive Begriffe, um die Recherche weiter zu konkretisieren; auch eine Suchhistorie wird vorgehalten. Seine echten Stärken zeigt „Bing“ aber bei der Aufbereitung von Fotos und Videos. So startet z.B. eine Kurzfassung eines Videoclips, sobald der/die Anwender/in mit der Maus über die Voranzeigen der gefundenen Dokumente scrollt.

Ob sich Platzhirsch „Google“ jetzt warm anziehen muss? Für Yahoo (als bisheriger – weit abgeschlagener – Verfolger) dürfte es jedenfalls schon eng werden, berichtet u.a. „Futurezone“ von ORF.at (vgl. https://futurezone.orf.at/stories/1604059/).

JURN – Recherchieren in 2300 freien E-Zeitschriften

JURN ist ein Portal für überwiegend englischsprachige E-Zeitschriften aus dem Bereich der Künste und der Geistes- und Sozialwissenschaften.

Die Inhalte der über 2.300 „hand-picked“/hand-ausgewählten Titel (vgl.: Titelliste als pdf-Datei) sind entweder vollständig oder in signifikanten Auszügen kostenfrei und ohne Registrierung abrufbar. Unter anderem enthalten sind 850 E-Zeitschriften aus dem britischen Fachportal „Intute“ und dem „Directory of Open Access Journal“ (DOAJ).
Ein kleiner Teil umfasst auch ausgewählte Weblogs, Konferenzschriften und Zeitschriftenverzeichnisse.

Lizenzpflichtige Angebote wie z. B. Project Muse, Sage, Blackwell oder JSTOR werden von JURN nicht ausgewertet.

Mittels einer Suchmaschine auf Basis der „Google Custom Search“ kann die Datenbank durchsucht werden. Einen thematischen Überblick über eine Auswahl der Zeitschriften bietet das FlashJava-animierte „JURN directory“.

Dank für dieses Posting an Marc Spieseke aus der UB