Primo und die chinesischen Schriftzeichen

Mit zwei Graduiertenschulen im Bereich Ostasien wird an der Freien Universität ein deutschlandweit einzigartiger Bestand von ostasiatischer Literatur aufgebaut. Im FU-Katalog des Bibliotheksportals Primo[1] verzeichnen wir derzeit rund 50.000 originalschriftliche Medien in chinesischer, koreanischer und japanischer Schrift, Tendenz steigend.

Bisher mussten chinesische Schriftzeichen, die nicht nur in China und Taiwan sondern auch in Japan sowie Nord- und Südkorea verwendet werden, in unterschiedlichen Schreibweisen eingegeben werden, um alle vorhandenen Bestände im Bibliotheksportal zu finden. Ursache ist die Herausbildung verschiedener Schreibvarianten der chinesischen Schriftzeichen, die im Verlauf der Jahrtausende ihres Gebrauchs entstanden sind (die älteste Verwendung von Schriftzeichen datiert auf die Zeit 1200-1050 v. Chr.). Um solche ideographischen Varianten bei der Suche zu berücksichtigen, wurde im Dezember 2015 auf Initiative der Campusbibliothek der Freien Universität Berlin die TSVCC Mapping Table[2] der Hong Kong Innovative Users Group (HKIUG) eingespielt, die die Vollständigkeit der Suchergebnisse deutlich verbessert. So müssen äquivalente Schreibweisen nicht mehr manuell berücksichtigt werden (z.B. 龟 OR 龜), sondern werden automatisch von der Suchmaschine einbezogen.

Ein Hinweis für Profis: Derzeit ist die Suche in CJK-Originalschriften noch nicht zuverlässig, weil die in Primo implementierte Indexierung bisher nur für lateinische Schriften optimiert ist. Wir arbeiten an einer Lösung und erwarten weitere Verbesserungen im Herbst 2016.

[1] https://primo.fu-berlin.de
[2] https://hkiug.ln.edu.hk/unicode/hkiug_tsvcc_table-UnicodeVersion-1.0.html

Der Text für dieses Postings wurde von Cosima Wagner, Amir Moghaddass aus der Campusbibliothek und Johannes Hercher aus der UB erarbeitet.

Autor: Petra Kende

Bibliothekarin an der Universitätsbibliothek, Team Digitale Dienste und Team des Informationszentrums

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Captcha
Refresh
Hilfe
Hinweis / Hint
Das Captcha kann Kleinbuchstaben, Ziffern und die Sonderzeichzeichen »?!#%&« enthalten.
The captcha could contain lower case, numeric characters and special characters as »!#%&«.