11. Deutschsprachiger Japanologentag, 15.-18. September 1999, in Trier
Druckfassung des Beitrags zum
WORKSHOP Informationtechnik und Japanforschung
(Abbildungen nur für dieses Internet-Version)

Kôshiki im Internet

- Möglichkeiten und Grenzen des elektronischen Edierens vormoderner Texte für benutzerorientierte Datenverarbeitungssysteme -

Niels Gülberg

Ich möchte hier eine kurze Zusammenfassung meines Trierer Vortrags geben, die aus juristischen Gründen auf die Wiedergabe der in Trier gezeigten Bilder leider verzichten muss.

Das kôshiki-Datenbankprojekt

Seit drei Jahren arbeite ich mit finanzieller Unterstützung des japanischen Erziehungsministeriums an einem Datenbankprojekt, das im Wesentlichen auf der im Anhang meiner Habilitationsschrift gegebenen vorläufigen Übersicht der kôshiki-Überlieferung aufbaut. Eine deutschsprachige Beschreibung technischer Einzelheiten habe ich bereits im Internet (http://faculty.web.waseda.ac.jp/guelberg/koshiki/datenba.htm) vorgestellt, weshalb ich mich hier auf Prinzipielles beschränken möchte.

Die Datenbank zerlegt die im Printmedium als Liste gegebenen Informationen nach ihrem Gehalt in verschiedene Dateihierarchien, die untereinander vernetzt sind und sich jeweils auch einzeln indizieren lassen. Während das Printmedium vom Umfang her nur einen Index der Titel und Alternativtitel erlaubte, verfügt die Datenbank auch über Indices für Autoren und Preislieder. An der Spitze der Hierarchie stehen die Verzeichnisdateien, darunter die Dateien mit den bibliografischen Angaben zu einzelnen kôshiki-Werken, welche nach dem bereits in der Habilitationsschrift verwendeten Beschreibungsverfahren von Fukushima/Arai klassifiziert wurden. Unter diesen Bibliografie-Dateien stehen dann Volltextdateien, die idealiter für jedes der angeführten Werke ein repräsentatives Überlieferungszeugnis zugänglich machen sollten (zu den Problemen, die dabei auftreten, jedoch später).

Die Vorteile der elektronischen Aufarbeitung und Bereitstellung gegenüber den traditionellen Printmedien liegen auf der Hand: Für die Habilitationsschrift musste ich zu einem bestimmten Zeitpunkt auf eine weitere Aufnahme von neuen Werken verzichten, um nicht ständig die Referenznummern ändern zu müssen, weil eine zweidimensionale Liste eben nur aufsteigende Zahlen erlaubt. Daher zeigt die Zahl von 306 Werken den Stand von 1994. Seither wurden aber mehr als 20 weitere Werke identifiziert, und genauere Überprüfungen bereits identifizierter Werke brachten mit sich, dass bei den bisherigen Nummern zum Teil Zusammenlegungen möglich, zum Teil aber auch Aufteilungen nötig wurden, da auch noch das Fukushima/Arai-Verfahren Lücken lässt. In einem instabilen Medium wie dem auf Datenaustausch einzelner DV-Systeme beruhenden Internet lassen sich Aktualisierungen jederzeit durchführen; da die Einträge der Datenbank nicht an einer bestimmten Reihenfolge gebunden sind, können auch nachträgliche Umstellungen leicht bewerkstelligt werden.

Möglichkeiten und Grenzen des Internets als Medium

Das Internet hat sich in wenigen Jahren von einer relativ einfachen technischen Einrichtung zur benutzerneutralen Übertragung von Dokumenten zu einem anspruchsvollen Medium entwickelt, das nicht nur die Übertragung von Texten, sondern auch die von Bildern, Ton und Filmsequenzen ohne große Kosten ermöglicht. Durch die erweiterten technischen Möglichkeiten bieten sich auf dem ersten Blick zahlreiche neue Einsatzbereiche an, die auch für die Edition von Texten relevant werden könnten.

Bilder: Die Möglichkeit, bei vormodernen Texten für die Ausgabe nicht nur einen diplomatischen Abdruck einer Handschrift, sondern auch fotomechanische Ablichtungen des zugrunde liegenden Dokumentes vorzulegen, wurde durch das Billigerwerden der Reproduktionstechnik in letzter Zeit auch bei Editionen im Bereich der traditionellen Printmedien häufiger eingesetzt als früher. Für das Internet hat sich in dem Bereich der Bilddateien ein allgemeiner Standard durchgesetzt (Dateien im GIF- oder JPG-Format), der auch längerfristig erhalten bleibt.

Technisch gibt es also keine Schwierigkeiten. Zudem sind die Reproduktionskosten durch die neuen Digitalkameras, die ein direktes Digitalisieren von Handschriften bei größtmöglicher Schonung des Originals möglich machen, minimal, da die Datenträger wiederverwendet werden können. Für mein Datenbankprojekt wären solche digitalisierte Handschriften eine ideale Ergänzung, sieht man einmal von dem Problem ab, dass mein Universitäts-Server mir nur eine beschränkte Kapazität für die Datenmasse meiner Internet-Angebote zugesteht. Leider gibt es aber ein juristisches Problem: vormoderne Texte, die jenseits der Grenze des japanischen Urheberrechtes von 50 Jahren entstanden und daher urheberrechtlich nicht geschützt sind, dürfen ohne weiteres frei verarbeitet und angeboten werden, jedoch bestehen für einzelne Textdokumente Besitzerrechte, die auch die Bildverwertung umfassen. Solange also der derzeitige Besitzer nicht eigens eine Erlaubnis einräumt, was er in der Regel nicht tut, dürfen keine Abbildungen ins Netz gestellt werden. Es gibt natürlich einige juristische Hintertüren: man kauft, wie etwa Bill Gates, Verwertungsrechte von Bildarchiven auf, oder scannt eine Abbildung aus einem Buch ein, dessen Urheberrecht abgelaufen ist, etc. Leider fehlt es bei meinem Gegenstand, den kôshiki, an Derartigem.

Eleganter, aber nur für große Institutionen gangbar, ist der Weg, den das Historiografische Institut der Universität Tokyo eingeschlagen hat: Originaladäquate Kopien (eishabon, etc.) anzufertigen und diese zu digitalisieren, bzw. die Originaldokumente (z.B. die Iriki monjo) aufzukaufen und so in die Besitzrechte zu gelangen.

Ton: Tonkonserven zu digitalisieren, war schon seit geraumer Zeit möglich, doch die Umfänge der Dateien (5 MB pro Minute für WAV-Formate) so abschreckend und die Übertragungskapazitäten unzureichend, dass man lange darauf verzichtete. (Für kôshiki müssten zwischen 20 und 60 Minuten veranschlagt werden.) Seit rund zwei Jahren hat sich das vom Fraunhofer-Institut entwickelte MP3-Kompressionsverfahren langsam durchgesetzt, das nur noch einen Bruchteil der bisherigen Datenmenge beansprucht, ohne zu spürbaren Einbußen bei der Tonqualität zu führen.

Leider ist dieses Verfahren zu einer ernsthaften Bedrohung für die Unterhaltungsindustrie geworden, die recht scharf auf Verletzungen der Urheberrechts zu reagieren pflegt und daher auch alles daran setzen wird, einen MP3-Standard im Internet zu verhindern. Andere Ton- (bzw. meist Ton/Bild-)Verfahren setzen beim Benutzer, d.h. sowohl beim Anbieter wie auch beim Verbraucher, den Einsatz spezieller Software zur Ko- und Dekodierung voraus; diese Software (z.B. Real Audio) verfügt aber über derart extreme Halbwertszeiten, dass eine längerfristige Archivierung nicht sinnvoll erscheint. Kurz gesagt, allein schon von der technischen Seite ist das Internet als Medium zur Tonübertragung noch unausgereift; juristisch gibt es zudem noch mehr Probleme als bei den Bilddokumenten (vgl. dazu den folgenden Absatz).

Filmsequenzen: Ähnlich wie die Tonkonserven ist das Übertragen von Filmsequenzen zwar technisch möglich, die Probleme aber ebenso groß. Angefangen von den ruckelnden Bildern der frühen Quick Movies, bei denen man durch Verzicht auf Tonqualität und Bildschärfe die Dateiengröße auf -zig Megabytes zu drücken versuchte, bis hin zu den neuen MPEG-Formaten, die bei gleicher Dateiengröße annehmbare Bild- und Tonqualität bieten können, ist das Angebot nach wie vor bunt und unübersichtlich, d.h. wir sind noch lange von einem Standard entfernt. Bei Filmsequenzen stellen sich - ähnlich wie bei Tondokumenten - jedoch schon juristisch große Probleme in den Weg: Um einen Ritus wie z.B. die Durchführung eines kôshiki in einem Tempel filmerisch dokumentieren zu können, bedarf es der Genehmigung aller Teilnehmer der Zeremonie. Solche Genehmigungen werden manchmal ausnahmsweise vergeben, wenn z.B. sichergestellt ist, dass die Aufnahmen nur für bestimmte Zwecke und in einem kleinen Kreis zugänglich sind. Das Internet ist aber gerade ein Medium, das prinzipiell jedem offensteht; selbst Hürden wie Zugangsbeschränkungen bieten keine absolute Sicherheit. Um die Persönlichkeitsrechte der Teilnehmer zu schützen, müssten Gesichtszüge anonymisiert (unkenntlich gemacht) und Stimmen verzerrt werden, damit würde aber das Produkt seinen Wert als Dokument verlieren. Zusammengefasst: als Übertragungsmedium von Text- und Bilddateien ist das Internet ein durchaus leistungsstarkes Medium. Für den Einsatz sollte aber bedacht werden, (1.) dass alle Formate streng anwendersoftware-neutral gewählt werden, und (2.) dass juristische Probleme (Verwertungsrechte der Besitzer, etc.) vorab geklärt werden.

Sinn und Zweck des Datenbankprojektes als Editionsprojekt

Nun wurde viel zum Technischen gesagt, aber noch nichts zur Frage nach dem Sinn des Edierens vormoderner Texte im Internet.

Edieren ist ein relativ komplexer Vorgang, der traditionell in mehreren Stufen unterteilt wird.

1. Recensio:

Voraussetzung einer jeden Edition ist, dass die Überlieferungslage eines zu edierenden Textes festgestellt wird: Wieviele Zeugnisse gab bzw. gibt es? In welchem Zustand sind die einzelnen Zeugnisse? Liegen bereits Einzeleditionen eines Zeugnisses vor? (Diese Fragen habe ich in Ansätzen für jedes einzelne der über 300 Werke der Datenbank zu beantworten versucht.)

Wir Japanologen sind gewohnt, diese Fragen mit einem kurzen Blick in den Kokusho sômokuroku zu beantworten, dem "Generalkatalog nationalen Schrifttums". Leider ist dieser flink gemachte Katalog nur ein Verzeichnis der Verzeichnisse, das nur zum kleinsten Teil auf eigenständigem Bibliografieren beruht und in seinen ältesten Teilen mehr als 30 Jahre auf dem Buckel hat, d.h. neuere Entdeckungen nicht aufführt. Bei kôshiki-Handschriften und frühen Drucken führt das dazu, dass nur Sammlungen, für die es bereits in den 60er Jahren Verzeichnisse gab, also Universitäts-, öffentliche und große Privatbibliotheken, aufgeführt werden. Wir müssen aber davon ausgehen, dass jeder Tempel, der auf eine Geschichte zurückblicken kann, die länger als 100 Jahre zurückgeht, in seiner Schriftenkammer über einige Zeugnisse verfügt. Da es sich bei kôshiki um Gebrauchstexte handelt, ist der Verschleiß sehr hoch, weshalb oft nur noch Fragmente übrigbleiben, die dann zusammengeworfen werden.

Da unter diesen Umständen eine auch nur teilweise Erfassung des Überlieferungsbestandes von einem Einzelnen nicht geleistet werden kann, soll die Veröffentlichung des bisher Bekannten im Internet zwei Anliegen erfüllen: Erstens erhoffe ich mir von den Benutzern der Datenbank weitere Hinweise auf Überlieferungszeugnisse. Zweitens möchte ich durch die Veröffentlichung der Daten auch etwas Druck auf die Kollegen ausüben, ihre verdeckt gehaltenen Erkenntnisse an die Öffentlichkeit zu tragen. Das zweite Anliegen reagiert keineswegs auf eine Besonderheit der kôshiki-Forschung. Nahezu in allen Bereichen der Forschung zum vormodernen Japan werden die Zugänge zum Material restriktiv gehandhabt und Erkenntnisse so lange vorenthalten, bis sie von der eigenen Gruppe bzw. von einem genehmen Forscher publiziert werden. Das Internet bietet aber nun gerade Zugang für jedermann an, so dass sich die üblichen Kontrollmechanismen der japanischen Forschergemeinschaft außer Kraft setzen lassen. Ich erhoffe mir davon, dass neue Schichten von Forschern für den Gegenstand Interesse finden.

Die Datenbank wird auch die praktische Erfassungstätigkeit neuer Handschriftenbestände beschleunigen und gerade bei der Identifizierung der Fragmente hilfreich sein, sobald genügend Volltexte zugänglich sind.

2. Examinatio:

Sobald verschiedene Textzeugnisse eines Werkes identifiziert und erfasst sind, beginnt die vergleichende Analyse der einzelnen Überlieferungszeugnisse, um im Idealfall ein Stema (Deszendenzschema) der Überlieferung anfertigen zu können. Die umfassendste Untersuchung zur Überlieferung eines Werkes hatte 1964 Kindaichi Haruhiko in seinem Shiza kôshiki no kenkyû vorgelegt; als Sprachwissenschaftler interessierte sich Kindaichi jedoch nicht für der Frage der Rekonstruktion der ursprünglichen Form, sondern nur für den jeweiligen Ist-Zustand eines Zeugnisses. Ich selbst habe dieses Jahr eine größere Untersuchung zu den "Kômyô shingon kôshiki" vorgelegt und konnte aufgrund einer traditionell durchgeführten Examinatio beachtenswerte Ergebnisse erzielen.

3. Collatio bzw. Emendatio:

Diese Stufe umfasst die Auswahl eins Überlieferungszeugnisses, das der Edition zugrunde gelegt werden soll, sowie die Verbesserung des Editionstextes durch den Vergleich mit anderen Überlieferungen.

Diese Stufe setzt voraus, dass bereits genügend Zeugnisse bekannt und erfasst wurden, was bei den kôshiki noch nicht der Fall ist. Selbst das Überprüfen der Zeugnisse, die bereits im "Generalkatalog" verzeichnet sind, ist überaus aufwendig, da die Bibliotheken über ganz Japan verstreut sind. Arbeitsteilung ist da angesagt, die ich mit einigen Kollegen bereits anhand des "Kasuga gongen kôshiki" praktiziert habe.

Das Kollationieren ist ein relativ aufwendiges Verfahren, das ich bereits bei Editionen mit traditionellen Printmedien vor allem dann praktiziert habe, wenn sich der Besitzer einer Handschrift nicht zu einer Erlaubnis eines Textabdrucks bewegen ließ (obwohl sich - entgegen landläufiger Meinung - der Sammelwert eines Zeugnisses durchaus durch die Edition erhöhen kann). Das Verzeichnis der Varianten ist rechtlich gesehen nichts anderes als ein auszugsweises Zitieren, das keiner Erlaubnis bedarf.

4. Textgestaltung:

Die Textgestaltung zielt bei Editionen in traditionellen Printmedien gewöhnlich darauf, das zu edierende Original möglichst getreu abzubilden. Wie weit diese Originaltreue gehen soll, ist eine Streitfrage, die sich nicht einfach beantworten lässt. Der Herausgeber hat zwischen Originaltreue und Lesbarkeit abzuwägen, denn er muss den Text ja auch für den Leser erschließen. So trifft man in mittelalterlichen Handschriften häufig auf Schriftzeichen (itaiji), die sich in dieser Form kaum anderweitig belegen lassen. Selbst bei den katakana-Zeichen der Interlinearglossen gibt es ältere Formen, die in einem herkömmlichen Drucksatz nicht enthalten sind. Dazu kommen Ligaturen (z.B. tomo, shite, koto) und andere Kürzeln (z.B. das Schriftzeichen für 'Kugel' als Kürzel des Verbes tamaFu), die vom Herausgeber aufgelöst werden sollten. Für Printmedien wählen manche Herausgeber den teuren Weg, selbst diese Sonderzeichen als Spezialanfertigungen einzusetzen, um damit den Leser am Editionsprozess teilnehmen zu lassen. Die kôshiki bieten jedoch, besonders in den Drucken der Edo-Zeit, neben den bloßen Schriftzeichen linguistische Notationen der Akzente der chinesischen Lautung (shishoten) sowie musikalische Notationen, etwa die Tonlagen-Angabe oder die kôshiki-hakase für die Angabe der Intonationskurven der japanischen Silben, die für die korrekte Rezitation als nötig erachtet wurden. Diese im Druck wiederzugeben, wäre so umständlich, dass es nicht mehr sinnvoll ist (die Wiedergabe einer Ablichtung des Originals ist technisch einfacher und zudem fehlerfrei). Übrigens wirft die Originaltreue wieder ein juristisches Problem auf, denn der Besitzer des Originals kann auf Wertminderung klagen, um eine Edition gegen seinen Willen zu verhindern.

Das Internet ist als Medium in Hinblick auf die Originaltreue den traditionellen Printmedien unterlegen. Zum leichteren Datenaustausch zwischen verschiedenen DV-Systemen sollten Texte möglichst wenige Formatierungen enthalten, und ohne diese erreicht man nicht die nötige Ahnlichkeit zum Original. Das Internet war ursprünglich für den Austausch von englischsprachigen Textdokumenten geplant worden, weshalb vertikale sowie von rechts nach links laufende Schriften noch immer nicht ohne weiteres darstellbar sind. Zwar soll die erweiterte Markierungssprache XML in Zukunft derartige Probleme lösen können, noch ist es aber nicht soweit.

Man kann natürlich auch mit heutigen Mitteln schon "originalgetreue" Texte erzeugen: ich hatte für den Vortrag eine Seite versuchsweise erzeugt, die nicht nur Vertikalschrift mit kaeriten-Lesezeichen, sondern auch doppelte Interlinearglossen (rechts und links vom Schriftzeichen, wie z.B. "imada...nashi", "masa ni...beshi") darstellen kann. Problematisch ist dabei allerdings (1.), dass der Dateiumfang durch die zahlreichen Markierungen auf das Dreifache einer bloßen Textdatei ansteigt, und (2.) dass der markierte Text nicht weiterverarbeitbar ist bzw. indiziert werden kann, weil die Vertikal- und Rechts-nach-Links-Darstellung auf dem Trick beruht, die Seite von links oben aus als Tabelle in unzählige Spalten- und Reiheneinträgen zu zerlegen.

Für die Volltextdateien der kôshiki-Datenbank habe ich einen Weg gewählt, der den Möglichkeiten der Digitalisierung einen Vorrang gegenüber der Originaltreue einräumt. Kôshiki-Texte sind zunächst einmal kanbun-Texte, und als reine kanbun-Dateien ohne Lesungen einfacher indizierbar. Zudem sollten die Varianten des gleichen Schriftzeichens sowohl für einzelne Texte wie auch für die gesamte Datenbank beschränkt werden, um Belegstellen durch eine einfache Suche möglichst lückenlos auffinden zu können. Schon wegen der technischen Schwierigkeiten der Sonderzeichenbehandlung sollte nach Möglichkeit normalisiert werden, wobei ich das "Normalzeichen" (seiji) dann vorziehe, wenn es im Zeichensatz des Industriestandards (JIS) enthalten ist.

Die Informationen über die Lesungen, wie sie durch die Interlinearglossen gegeben und bei manch abenteuerlichen Satzkonstruktionen für das Verständnis auch unabdingbar sind, sollen in eigenen "kundoku"-Dateien zusammengefasst werden.

Da ich die Texte normalisiere und mich auch beim Zeilenbruch etc. nicht an die Vorgaben einer bestimmten Handschrift halte, lassen sich m.E. auch etwaige juristische Ansprüche der Besitzer abweisen, denn die Inhalte der Texte sind Allgemeingut, ihre Gestaltung schöpferische Eigenleistung des Herausgebers.

Ein Problem bleibt, wie Texte zu behandeln sind, deren Überlieferung eine große Variationsbreite zeigt. Bisher stellte sich das Problem noch nicht so dringend, da es an bekannten Überlieferungszeugnissen mangelte. Jedoch zeigte die oben erwähnte Untersuchung der "Kômyô shingon kôshiki"-Überlieferung einen so hohen Grad an Variation auf, dass sich keine zwei Textzeugnisse fanden, die einen weitgehend gemeinsamen Wortlaut hatten. Es ließ sich zwar ein bestimmtes Grundinventar an Textstücken identifizieren, das wohl die ursprünglichste Textfassung bildete, aber jedes Überlieferungszeugnis wählte aus diesem Inventar anders aus und ergänzte es durch eigene Zutaten.

Technisch (wohl aber nicht juristisch) möglich wäre es, sämtliche Versionen einzeln zu edieren, oder aber einen Zentraltext anzufertigen, der alle Varianten verzeichnet und die dazugehörigen Überlieferungzeugnisse auflistet, in denen der jeweilige Textabschnitt vorkommt.

Zusammenfassend lässt sich wohl sagen, dass das Edieren im Internet eine effektive Vorbereitungsstufe für Editionen in traditionellen Printmedien sein kann, jedoch letztere gegenwärtig noch nicht ersetzen kann. Stattdessen sollte es die eigenen Stärken gegenüber den Printmedien (Weiterverarbeitbarkeit, maschinelle Indizierung, etc.) nutzen und als sinnvolle Ergänzung neben den traditionellen Editionen treten.


Autor:

Gülberg, Niels; Dr.phil.habil; Jahrgang 1962; Studium der Japanologie, Deutschen Philologie und Philosophie in München und Tokyo (Tokyo daigaku daigakuin); Promotion 1991, Habilitation 1996 in München; 1992-1999 Research Fellow, The Institute for Comprehensive Studies of Buddhism, Taisho University; Tokyo, 1993/1994 Research Fellow, Tokyo daigaku daigakuin; 1996-1998 Universitätsdozent, seit 1998 Assistenzprofessor, School of Law, Waseda University, Tokyo; Forschungsschwerpunkte: Literatur der Heian- und Kamakurazeit, mittelalterlicher Buddhismus, Philosophie der Taisho- und frühen Showa-Periode, Umweltschutz.


Autor:Niels GÜLBERG
e-mail: [email protected]
Last updated: 03.1.16
<=Zurueck Zurück