Datenmodellierung »Deutsch-Französische Kunstvermittlung« (2021-2022)

Die Überarbeitung des Datenmodells der Datenbank der »Deutsch-Französischen Kunstvermittlung« zielt auf eine Vereinfachung ihrer Nachnutzung durch eine verbesserte semantische und technische Interoperabilität ab. Die Maßnahme richtet sich auf digital Forschende, die die Datensätze zusammenstellen, exportieren und mit weiteren Tools untersuchen möchten. Wesentlich vereinfacht und unterstützt wird diese Form der Nutzung, wenn die Modellierung Paradigmen und Standards sowie Technologien verwendet, die in der eigenen wissenschaftlichen Domäne verbreitet sind. Von Relevanz für die Digitale Kunstgeschichte und die Digital Humanities insgesamt sind hier insbesondere CIDOC CRM sowie die Vokabulare der Getty Foundation. Sie werden dabei jeweils von Archiven, Bibliotheken, Sammlungen und Museen getragen, also Einrichtungen des kulturellen Erbes, die Daten anbieten, welche letztlich Werke und Objekte ihrer Bestände repräsentieren. Ihr Interesse ist, die Objekte zu erschließen und zugänglich zu machen. Entsprechend ermöglichen die Vokabulare und auf CIDOC CRM beruhende Schemata (z.B. LIDO XML und Linked.art) die Abbildung der verschiedenen komplexen Beziehungen zwischen Digitalisat und analogem Objekt oder etwa zwischen Reproduktion und Digitalisat, wie auch die verschiedenen Ereignisse und Akteure bedacht sind, die zur Geschichte des Objektes (analog wie digital) gehören. Letzteres schließt Angaben zur Lizenzierung ein.

Das macht sie interessant für die Aufbereitung der Daten des Forschungsprojekts Deutsch-Französische Kunstvermittlung, da die Genese der Daten transparent und die einzelnen Vorgänge von der Kreation des Datensatzes über die semantische Anreicherung hinweg auch auf Ebene der einzelnen Dateneinträge selbst unterscheidbar sein sollen. Die Anwendung auf die Daten der Deutsch-Französischen Kunstvermittlung ist jedoch nicht unmittelbar möglich bzw. nicht ohne Anpassungen vorzunehmen. Ursächlich ist die besondere und grundlegend andere Funktion dieser Daten gegenüber jenen, die wie beschrieben, zur Ordnung von Objektsammlungen dienen. Es handelt sich um eine strukturierte Dokumentation der Recherche in Quellen (Artikel in Kunstzeitschriften und Büchern), die fallweise mittlerweile digital von Bibliotheken vorgehalten werden. Jeder Datensatz entspricht damit einer kleinen wissenschaftlichen Publikation, die ein Werk (also zumeist ein Artikel oder Textabschnitt in einer Kunstzeitschrift) oder auch eine Gruppe von Werken (mehrere Artikel oder Textabschnitte) inhaltlich einordnet. Aus Sicht der Datenmodellierung rückt damit der einzelne Artikel oder Buchbeitrag mit den unmittelbar zugehörigen Attributen der Autorenschaft, des Erscheinungsdatums und -orts, Titel usf. aus dem Mittelpunkt des Modells und an seine Stelle tritt das Digitale Objekt – der Datensatz –, das als eines seiner Merkmale eine Referenz auf die Quelle(n) besitzt. Die Ereignis-bezogene und damit auf Graphen ausgerichtete Modellierung entlang von CIDOC CRM erlaubt es dabei die verschiedenen im Datensatz zusammenkommenden Ebenen Ereignissen bzw. Aktivitäten zuzuordnen (s. Abb. 1).

Events, die auf das Digitale Objekt ausgerichtet sind.

Auf diese Weise wird aber das Ereignis der Kreation an einen anderen Punkt angelegt, als es im Falle der Beschreibung eines konkreten Objekts etwa eines Gemäldes der Fall ist, das in einer Sammlungsdatenbank erfasst wird. Dort bezieht sich die Kreation auf die Schöpfung des Gemäldes, während das Anlegen des beschreibenden Datensatzes mit z.B. Angaben zum Motiv eine kuratorische Tätigkeit abbilden. Diese Tätigkeit richtet sich in der Datenbank Deutsch-Französische Kunstvermittlung aber auf die einzelnen Datensätze und nicht auf ein über den Datensatz erschlossenes Objekt, sondern auf das Digitale Objekt selbst oder auch nur auf einzelne seiner Teilbereiche. So betrifft die für 2021 angesetzte Datenmodellierung den gesamten Datensatz, die semantische Anreicherung jedoch nur Teile der bibliografischen Angaben und der Verschlagwortung von Personennamen (s. Abbildung 2).

Events (hier in Gelb) als Aktivitäten, die nur auf bestimmte Bereiche des Digitalen Objekts gerichtet sind.

Im Sommer 2021 wurde damit begonnen, versuchsweise das Datenmodell von Linked.art auf die Daten der Datenbank Deutsch-französische Kunstvermittlung anzuwenden. Linked.art wird von einer Gemeinschaft getragen, die sich nach dem Vorbild der IIIF-Initiative darum bemühen einen Standard zu etablieren, mit denen Museen und Sammlungen Daten zu ihren Kunstobjekten als einfach nutzbare Linked Open Data zur Verfügung stellen können. Das Datenmodell setzt dabei auf JSON und rückt den Fokus auf die digital Forschenden, während LIDO XML als Harvesting-Format von den veröffentlichten Institutionen und gemeinsamen Hubs her denkt.

In einem ersten Prototyp wurden zunächst die einzelnen Bereiche und Aktivitäten entsprechend den Abbildungen 1 und 2 modelliert und anschließend in einem Dokument zusammengeführt. Die Vorgehensweise ist auf Github dokumentiert (Repository).

Free