Die Daten aus den Katalogen befreien – Bibliotheken zu Knotenpunkten im neuen Daten-Web machen

Ich bin Lambert Heller, und ich arbeite seit 2008 an der TIB/UB Hannover. Mich beschäftigt, wie wir die Daten aus unseren Katalogen befreien. Das alte Modell ist: Wer an diese Daten ran will, kann das nur mittels unserer Katalokanwendungen, Daten und Suchanwendung  sind sozusagen miteinander verschweißt. Oder er benutzt zwei oder drei von den Bibliotheken lizensiert Daten-Oligopolisten wie OCLC oder Google.

Dabei haben Bibliotheken in der neuen Informationsökonomie, in der mit öffentlichen Mitteln erstellte Daten frei zugänglich und untereinander vernetzt sind, nichts zu verlieren: Ihre Lizenzen und physischen Bestände können besser gefunden und genutzt werden, wenn frei um nützliche Anwendungen und Verknüpfungen der Titel- und Bestandsdaten konkurriert wird. Die neuen Geschäftsmodelle von STW und SWD (PPT von sind Lars G. Svensson, DNB) sind hier wegweisend.

Aber solche Ziele werfen Fragen auf: Wie können wir webgerechte Links zwischen „unseren“ Katalogdaten und überinstitutionell verwendeten Normdaten exponieren? Welche Lizenzen sind für Open Data geeignet? (In Neuseeland hat man sich z.B. für eine Creative Commons-Lizenz entschieden.) Kann und sollte man große Gesamt-Datenpakete per Bittorrent o.ä. zur Verfügung stellen? Was sind potentielle „Killer-Anwendungen“ für freie Daten aus dem Bibliothekskatalog, mit denen wir das Konzept unseren Bibliotheksleitungen anschaulich und schmackhaft machen können?

4 Gedanken zu “Die Daten aus den Katalogen befreien – Bibliotheken zu Knotenpunkten im neuen Daten-Web machen

  1. Hallo Lambert,

    einige Korrekturen:
    1. In New Zealand hat man sich noch nicht entschieden derzeit wurde der Entwurf öffentlich disktuiert, in dem Entwurf für das Legal Framework spiel Creative Commons eine tragende Rolle. Für Copyright freie Daten im allgemeinen wird keine Lizenz sondern der CC0 (=Public Domain) empfohlen.

    2. Auch wenn der Schritt der STW zu begrüssen ist, so ist das bereitstellen von Daten unter einer CC-ND Lizenz alles andere als perfekt, gerade im Linked Data Kontext. Darf eine Suchmaschine wie Google (bei der niemand sagen würde das diese nicht kommerziell ist) diese Daten dann für eine semantische Suche nicht einsetzen? Damit Daten als Teil von Linked Data gelten können muss ihre Verwendung ohne jedes Hindernis möglich sein. Hier sehe ich auch die Probleme beim DNB Projekt, da dies sich nur auf Bibliotheksdienste selbst bezieht und aufgrund der Lizenzproblematik z.B. der DDC kein Verlinken aus anderen Projekt möglich macht. Auch das Aufrufen der hinter der URL bereitgestellten Informationen in Melvil Class is nur möglich wenn man angemeldet ist. Daher halte ich beide Geschäftsmodelle nicht für wegweisend eher für Irrwege (und hier beziehe ich ausdrücklich NUR auf die Geschäftsmodelle), aber manchmal muss man vielleicht Umwege gehen.

  2. Danke für die korrekten Einwände, Patrick. Ich habe den Eindruck, du bist quasi schon beim übernächsten Schritt. Bevor wir die passende Lizenz für Bibliotheksdaten als Linked Data finden (z.B. auf dem BibCamp!), müssen wir dem „Rest der Welt“ erst einmal zeigen, warum das überhaupt so wichtig ist. Und dafür sind erste Umsetzungen in der realen Welt, so defizitär sie auch immer sein mögen, ganz entscheidend. Auch die Wikipedia begann und popularisierte sich trotz einer Lizenz, die sich später als ungeeignet herausgestellt hat.

  3. Natürlich müssen wir zum einen Überzeugungsarbeit leisten warum wir Linked Data brauchen zum anderen sollten wir nicht Geschäftsmodelle (bzw. Lizenzen) als Vorbild darstellen wenn diese das Gegenteil sind.

    Der Lizenzwechsel in der Wikipedia ist unter anderen Vorrausetzungen zu betrachten. Erstens war bei der Wahl der Lizenz keine Alternative verfügbar. Zweitens ist die neue Lizenz in der grundsätzlichen Idee identisch. Drittens hat der Wechsel der Lizenz mindestens vier Jahre gedauert. Daraus sollte man lernen das wenn dies möglich ist man lieber gleich die richtige Lizenz wählt. Bei Linked Data ist eindeutig eine PD Lizenz das Optimum, alles andere führt zu einer Ringeschrenkzen nutzbarbeit und einer Abkoppelung von der restlichen Linked Data Bewegung wie dies ja auch in den DNB Folien, die du verlinkt hast zu sehen ist.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s