Turmsegler bei DILIMAG

17. August 2009

DILIMAG Logo••• Das Innsbrucker Zeitungsarchiv (IZA) zur deutsch- und fremdsprachigen Literatur ist eine Einrichtung des Institut für Germanistik an der Universität Innsbruck. Ausgehend von einer Zeitungsausschnittsammlung, deren Anfänge bis in die frühen 1960er Jahre zurückreicht, hat es sich zu einem breit angelegten Medienarchiv entwickelt und gilt seit einigen Jahren als die größte universitäre Dokumentations- und Forschungsstelle für Literaturkritik, Literaturvermittlung und Massenmedien im gesamten deutschen Sprachraum. Auf der Basis ausgewählter deutschsprachiger Printmedien (derzeit 32 Tages- und Wochenzeitungen und mehr als 40 Literatur- und Kulturzeitschriften) sowie der Hörfunk- und Fernsehprogramme der öffentlich-rechtlichen Rundfunk- und Fernsehanstalten in Deutschland, Österreich und der Schweiz beobachtet und dokumentiert das IZA die nichtwissenschaftliche, journalistische Literaturkritik und Literaturvermittlung in diesen Ländern.

Das zum IZA gehörende Projekt DILIMAG beschäftigt sich seit März 2007 mit der Erfassung, Beschreibung und Archivierung von deutschsprachigen digitalen Literaturmagazinen. Das Projekt wird in Zusammenarbeit mit DEA (Abteilung für Digitalisierung und elektronische Archivierung der Universitätsbibliothek Innsbruck) ausgeführt. Die Finanzierung trägt der österreichische Forschungsfond FWF.

Unter die Literaturzeitschriften zählt DILIMAG auch deutschsprachige Weblogs, die sich mit Literatur auseinandersetzen. Auch diese Weblogs werden elektronisch archiviert, um sie dauerhaft für die Forschung zugänglich zu machen.

Der Turmsegler wird seit letztem Mai vom Deutschen Literaturarchiv Marbach für ähnliche Zwecke archiviert. Für das DLA steht hierbei der Charakter des Turmseglers als Autoren-Werkstattblog im Vordergrund. Künftig wird nun auch DILIMAG den Turmsegler archivieren. Der Grund für die doppelte Archivaufnahme liegt im – nennen wir es einmal »mehrschichtigen« – Charakter dieses Blogs. Antrieb der Gründung war ja zunächst das Lesen, die Beschäftigung mit Literatur und die Diskussion anderer Autoren. Es war auch von Anfang an angedacht, Gastautoren hier zu Worte kommen zu lassen – nicht mit eigenen literarischen Arbeiten, wie es nun mit Markus A. Hedigers Gastkolumne geschieht, sondern mit kurzen Beiträgen zu eigenen Entdeckungen in der Literatur, vor allem in der Dichtung, gleich welcher Sprache. Nur zögerlich habe ich überhaupt eigene Arbeiten hier veröffentlicht, und erst mit der Web-Veröffentlichung des »Anderen Blau« und endgültig mit der Aufnahme der Recherchen für »Die Leinwand« wurde der Turmsegler auch zu einem Werkstatt-Weblog.

Mitunter schaue ich mit ein wenig Wehmut auf die Anfangstage des Turmseglers, als ich noch fast täglich von Entdeckungen und besonderen Lektüreerlebnissen berichtete. Die eigene, wieder voll in Fahrt gebrachte literarische Arbeit hat diesen charmanten Part des Turmseglers in den letzten zwei Jahren womöglich zu kurz kommen lassen. Die weitaus meiste Lektürezeit stecke ich heute in Recherchen.

Es würde mich freuen, wenn der Turmsegler auch künftig für beide Archive und Forschungsvorhaben interessant bliebe – nicht allein Guckloch in die Autorenwerkstatt, sondern auch eine Form des digitalen Literaturmagazins, das künftig vielleicht nach dem Vorbild der jüngst gestarteten Hediger-Kolumne oder den literaturwissenschaftlichen Beiträgen von Claudia Öhlschläger auch regelmäßig literarische und poetologische Beiträge anderer Autoren bringt.

Spannend wäre das allemal, für mich in jedem Fall und hoffentlich auch für die treue Turmsegler-Leserschaft.

PS: Dies ist übrigens der 900. Artikel seit Bestehen dieses Blogs.

9 Reaktionen zu “Turmsegler bei DILIMAG”

  1. Benjamin Stein

    Aufgrund der Archivierung(en) arbeitet die Herzdame derzeit mit Herzblut daran, allen auf Fremdsystemen wie flickr.com, photobucket.com und podhost.de abgelegten Content auf den Turmsegler-Server umzuziehen. An die 300 Beiträge sind nachträglich zu editieren, um die Referenzen auf Bilder und MP3-Dateien des Podcasts zu aktualisieren.

    Abonnenten des Kommentar-Feeds des Turmsegler bekommen davon etwas mit, da viele Blog-interne Trackbacks als Kommentare in diesem Feed auftauchen.

    Das könnte übrigens eine dankbare Quelle fürs Stöbern sein und einige der aufregenderen älteren Beiträge dem unverdienten Vergessen entreißen – wenn auch nur für die wenigen Sekunden der vorüberhuschenden Web-Aufmerksamkeit.

  2. dirk

    Ein wenig wundert mich die Hoffnung, der Turmsegler möge für Archive und Forschungsvorhaben interessant bleiben – wo es doch so viele Literaturmagazine gibt, auf die Forscher und Archivare schauen, die dafür bezahlt werden, und so wenige, an denen ihre Leser Freude haben. Aber da dem Turmsegler die freiwilligen und erfreuten Leser nicht fehlen, sieht es ja gut aus, und ich füge den Wunsch bei, dass auch dies so bleiben möge. Ich jedenfalls lese gerne hier, obwohl ich gar kein treuer Leser bin, sondern ein neugieriger, und nutze die Gelegenheit mich zu bedanken, dass es ihn gibt, den Turmsegler. Merci!

    Was aber den Umzug ausgelagerter Daten, Flickr und so weiter betrifft, denke ich schon, dass es Aufgabe der Archive ist, dafür eine Lösung zu finden, und nicht Aufgabe der Literaturprojekte, sich archivkonform aufzustellen. Denn damit archiviert man nicht mehr, was ist, sondern was sein soll, die Tatsache der Archivierung beginnt, die archivierten Projekte zu beeinflussen, was der späteren Glaubwürdigkeit der Archive durchaus schaden kann. Wäre ich Archivar, ich empfände das als nette Geste – und hätte doch kein gutes Gefühl dabei. (So vernünftig und ohne Einfluss auf den Inhalt es in diesem Fall auch ist.)

  3. Benjamin Stein

    Was aber den Umzug ausgelagerter Daten, Flickr und so weiter betrifft, denke ich schon, dass es Aufgabe der Archive ist, dafür eine Lösung zu finden, und nicht Aufgabe der Literaturprojekte, sich archivkonform aufzustellen.

    Da ist sicher etwas dran. Allerdings bin ich um diese Reorganisation des Contents ja nicht gebeten worden, sondern habe das aus eigenem Antrieb in die Hand genommen. Für mein Gefühl sind diese Web-2.0-Dienste potentielle Datengräber. Und sie kosten zusätzlich Geld. So etwa podhost für die MP3s. Und auch bei flickr braucht es für ein Projekt wie dieses hier einen kostenpflichtigen Pro-Account. Im Februar habe ich bspw. übersehen, den zu verlängern. Prompt kam ich nur noch an die letzten 200 Bilder auf flickr heran. Gehen diese Inhalte verloren, ist das Blog nicht mehr, was es einmal war. So ziehe ich die Inhalte jetzt lieber zentral zusammen.

    Und danke natürlich für die ermunternden Worte.

  4. Jochen Walter

    Es kann nicht die Aufgabe der Produzenten sein, archivkonformen Inhalt zu liefern. Das seh ich allerdings auch so. Den Archiven und Bibliotheken sind mit den geltenden urherberrechtlichen Bestimmungen aber Rahmenbedingungen vorgegeben, die eine 1:1-Archivierung von Netz-Ressourcen quasi unmöglich machen. Das Ausklammern von externen Inhalten kann also aus rechtlichen Gründen notwendig sein und zu Besser-geht’s-zur-Zeit-nicht-Ergebnissen führen. Man kann auf bessere Zeiten (und Gesetze) hoffen. Man kann aber auch zusammenarbeiten. Die ganz neutrale Funktion ist davon ab ohnehin illusorisch. Längst wird in vielen Blogs die Archivierung selbst erwähnt, dokumentiert oder verhandelt. Was ich eigentlich sagen will: Die Situation der Archivierenden ist momentan schwierig. Herzliche Grüße,

    Jochen Walter

  5. Benjamin Stein

    Wie gesagt: Meine obige Aussage im ersten Kommentar war etwas irreführend. Die Archive haben nicht darum gebeten. In den Gesprächen fiel mir aber auf, wie wenig ausgereift die Archivierungsmethoden heute scheinbar noch sind.

    Sinnvoll zu archivieren sind ohnehin nur die Einzelbeiträge, da Features wie bspw. Tag-Seiten nur softwareseitig auf dem »lebenden« Blog realisierbar sind.

    Bleibt dann immer noch das Problem, dass die Archivierungsspider externe Inhalte scheinbar nur schwer beschaffen können. Hier habe ich mich bspw. gefragt, warum man nicht die Seite wie ein Browser-Client abfragt und in Gänze in ein PDF steckt. Dann freilich wären die Links ein Problem.

    Nun: Das alles zu hinterfragen und ggf. für die Zukunft gekonnter zu lösen, ist sicher Aufgabe der Archive selbst.

    Ich fühle mich unabhängig davon wohler, wenn die verwendeten Ressourcen zentral auf meinem Server auch künftig in meinem Zugriff bleiben. (Wenn das Backup funktioniert und sonst nicht Grobes geschieht, hüstel…)

  6. Renate Giacomuzzi

    Nun schließe ich mich auch noch (gerne) dieser für Archivprojekte sehr wichtigen Diskussion an. Auch ich stimme völlig mit der Meinung überein, dass es den Archiven und nicht den ‚Archivierten‘ obliegt, die geeigneten Maßnahmen zur dauerhaften Archivierung zu übernehmen. Oberstes Ziel muss sein, dass der Vorgang der Archivierung möglichst wenig Einfluss auf das archivierte Objekt ausübt.

    ‚Möglichst‘ heißt aber auch, dass der Einfluss bzw. die Veränderung des Objekts durch die Archivierung nicht völlig verhindert werden kann. Archive sind Rezipienten und literaturvermittelnde Instanz und nehmen damit Teil am Wechselverhältnis zwischen literarischer Produktion, Rezeption und Distribution. Das Wissen von AutorInnen/HerausgeberInnen um die Archivierung kann zu inhaltlichen, formalen und technischen Veränderungen führen. Die Spuren, die digitale Archive hinterlassen, gehen weit tiefer als jene der ‚Papier-Archive’ – die hier geführte Diskussion als direkte Folge der Archivierung ist ein Beispiel dafür.

    Doch nun konkret zu der von Benjamin Stein vorgeschlagenen Möglichkeit, extern gespeicherte Dokumente auf dem eigenen Server zu speichern und damit die Archivierung zu erleichtern: Aus unserer Erfahrung bei DILIMAG hilft diese Maßnahme nicht wirklich, denn unser Harvester (Heritrix/Webcurator) speichert (meist) problemlos auch auf YouTube gelagerte Videodateien und hält sogar den Link aktiv, der von der YouTube-Datei zur ‚lebenden’ Plattform, also zur Quelle und den dort zur Verfügung stehenden Angaben des Urhebers führen. Dies ist aus rechtlicher Sicht von grundlegender Bedeutung. Unter Umständen könnte das interne Speichern von externen Inhalten sogar zu einer Abtrennung von der Quelle führen und würde damit mehr schaden als nützen. Dieses Problem sollte daher noch genauer verfolgt werden.

    Grundsätzlich sehe ich die Einbettung oder Speicherung von extern gelagerten Dokumenten weniger als technisches und mehr als rechtliches Problem. Denn die Archive können nicht im Einzelfall überprüfen, ob urheberrechtlich korrekt vorgegangen wurde. Wenn wir das Einverständnis der Rechteinhaber einer Website zur Archivierung und öffentlichen Zurverfügungstellung erhalten, gehen wir davon aus, dass der/die Verantwortliche über die Rechte verfügt, diese Erlaubnis für sämtliche interne Inhalte zu erteilen (externe Links werden vom Harvestprogramm abgeschnitten). Sollte es aber zu urheberrechtlichen Übertretungen kommen, könnten vermutlich auch die Archive zur Verantwortung gezogen werden. Was deshalb aus archivarischer Sicht helfen würde, wäre ein möglichst verantwortungsbewusster Umgang mit der Einbettung von fremden Inhalten.

    Und noch eine Anmerkung zu der von Benjamin Stein angesprochenen Möglichkeit, das PDF-Format zum Archivieren von Websites zu nutzen. Aus archivarischer Sicht ist dies auszuschließen, da dieses Format dem Anspruch, eine möglichst originaltreue Version zu bewahren, nicht gerecht werden kann: PDF’s lösen die Hypertextstruktur auf und verändern damit die Rezeptionsbedingungen grundlegend. Außerdem kann das Format nicht die Inhalte einer ganzen Website sondern nur die Oberfläche (d.h. nicht den Quellcode) einzelner Dateistränge kopieren.

    Ich hoffe, nicht zu ausführlich auf das Thema eingegangen zu sein und grüße ebenfalls herzlich.

  7. Benjamin Stein

    Aus unserer Erfahrung bei DILIMAG hilft diese Maßnahme nicht wirklich, denn unser Harvester (Heritrix/Webcurator) speichert (meist) problemlos auch auf YouTube gelagerte Videodateien und hält sogar den Link aktiv, der von der YouTube-Datei zur ‚lebenden’ Plattform, also zur Quelle und den dort zur Verfügung stehenden Angaben des Urhebers führen.

    Da sind Sie, wenn ich die Marbacher recht verstanden habe, technisch besser aufgestellt als die Weblog-Archivare des DLA.

    Mich bekümmert bei diesen externen Quellen vor allem, dass sie gern mal verschwinden. Im Beitrag bleibt dann ein Loch.

    Drei Fragen liegen mir noch auf der Zunge, da sie – Frau Giacomuzzi – nun direkt hier vorbeischauen: Wie kann der »Harvester« das Blog in annäherend realitätsnahem Zustand abziehen? Wie steht es um dynamische Features wie Tags?

    Blogs werden ja fast ausschließlich auf CMS betrieben, von denen es überschaubar viele gibt. Wäre nicht die einzig lückenlose und gleichzeitig einfachste Variante, die allen diesen CMS zugrunde liegende Datenbank plus Layout zu archivieren? Gibt es Überlegungen/Versuche in diese Richtung?

    Und drittens noch: Wie geht der »Harvester« mit Seiten um, die nicht von den Hauptseiten aus verlinkt sind? Ich denke hier bspw. an die Baudelaire- und Rilke-Seiten, die nicht prominent verlinkt sind, den Suchmaschinen aber bspw. via Sitemap bekannt.

  8. Renate Giacomuzzi

    Lieber Herr Stein,

    ich hoffe annähernd Ihre Fragen beantworten zu können – ich bin Literaturwissenschaftlerin und kann den Harvester nur benutzen aber nicht verstehen.

    Also: dass externe Quellen bei Ihnen ein Loch hinterlassen, wenn Sie verschwinden ist klar. Dass der Harvester die eingebetteten Dateien mitnimmt, hat uns auch gewundert – nicht mal die Techniker hatten das erwartet. Aber der Webcurator ist das ausgefeilteste Tool, das es zum Harvesten gibt und beruht auf der ganzen langen Erfahrung des Internet Archive. Der Turmsegler wird übrigens nicht vom Internet Archive archiviert, weil Sie die Website mit robots.txt gesperrt haben. Das IA muss robots respektieren, weil sie automatisches Harvesting ohne Einverständnis der Urherber betreiben. Wir dürfen robots ignorieren, weil wir uns ja die Erlaubnis holen.

    Tags usw. sind kein Problem, weil alles, was vom Hauptlink abhängigen Dateien mitgeharvestet werden. Wir geben als „seed“ http://turmsegler.net ein und alles was dranhängt, kommt mit. Externe URL’s müssen wir wenn nötig händisch hinzufügen. Das machen wir aber nur, wenn wir das entsprechende Einverständnis der externen Quelle haben.

    Das CMS archivieren und das Layout dazu: Ich glaube schon gelesen zu haben, dass es Ideen in diese Richtung gab. Aber ich kenne niemanden, der das macht. Aber hierfür bin ich wie gesagt nicht kompetent.

    Es tut mir Leid, dass ich Ihnen noch kein Beispiel zeigen kann. Sobald wir technisch so weit sind (ich hoffe noch im September) melde ich mich bei Ihnen.

    Im Glücksfall sehen die geharvesteten Sites genauso aus wie die originalen, bloß mit einer veränderten URL, die einen PI (Persistent Identifier) enthält. Allerdings glücken nicht alle Harvests gleich gut und es ist sehr mühsam, jeweils herauszufinden, woran das liegt.

    Wir bemühen uns jedenfalls und lernen täglich hinzu und hoffen, dass in ferner Zukunft solche Archive eine Selbstverständlichkeit sind. Noch sind wir im Versuchsstadium… Wir sind aber im Austausch mit anderen Archivprojekten über eine Mailingliste, an der sich alle größeren Archivierungsprojekte beteiligen (British Library, National Library of Australia u.a.). Und ich muss sagen: das beruhigt, denn niemand behauptet derzeit, die ultimative Lösung gefunden zu haben, sondern versucht Schritt für Schritt Probleme zu lösen. Und vielleicht lachen oder weinen wir in zehn Jahren darüber, was wir jetzt gemacht haben, weil es dann dafür viel bessere Lösungen gibt

    Mit besten Grüßen, R.G.

  9. Renate Giacomuzzi

    Nur noch eine Anmerkung, weil Sie das DLA erwähnt haben: wir verwenden unterschiedliche Harvesttechniken, d.h. dass einige Dinge beim DLA besser funktionieren und andere bei uns. Z.B. ist es uns noch nicht gelungen (dem DLA schon), dass man bei externen Links vom archivierten Objekt direkt auf die lebende Seite geleitet wird. Bei DILIMAG endet dies vorerst noch in einer unschönen Sackgasse. Nochmals herzlich, Renate Giacomuzzi

Einen Kommentar schreiben

XHTML: Folgende Tags sind verwendbar: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>