Hinweise zur Digitalisierung
Die Digitalisierung des Materials wurde an der Österreichischen
Nationalbibliothek durchgeführt. Die Bilddateien sind im Format „JPEG2000“
mit einer Auflösung von 300 dpi gespeichert und
entsprechen damit den Digitalisierungsrichtlinien der
DFG.
Die Tagebuchkonvolute wurden exakt in der abgelegten Folge, ohne
Unterscheidung zwischen Beilage und Heftseite, vollständig – das heißt Seite
für Seite – digitalisiert. Heftdoppelseiten wurden als zwei Einzelseiten
gescannt. Eine Ausnahme stellten beiliegende Kinoprogramme dar, da bei
diesen der Text häufig quer über zwei Doppelseiten gedruckt ist und die
Lesbarkeit nur so erhalten bleibt.
Alle Seiten des Tagebuchs wurden gescannt, also auch alle leeren Rückseiten
von losen Blättern oder Rückseiten von Zeitungsausschnitten. Diese
Vorgangsweise führte zwar zu erhöhtem Scanaufwand, ließ aber alle Freiheiten
für die weitere Bearbeitung und die editorische Darstellung zu. Die
Digitalisate bilden eins zu eins die Konvolute ab. Einer Seite entspricht
stets eine Bilddatei.
Umgang mit Beilagen
Die Mischung aus Tagebuchheften und eingelegten losen Blättern führt dazu,
dass die materielle Textabfolge im Nachlass und die lineare Textabfolge der
Lektüre an manchen Punkten voneinander abweichen. Materiell zerrissene
Tagebucheinträge konnten über die Codierung als zusammengehörig markiert
werden.
Ob der Text der Beilagen dabei vor oder hinter dem im Heft stehenden
Tagebucheintrag positioniert wird, ist dabei eine interpretatorische
Entscheidung der EditorInnen. Das betrifft sowohl die Transkription der
Tagebucheinträge für die Druckausgabe als auch die digitale Edition der
Tagebücher.
Transkription und Edition
Die Transkription für die digitale Edition erfolgte diplomatisch.
Transkribiert und ediert wurden nicht nur klassische Tagebucheinträge,
sondern auch alle anderen in den Tagebuchkonvoluten enthaltenen Texte
Okopenkos (von ihm selbst verfasste Korrespondenzen, literarische
Textentwürfe) ebenso wie Texte fremder Hand, die Teil des Tagebuchs sind
(z.B. Briefe anderer KorrespondenzpartnerInnen).
Da ein Parallellesen von Faksimile und diplomatischer Abschrift in der
digitalen Edition jederzeit möglich ist, musste die Abschrift zwar den
vollständigen Tagebuchtext, auch annähernd in seiner äußeren Gestalt (etwa
Zeilenfall), wiedergeben und dabei zeichengenau verfahren. Sie konnte aber
die Dokumentation von Besonderheiten des Papiers oder der Schriftgestalt,
ebenso auch die Wiedergabe von enthaltenen Skizzen oder Piktogrammen, auf
das Faksimile auslagern. Diese Möglichkeit wurde in der vorliegenden
digitalen Edition an bestimmten Stellen genutzt, u.a. im Falle von
beiliegenden Zeitungsartikeln (siehe unten). Die diplomatische Abschrift
macht den Tagebuchtext vorderhand digital leicht zugänglich, durchsuchbar,
dynamisierbar und kommentierbar.
Festlegungen im Detail
- Eingeklebte oder eingelegte Zeitungsausschnitte wurden nicht
transkribiert, da die vollständigen Texte von den BenutzerInnen in
den digitalen Faksimiles gelesen werden können. Die Artikel wurden
daher in Form eines Incipits (Überschrift und Untertitel/Übertitel)
aufgenommen; in der Codierung wurde darüber hinaus vermerkt, dass
eine editorische Auslassung stattfindet. Eingeklebte Schlagzeilen
mit Titel und ggf. Untertitel wurden hingegen – angesichts der
geringen Textmenge – transkribiert. Handschriftliche Notizen
Okopenkos auf den Zeitungsartikeln wurden in der Codierung
festgehalten, auf die Erfassung von Unterstreichungen in den
Zeitungsartikeln wurde dagegen verzichtet.
- Aufdrucke auf Papier, das von Okopenko beschrieben wurde (etwa
Werbeaufdrucke auf der Blattrückseite) wurden in der Regel nicht
transkribiert. Hiervon gibt es nach Maßgabe der EditorInnen
Ausnahmen, etwa eingelegte Kalenderblätter, wo die aufgedruckten
Tagesdaten ja faktisch zum Text gehören oder vorgedruckte
Briefköpfe.
- Briefmarken und Poststempel auf enthaltenen Korrespondenzstücken
wurden vom Transkript nicht erfasst.
- Der transkribierte Text wurde in TEI (P5) codiert. Die Edition
folgt dem „text-focused approach“ von TEI.
Methodische Festlegungen für die Transkription
- Den Begriff der Zeichenadäquatheit hat der Editionsphilologe Klaus
Hurlebusch folgendermaßen beschrieben:
Die
Zeichenadäquatheit ist nicht als abbildliche, sondern als
funktionale und strukturelle Entsprechung gemeint. Denn sowohl
die Zeichen der Vorlage als auch die der Transkription sind, mit
Begriffen der Semiotik in heuristischer Absicht gesprochen,
jeweils Elemente eines besonderen Systems. Eine Mischung der
Zeichensysteme sollte vor allem aus historischen, aber auch aus
ästhetischen Gründen vermieden werden. So sollten z. B. Zeichen,
die innerhalb der deutschen Schreibweise ihren funktionalen oder
konnotativen Wert haben, wie etwa das Trema über dem -ÿ-, der
doppelte Bindestrich (=), die Unterstreichung der Endungen der
Ordinalzahlen in Datumsangaben (-ten), der Nasal- bzw.
Geminationsstrich über -m- und -n- in einer modernen
lateinischen Schrift nicht nachgebildet, sondern durch
äquivalente, systemeigene Zeichen (-y-, -, -ten, -mm-, -nn-)
wiedergegeben werden.
Die rezenten digitalen
Editionsprojekte zeigen häufig eine Tendenz, die Zeichenadäquatheit
eher abbildlich als funktional zu verstehen. Das vorliegende
Editionsprojekt strebte an, bewährte editorische Standards, die
weniger an der Zeichenoberfläche als an der Zeichenfunktion
ausgerichtet und in diesem Sinne tatsächlich exakter sind,
beizubehalten. Die TEI bietet dazu adäquate Codierungswerkzeuge an –
etwa was sie Auszeichnung von Verweiszeichen betrifft, die textuelle
Einfügungen oder Ergänzungen markieren. - Zu den von Hurlebusch angesprochenen „besonderen System[en]“
gehören letztlich auch technische Problemstellungen, die gerade für
das Hybrideditionsprojekt virulent werden. So mag beispielsweise ein
Spatium zwischen zwei Abkürzungsteilen („u. a.“) zwar nach
verschiedenen Konventionen geboten sein; es kann aber im System der
elektronischen Textverarbeitung eine textliche Störung provozieren,
etwa wenn in der digitalen Darstellung der erste Abkürzungsteil am
Ende einer Zeile und der zweite Abkürzungsteil am Beginn der
nächsten Zeile zu stehen kommt. Zudem ist in der Aufbereitung für
den Drucksatz der Lesefassung so oder so eine weitere Bearbeitung
von solchen und vergleichbaren Textelementen notwendig, etwa was den
Bindestrich bei Komposita am Ende einer Zeile betrifft. Diese
Bindestriche haben sowohl eine abteilende Funktion am Zeilenende als
auch eine Funktion bei der Wortbildung. Sie müssen daher in der
Lesefassung erhalten bleiben, auch wenn der Zeilenumbruch eliminiert
wird.
Festlegungen auf Zeichenebene
Leerzeichen
Leerzeichen wurden, unabhängig von der tatsächlichen Realisierung im
Manuskript oder Typoskript, standardisiert. Das bedeutet unabhängig
von allfälligen Unterschieden in der Vorlage:
- Numerische Datumsangaben („14.1.1939“) stehen ohne Leerzeichen
(dagegen: „14. Jänner 1939“).
- Die Setzung von Leerzeichen im Zusammenhang mit Satzzeichen
folgt den allgemeinen Konventionen, das heißt keine Leerzeichen
vor Fragezeichen und Ausrufezeichen, vor Satzpunkt, Komma,
Semikolon, vor schließender Klammer oder schließendem
Anführungszeichen oder nach öffnender Klammer oder öffnendem
Anführungszeichen. Leerzeichen werden hingegen nach
Fragezeichen, Ausrufezeichen, Satzpunkt, Komma, Semikolon,
schließender Klammer oderschließendem Anführungszeichen
gesetzt.
- Aus semantischen Gründen: Leerzeichen vor den
Auslassungspunkten (...), wenn sie auf einen fehlenden Satzteil
bezogen sind, aber kein Leerzeichen, wenn sie sich auf einen
fehlenden Wortteil beziehen.
- Schrägstrich im Regelfall mit beiderseitigen Leerzeichen
(„Montag / Dienstag“), außer wenn das Davor- und Danachstehende
eine Bedeutungseinheit bildet („1/4“, „km/h“,
„Krems/Donau“).
- Um Umbruchprobleme zu vermeiden: keine Leerzeichen zwischen
Abkürzungsteilen („u.a.“, „z.B.“ etc.).
- Bei nicht gängigen Abkürzungen wurden Leerzeichen zwischen
Abkürzungsteilen gesetzt („Nachtrag f. d. Zeitung“); auch: „St.
Pölten“).
- Keine Leerzeichen bei Paragraphen-, Prozent-, Gradzeichen
(„§1“, „2%“, „3°C“).
- Leerzeichen zwischen Ziffer und Maßeinheit („3 kg“, „4
km“).
Striche
Das Transkript macht keine Zeichenunterscheidung zwischen (1)
Silbentrennstrich, (2) Bindestrich, (3) Ergänzungsstrich, (4)
Bis-Strich, (5) Gedankenstrich, (6) Streckenstrich, (7) Minus und
(8) Gegenstrich. Die typographische Zeichenunterscheidung im
Buchdruck und der modernen digitalen Textverarbeitung
(Halbgeviertstrich für 4, 5, 6, 8, Viertelgeviertstrich für 1, 2, 3,
7) ist sowohl der Handschrift als auch der Schreibmaschine fremd.
Für die Lesbarkeit der digitalen Fassung konnte der
Zeichenunterschied außer Acht gelassen werden; die normmäßigen
Unterschiede in den Abständen sind hinreichend: Die Striche 1–4
werden im Transkript ohne Spatien, die Striche 5–8 mit Spatien
gesetzt; also:
- Silbentrennstrich: „Ge-dicht“ (Achtung, Silbentrennung am
Zeilenende erfolgt mittels TEI-Code!)
- Bindestrich: „Ex-Schulkollege“
- Ergänzungsstrich: „Aus- und Einfahrt“
- Bis-Strich: „3.-5. Mai“
- Gedankenstrich: „damals - aber auch heute“
- Streckenstrich: „Wien - Berlin“
- Minus: „7 - 4 = 3“, aber: „-3°C“
- Gegenstrich: „Austria - Rapid“.
Zeichenformatierung
An Zeichenformaten werden ausgewiesen:
- Unterstreichung (siehe unten)
- Sperrdruck
- Kursivsetzung
- Hochstellung (etwa bei Zeitangaben)
- Tiefstellung (etwa bei chemischen Formeln)
Unterstreichungen
- Festgehalten wurden Unterstreichungen nicht buchstabengenau,
sondern sinngemäß, also in der Regel jeweils für das
vollständige Wort. Eine Ausnahme bildeten jene Fälle, bei denen
eine Intention des Autors zu erkennen ist, z.B. bei sonst
abgekürzten Wörtern wie „Latein, Deutsch, Englisch“.
- Wo aufeinanderfolgende Wörter getrennt unterstrichen sind und
dafür Absicht unterstellbar ist, wurde die Unterstreichung
getrennt aufgenommen.
- Abkürzungspunkte und Doppelpunkte, die Unterstrichenem
nachfolgen, ebenso wie abschließende Satzzeichen von vollständig
unterstrichenen Sätzen oder Klammern oder Anführungszeichen rund
um Unterstrichenes wurden als unterstrichen markiert. Ein Komma
oder abschließendes Satzzeichen nach einem einzelnen
unterstrichenen Wort wurde dagegen nicht als unterstrichen
markiert.
- Es wurde zwischen einfacher und mehrfacher Unterstreichung
unterschieden.
- Es wurde nicht zwischen gleich- und andersfarbiger
Unterstreichung unterschieden.
- Unterstreichungen der hochgestellten Abkürzung „h“ (für
„Stunde“), z. B. „14h“, wurden als Schmuckelement betrachtet und
daher editorisch nicht erfasst.
- Ornamentale Hervorhebungen wurden nicht im Code erfasst, es
sei denn, der Charakter einer Unterstreichung ist klar
erkennbar.
- Vertikale Markierungen in den Marginalien wurden – in
funktionaler Hinsicht – als Unterstreichung der betreffenden
Zeile verstanden und dementsprechend codiert.
- Hervorhebungen durch Kästchen oder Ober- und Unterlinie wurden
so gehandhabt wie Unterstreichungen. Die EditorInnen hatten von
Fall zu Fall zu entscheiden, ob Kästchen einer Hervorhebung im
Sinne einer Unterstreichung oder einer Abgrenzung vom restlichen
Text dienen.
Weitere Festlegungen auf der Zeichenebene
- Der Oberstrich bei abgekürzten Jahreszahlen wurde nicht
transkribiert.
- Bruchzahlen wurden in die Einzelteile aufgelöst: „1/2“ für
„½“, „1 1/2“ für „1 ½“).
- Maschinschriftliche Schrägstriche, die als Klammern gemeint
sind, entsprechen den Regeln des Maschinenschreibens, wurden
aber nicht zu Klammern aufgelöst.
- Hochgestellte Punkte in der Bedeutung von „Grad“ wurden durch
das °-Zeichen ersetzt.
- Hochgestellte Punkte in der Funktion eines Kommas wurden durch
einen normalgestellten Punkt ersetzt.
- Hochgestellte Punkte bei Preisangaben wurden durch einen
normalgestellten Punkt ersetzt.
- Hochgestellte Punkte in der Bedeutung eines Kommas bei
Temperaturangaben wurden durch ein Komma ersetzt.
- Das „Umblätterzeichen“ wurde als „Kaufmännisches Minuszeichen“
(U+2052) transkribiert.
- Schriftgrößenwechsel wurde nur erfasst, wo er im
Textzusammenhang offensichtlich beabsichtigt ist und eine
Hervorhebung markieren soll.
- An Korrekturen durch Okopenko wurden Texttilgungen,
Texthinzufügungen, Textergänzungen und Textwiederherstellungen
editorisch erfasst.
- Verrutschte oder doppelt angeschlagene Buchstaben in
Typoskripten wurden regulär transkribiert und nicht speziell
codiert.
Festlegungen auf der Textebene
Von zufälligen Zeilenwechseln, die sich durch die Annäherung der Schrift
an die Papierkante oder Heftmitte ergeben, mussten intendierte
Absatzwechsel unterschieden werden. Da die einfachen Zeilenwechsel beim
Konvertieren der digitalen Edition in eine Druckfassung wieder
eliminiert werden müssen, würde dem zu druckenden Text jede äußere
Gliederung fehlen, wenn die intendierten Absatzwechsel nicht gesondert
ausgewiesen wären.
Die intendierten Absatzwechsel sind allerdings nicht immer zweifelsfrei
erkennbar: Für einen intendierten Absatzwechsel kann es sichere und
weniger sichere Symptome geben. Ein sicheres Symptom können
beispielsweise eine Einrückung der darauffolgenden Zeile, eine
Leerzeile, ein markant erhöhter Zeilenabstand, eine nachfolgende
Überschrift oder ein nachfolgender neuer Tagebucheintrag sein. Auch ein
deutlich nicht ausgeschöpfter Zeilenraum kann ein sicheres Symptom
bedeuten, wobei dieses desto sicherer ist, je mehr Zeilenraum beim
Schreiben freigelassen wurde. In vielen Fällen liegt somit ein gewisser
Interpretationsspielraum vor, sodass beim Transkribieren von Einzelfall
zu Einzelfall – auch anhand von textlichen Regelmäßigkeiten –
entschieden werden musste. Mit Blick auf die Druckedition war es im
Zweifel vorzuziehen, eine Überstrukturierung des Textes, wo sie
empirisch mangelhaft abgesichert war, eher zu vermeiden.
Typographisch abgesetzte Textteile, etwa herausgerückte
Datumseintragungen in Form von hängenden Einzügen, wurden editorisch als
eigene Absätze gehandhabt.
In Spalten geschriebener Text, bei dem Zeilen einander zuordenbar sein
müssen, wurde als Tabelle codiert.
Korrekturen durch die HerausgeberInnen
Nicht korrigiert wurden folgende Verstöße im Bereich der
Sprachnormen:
- Verwendung alter, damals gültiger Rechtschreibung
- Eigenwillige Interpunktion (Ausnahme: geht der Sinnzusammenhang
durch fehlerhafte Interpunktion verloren, wurde eine Korrektur
vorgenommen und als solche ausgewiesen.)
- Fehlendes Fugen-s
- Inkohärenzen bzw. “freie” Handhabung der Satzgrammatik
- Groß- und Kleinschreibung (Ausnahme: Dies betrifft nicht die
Anredepronomina, die fälschlicherweise kleingeschrieben wurden.
Diese wurden korrigiert und als Korrekturen ausgewiesen.)
- Bei standardsprachlichen Verstößen auf Basis eines Transfers aus
der Umgangssprache oder dem Dialekt (z.B. „anfangs Juli“, „scheinte“
statt schien)
- Bei deutlichem Erkennen einer Intention wurde Okopenkos Schreibung
beibehalten und entsprechend ausgewiesen.
- ss/ß-Schreibung, Schreibungen von “Oe” für “Ö” etc.
Ausgewiesene Korrekturen
- Offensichtliche Verstöße im Bereich der
Getrennt-/Zusammenschreibung wurden nach den Regeln der
Rechtschreibung von 1947 korrigiert.
- Eigennamen wurden nach der damaligen Schreibweise korrigiert.
(Ausnahme: ss/ß: z.B beim Vorkommen des Namens „Franz Häußler“:
Es wurde sowohl die Schreibweise „Häußler“ als auch „Häussler“
verwendet; wurde “Häusler” mit einfachem “s” geschrieben, wurden
Typoskripte auf “ss” korrigiert und Manuskripte auf “ß”. In
Typoskripten, in denen „Häußler“ mit „ß“ geschrieben wird, wurde
nicht korrigiert.)
- Offensichtliche
Tippfehler/Flüchtigkeitsfehler/Rechtschreibfehler
(“Athmosphäre”) wurden nach der damals gültigen Rechtschreibung
von 1947 transkribiert. Grundlage für Korrekturen ist der Duden
von 1947.
Stillschweigende Korrekturen
- Bei Fällen, in welchen unklar ist, ob ein Wort getrennt oder
zusammengeschrieben ist, wurde im Zweifelsfall
rechtschreibkonform nach den Rechtschreibregeln von 1947
transkribiert.
- Bei Fällen, in welchen unklar ist, ob ein Wort groß- oder
kleingeschrieben ist, wurde im Zweifelsfall ebenfalls
rechtschreibkonform transkribiert.
- Bei unerklärlichen Punkten mitten im Satz wurde der Punkt
getilgt.
- Zwischen Abkürzung und Zahl wurde ein Abstand eingefügt (z.B.:
„Nr. 2“).
- Zwischen abgekürzten Maß- und Mengenangaben (m, g) wurde ein
Abstand eingefügt (z.B. „15 g oder 10 m“).
- Bei Abständen innerhalb eines Wortes, bei denen keine
Intention erkennbar ist bzw. die womöglich dem Schreibgerät
Schreibmaschine zugerechnet werden können.
Ausgewiesene Vereinheitlichungen
- Uneinheitlichkeit bei Abkürzungen: Abkürzungen wurden nach den
aktuell gültigen Rechtschreibregeln vereinheitlicht, z.B.
“usw.”, “bzw.”