Informationsstruktur in altindogermanischen Sprachen

Projektbeschreibungen

Informationsstruktur in älteren indogermanischen Sprachen

Die Informationsstruktur (= IS) der indogermanischen Korpussprachen Hethitisch, Altindisch, Griechisch und Latein soll systematisch vergleichend auf zwei Fragen hin untersucht werden:

  1. Vollzieht sich ein Wandel von diskursorientierten zu syntaxorientierten Sprachen?
  2. Wie erfüllen diese Sprachen, die wohl keine dem deutschen Vorfeld, Mittelfeld und Nachfeld entsprechende Feldergliederung haben, die solchen Feldern zukommenden IS-Aufgaben?

Dazu werden zusammenhängende Texte einheitlich mit EXMARaLDA multimodal nach IS-relevanten Kriterien wie auch nach grammatischen Funktionen (z. B. Subjekt, Objekt) getaggt und die Daten in eine Datenbank (ANNIS) überführt. Die an Sprachen wie Deutsch, Englisch und Ungarisch gewonnenen IS-Kategorien müssen dabei modifiziert werden. Auch werden die Hypothesen zum IS-Status von Fokus-Hintergrund- oder Topik-Kommentar-Einheiten durch Tests, die auf der Textumgebung operieren, und durch semantische Analysen gestützt; denn es gibt keine eindeutigen morphologischen oder syntaktischen Markierungen der IS-Einheiten. Auch die Satzprosodie kann meist nur indirekt erschlossen werden. Da jedoch im Altindischen Kontrastakzente nachweisbar sind, wird von den unterschiedlichen Fokusdefinitionen diejenige angewendet, die in Neuinformations- und Kontrastfokus trennt. Die quantitativ-statistische Auswertung aller Daten erlaubt dann Schlüsse auf die IS des Indogermanischen. Das Material wird online öffentlich zugänglich gemacht.

Informationsstruktur in komplexen Sätzen – synchron und diachron

Ausgehend von Diskurskontexten wird der Beitrag, den die Informationsstruktur [= IS] zur Variabilität komplexer Sätze in den altindogermanischen Sprachen Altindisch, Avestisch, Hethitisch / Luwisch, Griechisch und Latein, also den ältesten Sprachen unseres Kulturkreises, leistet, synchron und diachron untersucht. Synchron geht es um:

  1. Ist neben einer primären Informationsstrukturierung zusätzlich eine sekundäre für den komplexen Satz vorhanden? Während die primäre Gliederung den gesamten Satz in Topik vs. Kommentar und Fokus vs. Hintergrund teilt, ruft die sekundäre eine zusätzliche Gliederung des Nebensatzes in Topik vs. Kommentar und Fokus vs. Hintergrund hervor. Welche der subordinierten finiten und infiniten Strukturen (z. B. Partizipial-, Infinitiv-, Supinkonstruktionen) haben eine solche sekundäre Informationsstrukturierung? Wie sind die Kodierungsstrategien hierfür im Satz?
  2. Die Information kann im komplexen Satz unterschiedlich gewichtet sein. Gewöhnlich befinden sich die Hauptinformation im Matrixsatz und die Nebeninformation im Nebensatz. Da hier der Kontext entscheidend ist, fragt sich, welche Kontextvariablen diese Art der Informationsgewichtung anzeigen. Diese können auch textsortenspezifisch sein. Dabei sind auch in geschriebenen Texten Hinweise auf prosodische Strukturen zu erwarten.

Diachron zeigt der Vergleich von Texten aus unterschiedlichen Zeitstufen, welche Kovarianz von IS- und anderen Merkmalen bei komplexen Sätzen zu historischen Veränderungen und u. U. sprachübergreifenden Entwicklungstendenzen führt. Die performanzorientierte Analyse erfolgt feinkörnig nach korpuslinguistischen Methoden. In der zweiten Projektphase werden spätere Vertreter der indogermanischen Sprachen betrachtet und die Ergebnisse dieser Phase mit denen aus der ersten Projektphase verglichen.

Korpus

Das aus den Projekten entstandene Korpus ISAIS ist zugänglich in der ANNIS-Datenbank.