S P P   S P R A C H P R O D U K T I O N  
  Organisation

Suchen | Organisation | Projekte | Publikationen | Veranstaltungen | Weitere Informationen


Vorschlag zur Einrichtung eines DFG-Schwerpunktprogrammes

 

Sprachproduktion:

Informationsvermittlung durch natürliche Sprache

 

0. Zusammenfassung

Die Verwendung von Sprache ist sicherlich eine der herausragenden kognitiven und kommunikativen Leistungen des Menschen. Die hohe Bedeutung der Sprachfähigkeit liegt insbesondere darin, daß wir vermittels Sprache in der Lage sind, in effizienter Weise komplexe Erfahrungen anderen weiterzugeben und auf den Erfahrungen anderer aufzubauen.

Untersuchungen zum Phänomenbereich ‘Sprache’ umfassen die Struktur der Sprache einerseits und die - insbesondere kognitiven - Prozesse des Sprachgebrauchs andererseits. Bei der Klassifikation von Prozessen der Sprachverarbeitung stellt die ‘Richtung’ der Verarbeitung eine wichtige Einteilungsmöglichkeit dar: die Sprachproduktion kann als die Bildung von sprachlichen Äußerungen aus Bedeutungen, das Sprachverstehen als die Zuweisung von Bedeutungen zu sprachlichen Äußerungen aufgefaßt werden.

Eine auffällige Eigenschaft von Sprachproduktionsprozessen ist die Geschwindigkeit, mit der sie verlaufen. Bei normaler Sprechgeschwindigkeit werden etwa 2-3 Wörter oder 15 Phoneme pro Sekunde produziert. Während die Prozesse der Konzeptualisierung in der Regel unter der Kontrolle des Bewußtseins stehen, verlaufen die weiteren Prozesse vom syntaktischen Aufbau bis zur Artikulation viel zu schnell, um bewußt kontrollierbar zu sein. Bemerkenswert ist darüber hinaus, daß wir in der Lage sind, gleichzeitig zur Sprachproduktion weitere, zum Teil äußerst komplexe kognitive Leistungen zu erbringen.

Der Forschungsgegenstand ‘Sprachproduktion’ verbindet Untersuchungen zur nicht-sprachlichen und sprachlichen Kognition: insbesondere Fragen nach dem Zusammenhang zwischen den konzeptuellen Strukturen unseres Denkens einerseits und der Formulierung von ‘Inhalten des Denkens’ in sprachlichen Äußerungen andererseits. Während traditionelle Untersuchungen der theoretischen Linguistik - aber durchaus auch der Psycho- und Computerlinguistik - häufig durch die fachinternen, struktur-orientierten Einteilungen wie Semantik, Syntax, Phonologie etc. geleitet sind, hat - ausgehend von der Psychologie, der Informatik und den Neurowissenschaften - insbesondere in der Psycho- und Computerlinguistik zunehmend eine Erweiterung der strukturorientierten Sichtweise durch Einnahme einer Prozeßperspektive stattgefunden. Hierdurch kann u.a. auch das Zusammenspiel etwa phonologischer, syntaktischer, semantischer und pragmatischer - aber auch anderer kognitiver - Fähigkeiten geklärt werden.

Ein interdisziplinärer Forschungsschwerpunkt ‘Sprachproduktion’, der die struktur- und die prozeßorientierten Perspektiven im Phänomenbereich Sprache integriert, kann wesentliche Erkenntnisse für die gesamte ‘Sprachforschung’, sei sie linguistischer, psychologischer oder informatischer Ausprägung, erzielen und dies über das Thema Produktion hinaus auch für die Bereiche Sprachverstehen, Spracherwerb sowie Sprach- und Sprechstörungen. Die zu erwartenden Resultate werden nicht nur die menschliche Fähigkeit des Sprachgebrauchs betreffen, sondern darüber hinaus die Voraussetzungen für die Realisierung automatischer Verfahren zur Verarbeitung natürlicher Sprache verbessern.

1. Wissenschaftliches Programm

Das Schwerpunktprogramm konzentriert sich - im Gesamtfeld der Untersuchungen sprachlicher Strukturen und Prozesse - auf den Phänomen- und Problembereich der Sprachproduktion, d.h. auf die Frage, wie Gedanken in sprachlicher Gestalt - gesprochen oder geschrieben - ausgedrückt werden. Zu untersuchen sind somit die internen konzeptuellen Strukturen, deren Versprachlichung ansteht, Wissenstrukturen, die die Sprachkenntnisse (z.B. im lexikalischen und grammatikalischen Bereich) repräsentieren, sowie die verschiedenen Prozesse und Subprozesse, die den Übergang von internen Repräsentationen zu sprachlichen Äußerungen leisten.

Primärer Forschungsgegenstand ist das System kognitiver Fähigkeiten und Prozesse, welches den menschlichen Sprachgebrauch ermöglicht, und somit überhaupt Sprache erst konstituiert. Daher sind einerseits empirische Untersuchungen zu Prozessen der Sprachproduktion und zu den strukturellen Eigenschaften des Sprachsystems durchzuführen, andererseits sind auf dieser Basis Modelle für Repräsentationen und Prozesse zu entwickeln, aus denen sich die prinzipiellen Möglichkeiten und Grenzen bestimmter Sprachproduktionssysteme ableiten lassen. Darüber hinaus sind diese Modelle zu implementieren und hinsichtlich theoretischer Fragestellungen und kognitiver Plausibilität zu überprüfen, sowie im Hinblick auf potentielle Anwendungen weiterzuentwickeln.

1.1 Motivation und Ziele

Das Verständnis von Sprachproduktionsprozessen ist gegenwärtig von einer großen Anzahl von Erkenntnissen zu Einzelphänomenen geprägt, der Zusammenhang zwischen diesen ist jedoch vielfach nicht geklärt. Gerade im Hinblick auf die Beziehung zwischen verschiedenen Aspekten der Konzeptualisierung, Formulierung und schließlich Artikulation stellt sich eine Reihe zentraler Fragen, die nur in interdisziplinärer Zusammenarbeit beantwortet werden können. Bevor einige dieser Fragen erläutert werden - eine detaillierte Darstellung findet sich im Arbeitsprogramm (Abschnitt 1.3) - soll die Problemlage an drei Leitbeispielen illustriert werden.

1.1.1 Beispiel I: Normale, ungestörte Sprachproduktion

Der Vorgang der Sprachproduktion soll in einem ersten Schritt am Beispiel einer Spielerklärung verdeutlicht werden. Voraussetzung für das Gelingen einer solchen Aufgabe ist, daß der Sprecher/die Sprecherin eine korrekte konzeptuelle Vorstellung von dem zu erklärenden Spiel vermittelt. Dazu gehört, daß das Spielmaterial (Würfel, Figuren etc.) vollständig bekannt gemacht wird. Den Mitspielern muß das Ziel des Spieles deutlich werden, und sie müssen darüber informiert werden, auf welchem Weg sie es erreichen können, d.h., nach welchen Regeln mit dem Spielmaterial umzugehen ist.

Voraussetzung für eine erfolgreiche Spielerklärung ist nicht nur, daß der Sprecher über dieses konzeptuelle Wissen, das als außersprachlich charakterisiert werden kann, verfügt, er muß es auch in geeigneter Weise in einer sprachlichen Form ausdrücken können, und dies bedeutet insbesondere, daß er eine Linearisierung vorzunehmen hat. Er muß entscheiden, in welcher Reihenfolge er die Informationen vermittelt, die konzeptuell im Prinzip gleichzeitig zur Verfügung stehen. Eine adäquate Linearisierung des konzeptuellen Wissens ist von ausschlaggebender Bedeutung für das Gelingen der Erklärung. Wichtig ist darüber hinaus jedoch auch, daß der Sprecher sich auf die Hörer (Mitspieler) einstellen kann. Er muß berücksichtigen, was sie bereits wissen und welcher sprachliche Stil verlangt wird. Kindern wird man ein Spiel u.U. anders erklären als Erwachsenen.

Schließlich muß die linearisierte konzeptuelle Struktur in eine sprachliche transformiert werden. Dazu müssen aus dem mentalen Lexikon, das mehrere zehntausend Einträge umfaßt, die passenden Begriffe aktiviert und selegiert werden. Sie werden nach ihren semantischen und syntaktischen Eigenschaften ausgewählt. Ihre konkrete morphologische Gestalt erhalten sie mit der syntaktische Struktur, die parallel aufgebaut wird. Diese Struktur wird inkrementell aufgebaut, d.h. der konzeptuelle Input wird in kleinere Fragmente aufgeteilt, die dann für sich syntaktisch aufbereitet und zur Gesamtstruktur eines längeren Satzes integriert werden.

Die semantisch, syntaktisch und morphologisch spezifizierte Struktur muß im nächsten Schritt phonologisch kodiert werden. Dabei müssen die einzelnen lexikalen Einheiten Silbe für Silbe und Phonem für Phonem in ihre Lautform überführt werden. Darüber hinaus muß die übergeordnete metrische Struktur festgelegt werden. Die Verteilung verschieden starker Betonungsakzente signalisiert den Hörern, welche Information neu oder wichtig und welche alt und von geringerer Bedeutung ist. Diese Information ist konzeptuell gesteuert und muß daher früh zur Verfügung stehen.

Im letzten Schritt muß die nun auch phonologisch spezifizierte Repräsentation in die Muskelbewegungen der vielen beteiligten Artikulatoren umgesetzt werden. Auch dies geschieht schrittweise, d.h. die phonologische Komponente liefert kleinere Fragmente der Satzstruktur ab, die dann artikulatorisch umgesetzt werden. Da die motorischen Ausgangsbedingungen für die Artikulation sehr unterschiedlich sein können (man kann z.B. gleichzeitig essen und verständlich reden), spricht vieles dafür, daß die Zielrepräsentationen für die Artikulation nicht motorische Bewegungen, sondern auditive Muster sind. Dieser gesamte Prozeß muß bei der Erklärung eines Spiels wie bei jeder Sprachproduktion fortwährend, Satz für Satz, durchlaufen werden. Dies geschieht mit außerordentlicher Geschwindigkeit, was voraussetzt, daß die beteiligten Prozesse hochgradig automatisiert verlaufen.

1.1.2 Beispiel II: Gestörte Sprachproduktion

Bei sehr vielen Patienten mit Sprachstörungen, die hirnorganisch bedingt sind (z.B. durch Unfälle, Tumore oder Schlaganfälle), sind die produktiven Fähigkeiten beeinträchtigt. Dies kann sich auf verschiedenen Ebenen zeigen: auf der Ebene von massiven Wort- findungsstörungen, von Defiziten beim Aufbau syntaktischer Strukturen oder der Zuweisung der korrekten phonologischen Struktur zu einzelnen Wörtern.

Es gibt Patienten, denen es nicht gelingt, bestimmte Objekte zu benennen, obwohl sie deren Bedeutung genau kennen. Dies kann man dadurch feststellen, daß man die Patienten beispielsweise diese Objekte in semantische Kategorien einteilen läßt etc. Sie haben häufig auch keine Probleme beim Verstehen der Wörter, die sie nicht produzieren können. Das spricht dafür, daß sie keine allgemeine Störung des semantischen Systems haben, und es spricht dafür, daß es zwei getrennte Systeme gibt, die einerseits die Bedeutungsrepräsentationen speichern, andererseits die Wortformen. Für ein eigenes System, das darauf spezialisiert ist, die phonologischen Formen der Wörter zur Verfügung zu stellen (speech output lexicon), spricht darüber hinaus, daß es Patienten gibt, die in der Lage sind, die Wörter, die sie nicht lautsprachlich produzieren können, schriftlich zu produzieren. Die sorgfältige Analyse von Patienten kann damit Aufschluß geben über die Architektur des Sprachproduktionsprozesses, d.h. über die beteiligten strukturellen Komponenten und die Prozesse, die zwischen ihnen verlaufen.

Der Zugriff auf das 'speech output lexicon’ scheint keine Frage von Alles-oder-nichts zu sein. Es wurden Patienten beschrieben, deren Wortfindungsstörungen von der Frequenz der Wörter in der Sprache abhängig waren. Ihre Unfähigkeit, bestimmte Wörter zu produzieren, konnte teilweise dadurch behoben werden, daß man ihnen die Anfangsphoneme der entsprechenden Wörter nannte. Das spricht dafür, daß sie einen partiellen Zugriff auf die Wortformen hatten, daß jedoch der semantische Input allein nicht ausreichend war, um den richtigen Eintrag zu selegieren.

Die detaillierte Analyse selektiver Ausfälle der Sprachproduktion bei hirnorganischen Patienten bietet damit eine wichtige Möglichkeit, genaueres Wissen über die beteiligten Subsysteme und ihre Interdependenzen zu erhalten. Die dabei gewonnenen Erkenntnisse können mit experimentellen und empirischen Ergebnissen verglichen werden, die zu nicht-gestörter Sprache erhoben wurden und tragen damit zu einer signifikanten Verbreiterung der empirischen Basis theoretischer Modelle bei. Darüber hinaus ist zu erwarten, daß die theoretischen Modelle Anstoß für neue Entwicklungen für die Therapie von Sprach- und Sprechstörungen geben werden.

1.1.3 Beispiel III: Maschinelle Sprachproduktion

Für die maschinelle Produktion von sprachlichen Äußerungen sind insbesondere zwei wichtige Anwendungsbereiche zu nennen: einerseits die maschinelle Übersetzung und andererseits die natürlich-sprachliche Interaktion mit Computersystemen. Insbesondere für komplexe Anwendungsbereiche kann davon ausgegangen werden, daß tabellarische Ausgaben oder die Verwendung von vorgespeichertem Text von Benutzern der neuen Informationstechnologien langfristig nicht akzeptiert werden. Natürliche Sprache als flexibles und insbesondere für den menschlichen Interaktionspartner natürliches Kommunikaktionsmedium wird zunehmend an Bedeutung gewinnen.

Eine in der Entwicklung von adäquaten sprachgenerierenden Systemen zentrale Problemstellung betrifft die pragmatische Fundierung der Sprachproduktion: der maschinelle Kommunikationspartner muß über die Fähigkeit verfügen, den textuellen und situativen Kontext eines Diskurses zu berücksichtigen. Dies beinhaltet u.a. in erheblichem Umfang Vorwissen über Verhaltensweisen, standardmäßige Abläufe, etc.

Als ein einfaches Beispiel für die pragmatische Fundierung der Sprachproduktion mag hier die alltägliche Situation einer Flugbuchung dienen. Wenn gewisse Parameter für typische Präferenzen eines bestimmten Kunden bereits gespeichert sind (z.B. Bevorzugung eines Fensterplatzes, Nichtraucher etc.) muß dies bei der sprachlichen Interaktion von der Maschine berücksichtigt werden, beispielsweise dadurch, daß die gespeicherten Präferenzen nicht zum zentralen Thema des Diskurses gemacht werden, aber innerhalb desselben durchaus thematisiert werden können. Die Quellen pragmatischer Wissensbestände können ganz unterschiedlicher Natur sein: sie können durch Situationen vorgegeben sein, sie können aus dem bisherigen (oder sogar einem früheren) Diskursverlauf abgeleitet sein, sie können sich aus dem Partnermodell, dem Wissen über das Wissen des Kommunikationspartners, ergeben - um nur einige der möglichen Quellen zu nennen. Annahmen dieser Art bestimmen wesentlich, welche Informationen verbal ausgedrückt werden sollen, um eine kommunikative Absicht zu erreichen. Sie bestimmen aber auch, in welcher Weise dies zu geschehen hat, ob z.B. ein Fachbegriff verwendet werden kann oder dieser erst eingeführt werden muß. Unter der Leitlinie einer pragmatischen Fundierung können Entscheidungen auf der sprachlichen Ebene (z.B. Satzstellung, Wortwahl) gezielter getroffen werden, was insbesondere für Anwendungen in der Informationsvermittlung von Bedeutung ist.

1.1.4 Einige zentrale Fragestellungen zur Sprachproduktion

Die Beschreibung und Erklärung der hier skizzierten Probleme und Phänomene kann nur dann gelingen, wenn einige zentrale Fragen zur Sprachproduktion aus einer interdisziplinären Perspektive beantwortet werden. Im weiteren sollen die wichtigsten kurz angesprochen werden.

(a) Schnittstelle zwischen Konzeptualisierung und Formulierung:

Welche Arten von Repräsentationen liegen auf der konzeptuellen Ebene vor? Wie ist das Zusammenspiel zwischen propositionalen und bildhaft-visuellen Repräsentationen? Welchen Einfluß haben die verschiedenen Arten der Repräsentationen auf der konzeptuellen Ebene für den Aufbau einer lexikalisch/syntaktischen Struktur, auf den Zeitverlauf, auf syntaktische Variabilität etc.? Wie sprachunabhängig kann die Konzeptualisierung überhaupt sein? Gibt es direkte Einflüsse der Sprache auf die Konzeptualisierung? Wie wirken sich Schwierigkeiten der Konzeptualisierung auf die Sprachproduktion aus? Was sind die Einheiten der Konzeptualisierung, die in sprachliche Einheiten transformiert werden, wie groß sind die Verarbeitungseinheiten auf der konzeptuellen und den sprachlichen Ebenen und wovon hängt die Größe dieser Verarbeitungseinheiten ab?

(b) Architektur kognitiver Prozesse:

Welcher Art ist die allgemeine Architektur der beteiligten kognitiven Prozesse? Welche Subsysteme sind zu unterscheiden, und wie stehen sie untereinander in Verbindung? Sind es unabhängige Module, die nur auf Grund des Inputs eines bestimmten anderen Moduls arbeiten, oder sind alle Systeme untereinander vernetzt? Verläuft die Verarbeitung seriell oder interaktiv? Gibt es feedback-Prozesse?

(c) Prozesse des syntaktischen Aufbaus:

Inwieweit können Syntaxkonzeptionen der theoretischen Linguistik als Konzeptionen über Strukturbedingungen für sprachliche Prozesse verwendet werden? Welches sind die Einheiten der syntaktischen Planung? Inwiefern korrespondieren syntaktische Strukturen, die die verschiedenen formalen Syntaxtheorien postulieren, mit syntaktischen Strukturen, die Sprecher/innen verwenden? Wie weit planen Sprecher/innen voraus? Wie stark wird die syntaktische Planung durch die Verwendung eines sehr eingeschränkten Repertoires syntaktischer Strukturen erleichtert? Inwieweit restringiert eine einmal gewählte syntaktische Struktur konzeptuelle Prozesse (s.o.)? Welche syntaktischen Bausteine gibt es, die miteinander variabel verknüpft werden können? Welche Rolle spielt dabei die Morphologie und wie kommt sie ins Spiel? Wie unterscheiden sich einzelne Sprachen in diesem Punkt? Als wie geeignet erweisen sich vorhandene Syntaxtheorien für die Modellierung solcher Prozesse?

(d) phonologischer Aufbau

Inwieweit müssen die phonologischen Repräsentationen von Morphemen/Wörtern jeweils aktuell Phonem für Phonem aufgebaut werden (wofür die Analyse von Sprechfehlern spricht). Inwieweit werden diese Prozesse durch hochfrequente Silben erleichtert, die als ganze Bausteine abgerufen werden können? Verläuft die phonologische Verarbeitung inkrementell, von links nach rechts, oder werden die Segmente parallel aktiviert? Wie wird die metrische Struktur aufgebaut? Was determiniert den Sprechrhythmus? Wie spiegelt sich die (konzeptuell bestimmte) Informationstruktur in der phonologischen Planung wider? Wie weit voraus wird phonologisch geplant?

(e) Artikulation

Die Artikulation unterscheidet sich grundsätzlich von den vorangegangenen Prozessen, da sie die Transformation einer sprachlichen Repräsentation in motorische Aktivität beinhaltet. Eine zentrale Frage ist die nach der Art der Repräsentation, die als Eingabe für die motorische Komponente dient: Ist sie motorischer oder eher auditiver Art? Vieles spricht für auditive Zielrepräsentationen, da die Artikulation unter sehr variablen motorischen Bedingungen weitgehend verzögerungs- und fehlerfrei verläuft. Es sind noch viele Fragen der Schnittstelle zwischen phonologischen und artikulatorischen Prozessen ungeklärt. Wie groß sind die phonologischen Einheiten, die an die artikulatorische Komponente weitergegeben werden? Wie groß ist der Speicher, der für die geforderte Transformation notwendig ist? Unterscheidet sich die motorische Ausführung innerhalb von Planungseinheiten von derjenigen zwischen solchen Einheiten?

(f) maschinelle Textgenerierung

Wie lassen sich planbasierte Ansätze mit schemabasierte in Einklang bringen? Gibt es Aufgaben der Sprachgenerierung, für die sich einer der beiden Ansätze besonders eignet? Welche Rolle spielen Revisionsmechanismen? Inwieweit kann auf Partner- (Rezipienten-)modellierung verzichtet werden? Gibt es Anwendungen, die dies zulassen oder ist die Partnermodellierung unverzichtbar? Welche Techniken lassen sich für die Generierung von Texten für eine heterogene Rezipientengruppe einsetzen? Wie gestalten sich Generierungsaufgaben bei der maschinellen Übersetzung? Gibt es prinzipielle Unterschiede zwischen einem Interlingua- und einem Transferansatz? Existieren grundlegende Unterschiede zwischen verwandten und weit auseinanderliegenden Sprachen? Gibt es wesentliche Unterschiede zwischen der Erzeugung isolierter Texte (z.B. Nachrichten) und Texten, die in dialogischen Situationen erzeugt werden? Wie gestalten sich Generierungsprozesse, wenn nicht nur sprachliche Texte erzeugt werden sollen, sondern auch andere Informationsprozesse eingebunden werden (multimodale Generierung)?

1.1.5 Anwendungen und Auswirkungen

Obwohl der Schwerpunkt primär grundlagenorientiert ausgerichtet ist, können die Ergebnisse des SPP u.E. mittelfristig zu Anwendungen in zumindestens zwei Bereichen führen:

* maschinelle Sprachverarbeitung

Ein wichtiger potentieller Anwendungsaspekt für psycholinguistische Erkenntnisse zur Sprachproduktion ist auf der Seite der automatischen Sprachgenerierung zu suchen, die ja als eine Teildisziplin im geplanten Schwerpunkt vertreten ist. Einerseits könnten davon Ansätze profitieren, die den Anspruch haben, 'kognitiv' zu sein. Andererseits könnten positive Effekte selbst auf eher ingenieurmäßig ausgerichtete Ansätze Wirkung haben, die die menschliche Verarbeitung als optimales Modell nehmen.

* Sprachpathologie / Behandlung von Sprach- und Sprechstörungen

Verbesserte Kenntnisse über den Verlauf der Generierung von Sprache sollten einen Beitrag zur Behandlung von Sprach- und Sprechstörungen liefern können. Nichts ist für eine effiziente Therapie von größerer Bedeutung als möglichst genaues Wissen über die zugrundeliegenden Strukturen und Ursachen. Dies betrifft sowohl Aphasien als auch Sprechstörungen wie etwa das Stottern.

1.1.6 Abgrenzung zu verwandten Forschungsgebieten

Um eine Konzentrierung auf einige zentrale Fragestellungen zu erreichen, sollen einige Teilbereiche, die für eine Sprachproduktionsforschung durchaus fruchtbar sind, zurückgestellt werden.

Die Produktion mündlicher und schriftlicher Sprache unterscheidet sich wesentlich voneinander. Die wichtigste Trennungslinie zieht der zeitliche Verlauf. Während das Sprechen ein hochautomatisierter und äußerst schnell verlaufender Prozeß ist, steht beim Schreiben im Prinzip beliebig viel Zeit zur Verfügung. Entscheidungen auf der konzeptuellen, lexikalen oder syntaktischen Ebene können erwogen, verworfen und neu compiliert werden.

Damit stehen Sprecher und Schreibende vor teilweise recht unterschiedlichen Anforderungen. Es erscheint daher sinnvoll, sich primär auf eine dieser Modalitäten zu konzentrieren. Psycholinguistisch ausgerichtete Forschung wird dabei eher gesprochene Sprache untersuchen, die auch bisher bei der experimentellen Forschung zur Sprachproduktion eindeutig im Vordergrund steht, Computerlinguistik und sprachorientierte KI (Künstliche Intelligenz) werden eher Probleme einer schriftlichen Sprachproduktion bearbeiten.

Gemeinsame Fragestellungen ergeben sich dabei insbesondere in den Phasen der Konzeptualisierung und der Formulierung. Um eine hohes Maß an gemeinsamen Fragestellungen zu erzielen, sollen Prozesse der strategischen Textproduktionsplanung und Textüberarbeitung, wie sie bei der Produktion literarischer, aber auch gebrauchssprachlicher schriftlicher Textproduktion auftreten, im SPP nicht bearbeitet werden.

Darüber hinaus ist nicht vorgesehen, im SPP motorische Prozesse der hand- oder maschinenschriftlichen Textproduktion zu untersuchen, da die für diesen Bereich spezifischen Fähigkeiten von den anderen, im Zentrum der Untersuchungen stehenden sehr verschieden sind.

Da Untersuchungen zum normalen Prozeß der Sprachproduktion im Mittelpunkt der Arbeiten des Schwerpunkt stehen, sollen klinische Störungen nur insofern berücksichtigt werden, wie sie zum besseren Verständnis der nicht-gestörten Produktion beitragen. D.h., daß im SPP nicht die Entwicklung diagnostischer Mittel oder therapeutischer Verfahren angestrebt wird, sondern gegebenenfalls die Verbesserungen der Voraussetzungen für derartige Entwicklungen.

 

1.2 Stand der Forschung

Die Forschung im Bereich Sprachproduktion wurde bisher innerhalb der Disziplinen Linguistik, Psychologie und Informatik häufig isoliert und teilweise unter nur peripherer Berücksichtigung der einschlägigen verwandten Arbeiten aus den anderen Disziplinen durchgeführt. Dabei hat es durchaus eine Reihe von ‘Parallelentwicklungen’ gegeben, die es einerseits erleichtern, verschiedene Forscherteams zusammenzuführen, die andererseits jedoch die verfügbaren Ressourcen nicht optimal genutzt haben. Im folgenden werden der Stand der Forschung in verschiedenen Disziplinen dargestellt sowie einige Querverbindungen aufgezeigt werden.

Die Beschäftigung mit der Sprachproduktion ist in allen genannten Disziplinen nach wie vor stark unterrepräsentiert. Es gibt weit mehr Arbeiten zu den Prozessen des Sprachverstehens und des Spracherwerbs sowie zu sprachlichen Strukturen ohne Berücksichtigung sprachlicher Prozesse. Dafür dürften - im Bereich der Psycholinguistik (vgl. 1.2.1.) - vor allem methodische Gründe in Betracht zu ziehen sein. Das Kardinalproblem für einen experimentellen Zugang bei der Erforschung der Generierung natürlicher Sprache ist die Variabilität der abhängigen Variable - des zeitlichen Verlaufs und der Form sprachlicher Äußerungen. Es hat sich als äußerst schwierig erwiesen, Experimente zu entwickeln, bei denen eine hinreichende Kontrolle über das erreicht werden kann, was Sprecher sagen, ohne die Aufgaben über ein vertretbares Maß hinaus zu restringieren (demgegenüber kann man bei der Untersuchung von Sprachverstehensprozessen auf eine Reihe bewährter methodischer Paradigmen zurückgreifen, deren abhängige Variablen gut kontrollierbar sind.) Schränkt man die Aufgabenstellung jedoch in geeigneter Weise ein, so besteht die Gefahr, daß hiermit eine fast vollständige Festlegung des ‘zu verbalisierenden Inhalts’ verbunden ist, und somit die Stufe der Konzeptualisierung nicht hinreichend untersucht werden kann. Ähnliche Schwierigkeiten ergeben sich auch in der Computerlinguistik (sprachorientierten KI): hier wird häufig noch die Inhaltsfestlegung als eigenständige Komponente betrachtet, die von der sprachlichen Realisierung unabhängig ist (vgl. 1.2.3.). Wechselwirkungen zwischen den beiden skizzierten Aspekten der Sprachproduktion können in einem solchen Modell nicht berücksichtigt werden.

1.2.1 Sprachpsychologie / Psycholinguistik

Der Prozeß der Sprachproduktion wird heute zumeist in drei Stufen unterteilt, die als Konzeptualisierung, Formulierung und Artikulation bezeichnet werden (Levelt, 1989). Auf der Stufe der Konzeptualisierung wird der Inhalt der Äußerung festgelegt, d.h. es wird entschieden ‘was gesagt wird’, es werden Hörererwartungen berücksichtigt und es wird die Art des Sprechaktes gewählt, etwa zwischen Frage und Aufforderung entschieden. Auf der Stufe der Formulierung findet die Transformation der konzeptuellen Struktur, d. h. des Inhalts der geplanten Äußerung, in eine spezifisch sprachliche Struktur statt. In diese Phase gehören vor allem die Aktivierung geeigneter lexikaler Einträge in einem mentalen Lexikon, der Aufbau einer syntaktischen Struktur sowie die Überführung in eine phonologische Repräsentation. Während der Artikulation schließlich wird die phonologische Repräsentation in motorische Aktivität umgesetzt.

Einen wichtigen Aspekt bei der Konzeptualisierung stellt die Einbeziehung des Hörerwissens durch den Sprecher dar. Dabei muß nicht nur das faktische Wissen berücksichtigt werden, sondern auch und vor allem die Art der sozialen Beziehung. Der Sprecher muß ein Modell des Kommunikationspartners besitzen, um auf der Basis dieses Modells eine kommunikativ erfolgreiche Äußerung planen zu können (vgl. Herrmann & Grabowski, 1994). Insgesamt geht es darum, die Faktoren zu bestimmen, die die inhaltliche Planung der Sprecher signifikant beeinflussen und deren Interdependenzen zu ermitteln.

Die Stufe der Formulierung gliedert sich in die Substufen der grammatischen und phonologischen Kodierung. Im Zentrum der Untersuchungen zur grammatischen Kodierung steht bislang die Frage, ob der lexikale Zugriff in einer oder in zwei Stufen verläuft. Eine Reihe experimenteller Befunde stützt die Zweistufentheorie des lexikalen Zugriffs: zuerst werden nur semantische und syntaktische Informationen lexikaler Einträge aktiviert und erst in einer zweiten Phase deren phonologische Formen (Levelt et al., 1991; Schriefers et al., 1990). Dennoch kann diese Frage kaum als endgültig entschieden gelten. Zum einen ist die Datenbasis noch nicht ausreichend, zum anderen fehlen Experimente zur Aktivation syntaktischer Information. Sehr unklar sind der syntaktische Aufbau und seine Beziehungen zur konzeptuellen Repräsentation und zum Lexikon. Hierzu gibt es nur ganz wenige Ansätze (vgl. Kempen & Hoenkamp, 1987; Kempen & Vosse, 1989; de Smedt & Kempen, 1987). In diesem Punkt wäre eine sehr enge Zusammenarbeit von theoretischer Linguistik und Psycholinguistik dringend wünschenswert. Unstrittig ist, daß lange Äußerungen nicht als eine Einheit, sondern inkrementell, in einzelnen Fragmenten, verarbeitet werden. Damit stellt sich jedoch die Frage der Größe der Inkremente (vgl. Pechmann, 1989, 1994).

Schließlich sind auch morphologische Prozesse bei der Sprachgenerierung noch viel zu wenig erforscht, um deren systematische Verortung zwischen syntaktischen und phonologischen Prozessen vornehmen zu können, oder etwa im Hinblick auf Wortbildungsprozesse die Anbindung an die konzeptuelle und semantische Verarbeitungsphase beschreiben zu können.

Bei der phonologischen Kodierung stehen in der aktuellen Diskussion Fragen der Inkrementalität, der Syllabifikation und der Metrisierung im Vordergrund. Die Analyse von Sprechfehlern hat deutlich werden lassen, daß Wörter in der Regel nicht als phonologisch fertige Einheiten aus dem Lexikon abgerufen werden, sondern daß ihre Lautform aktuell aufgebaut wird (vgl. Shattuck-Hufnagel, 1987). Experimentelle Ergebnisse sprechen dafür, daß diese Aufbauprozesse inkrementell verlaufen, häufig - aus einer Verstehensperspektive (Modus des Lesens) - als von 'links nach rechts' charakterisiert (vgl. Meyer, 1991). Geklärt werden muß, welche Rolle dabei Silben spielen und inwieweit Silben als zur Verfügung stehende Einheiten abrufbar sind. Von Bedeutung ist zweifelsohne auch die metrische Struktur. Zu untersuchen ist beispielsweise ihre Einflußnahme auf die Bildung phonologischer Wörter, phonologischer Phrasen und von Intonationsphrasen.

Der Prozeß der Artikulation unterscheidet sich von den vorangehend skizzierten Stufen dadurch, daß hier nun motorische Prozesse aktiviert werden müssen. Wichtige Fragen sind, welche Eigenschaften und Größe der Buffer hat, der der motorischen Aktivierung vorgeschaltet ist und welcher Art die Zielrepräsentationen sind, die die motorischen Aktivationen steuern. Es gibt einige Evidenz, die dafür spricht, daß sie eher auditiver als motorischer Art sind.

Zur Gesamtarchitektur des Sprachproduktionsprozesses hat es zwei alternative Konzeptionen gegeben: modular-serielle Ansätze (vgl. Garrett, 1988; Levelt, 1989) und interaktiv-konnektionistische Ansätze (Berg, 1988; Dell, 1986; Schade, 1992). Die Auseinandersetzung zwischen beiden Vorschlägen dauert an. Sie findet auf dem Gebiet der Sprachproduktion in besonders pointierter und fruchtbarer Weise statt. Die diesbezügliche Diskussion kann durchaus stellvertretenden Wert für weite Bereiche der Kognitionswissenschaft beanspruchen: die Zusammenarbeit der experimentell-arbeitenden Psycholinguistik, der Computer-Simulationen verwendenden KI und Psycholinguistik und der die formalen Eigenschaften derartiger Prozesse untersuchenden Computerlinguistik und theoretischen Informatik wird u.E. zu erheblichen Fortschritten im Hinblick auf die kognitive Architektur des Sprachverarbeitungssystems im Rahmen eines interdisziplinären Ansatzes führen.

Zwei Problemfelder wurden in der bisherigen Forschung stark vernachlässigt. Zum einen ist das der Prozeß des syntaktischen Aufbaus. Wir haben bisher viel zu wenig detaillierte und empirisch abgesicherte Vorstellungen darüber, wie der Wechselwirkungsprozeß zwischen konzeptueller Struktur, lexikaler Selektion und syntaktischer Entwicklung verläuft. In diesem Punkt könnte eine enge interdisziplinäre Kooperation von Linguistik und Psycholinguistik von ganz besonderem Wert sein: während die Grammatik aus der Perspektive der Linguistik als Wissensstruktur aufgefaßt wird, steht für die Psycholinguistik die Frage der Verarbeitung in Realzeit im Vordergrund. Die Computerlinguistik / sprachorientierte KI steht in ihren Untersuchungen, die durch Modellbildung und Systemrealisierung geprägt sind, zwischen den beiden Standpunkten der theoretischen Linguistik und Psycholinguistik: Es wird eine explizite, deklarative Modellierung der Wissensquellen, die am Prozeß der Sprachproduktion beteiligt sind, angestrebt. Im Hinblick auf Realzeitverarbeitung muß hier zwischen gesprochener und geschriebener Sprache ein deutlicher Unterschied gesehen werden, wie dies im übrigen auch bei Menschen der Fall ist.

Zum zweiten gibt es bislang fast keine Forschung zur Sprachproduktion auf der Basis bildgebender neuropsychologischer Methoden (ERP, PET, MEG). Während neurowissenschaftliche Instrumente dieser Art mittlerweile zu einem integralen Bestandteil in der Untersuchung vieler kognitiver Domänen geworden sind, fehlen entsprechende Ergebnisse für die Sprachproduktion bisher völlig. Dies hat vor allem methodische Gründe: die motorische Aktivität während der Artikulation verhindert die Messung und adäquate Interpretation evozierter Hirnpotentiale. Wenn Probleme dieser Art durch neuere Methoden in den Griff zu bekommen sind, könnten wir uns wichtige Erkenntnisse über bei der Sprachproduktion beteiligte strukturelle Komponenten und zeitliche Verläufe entsprechender Prozesse erhoffen.

1.2.2 Theoretische Linguistik / Allgemeine Sprachwissenschaft

Für die theoretische Linguistik stellt die Auseinandersetzung mit dem Prozeßcharakter der Generierung von Sprache sowohl eine Herausforderung als eine Chance dar. Ihre Arbeitsweise hat sich bisher ganz überwiegend auf die Systematisierung des statischen Gegenstands Sprache konzentriert, war auf den Strukturaspekt der Sprache orientiert. In dieser Hinsicht hat sie für alle Ebenen des Sprachsystems z.T. konkurrierende Modelle entwickelt und sie teilweise als Modelle eines grammatischen Gesamtsystems integriert, für das überlegt wurde, welchen generellen Prinzipien es unterliegt und wie es einzelsprachlich realisiert wird (Chomsky 1991, 1992). Während die Psycholinguisten schon immer linguistische Theorien mitgenutzt haben, nähern sich durch die Implementierbarkeit heutiger Grammatikmodelle und durch die Verfeinerung der Programmiersprachen in Parallele zu Unifikationsgrammatiken nun auch die Instrumente der theoretischen Linguistik und der Computerlinguistik in den letzten Jahren einander stärker an (vgl. Shieber, 1986). In allen Systemen hat das Lexikon einen zentralen, die Teilsysteme integrierenden Platz bekommen. Das zeigt sich sowohl an den Arbeiten zur Argumentstruktur, wie zur Wort- und Silbenstruktur der Lexikoneinheiten. Die theoretische Linguistik hat als Voraussetzung für eine Beschäftigung mit dem Gegenstand Sprachproduktion den Stand erreicht, daß die Grammatiken modular durch eine Semantik, wie sie etwa Bierwisch (1983, 1989) oder Wunderlich (1992) vorgeschlagen haben, durch die Wortbildungs- und Flexionsbildungskomponente (Carstairs-McCarthy, 1992; Fanselow, 1991; Jensen, 1990; Selkirk, 1982, 1984) und schließlich durch eine segmentale und suprasegmentale Phonologie (Durand, 1990; Nespor & Vogel, 1986; Pierrehumbert, 1980; Wiese, 1988, 1992) ergänzt werden. Die Montaguegrammatik nutzt das gleiche System strukturell wie interpretierend (Montague, 1970). Die HPSG (head-driven phrase structure grammar) hat die semantische Komponente in ihren Unifikationsmechanismus integriert (Pollard & Sag, 1993).

Ein Beispiel, an dem die Vorteile und die Notwendigkeit der produktionsseitigen Betrachtung von Problemen der theoretischen Linguistik und die Kooperation mit anderen Disziplinen in einem kognitionswissenschaftlichen Verbund exemplarisch deutlich werden kann, ist das aktuelle Forschungsthema Informationsstrukturierung.

Die informationsstrukturelle Gliederung von Texten oder Redebeiträgen wird mindestens durch Welt- und Fachwissen, Textsortenkenntnis, soziales Wissen und das Partnermodell gesteuert. Beim Übergang von den konzeptuellen Strukturen zu den Formulierungen der ‘Inhalte unseres Denkens’ muß die schon prozeßseitig darstellbare Interaktion von Kontext, Inferenzen und semantischen Repräsentationen erfolgen. Es muß deutlich werden, daß und warum so viel Information implizit bleibt und daß die versprachlichte Information durch Nutzung der Grammatik auch schon informations- und textstrukturell gegliedert ist. Hier finden auch die Argumente für oder gegen eine Ein- bzw. Zweiebenensemantik ihren Platz. An der Nahtstelle konzeptuelles System - Semantik sind sehr viele Fragen offen, die sich entscheidend auswirken auf die Kompositionalität der semantischen Repräsentationen (z.B. der große Bereich der konzeptuellen Verschiebungen, der Zusammenhang von Objekt- und Ereignisdomänen bzw. -repräsentationen, der Zusammenhang von Ereignis- und Zeitverläufen bzw. -repräsentationen), wenn z.B. zu erklären ist, daß das Fehlen des Artikels (etwa im Russischen) durch Fokus, Wortstellung, Kasus, Aspekt oder die Repräsentation konkreter Objekt- und Ereigniseigenschaften kompensiert wird.

Bei der Abbildung von Semantik auf Syntax ist die Argumentstruktur der Verben weiterhin entscheidend, damit begründet werden kann, was in der Basis zu erzeugen ist und welche syntaktischen Positionen in den einzelnen Sprachen überhaupt gerechtfertigt sind, ob schwache oder starke Kasus vorliegen und wie sich dieses Geflecht unter Berücksichtigung dessen, was wir aus der Sprachtypologie und aus der Parametrisiertheit von Grammatiken wissen, in der Oberflächensyntax auswirkt.

Bei der Abbildung von Syntax auf Phonologie sind syntaktische und phonologische Domänen einander zuzuordnen, damit der Fokus phonologisch adäquat festgelegt und interpretiert wird. Untersuchungen dazu sind durch Signalanalysen zu stützen. Ob aber der Fokus z.B. nur über seinen Reflex in der Syntax mit der semantischen Repräsentation zusammenspielt, ist ein Thema, das den seriell-modularen bzw. den interaktiv-konnektionistischen Aufbau der Grammatik wesentlich betrifft.

Das Beispiel der Informationsstrukturierung macht deutlich, daß ein wirklich ernst gemeinter generativer grammatischer Ansatz, der zwei Jahrzehnte lang zugunsten der Phänomene auf den einzelnen Ebenen vernachlässigt wurde, äußerst vielversprechend ist und das theoretische Gerüst für die Schnittstelle zur Sprachproduktion als aktuelles Verarbeitungssystem liefern könnte.

1.2.3 Computerlinguistik, sprachorientierte KI

Im Gegensatz zur Analyse natürlicher Sprache ist ihre Produktion von der Computerlinguistik und von der KI erst relativ spät als wichtiges Forschungsfeld entdeckt worden. Startpunkt für eine systematische Forschung zur automatischen Textgenerierung war eine Konferenz, deren wichtigste Ergebnisse in Mann (1982) dokumentiert sind.

Die Prognosen, die damals für eine Forschungsperiode von 5 Jahren aufgestellt wurden, sind z.T. auch nach mehr als 10 Jahren noch nicht realisiert. Zu Beginn der 80er Jahre hatte man die Probleme, die mit der Sprachgenerierung verbunden sind, noch gar nicht vollständig erkannt. Die späte, aber intensive Beschäftigung mit dem Thema Generierung hat jedoch nach wenigen Jahren dazu geführt, daß erste paradigmatische Systeme implementiert wurden, deren methodische Hintergründe auch noch heute von Bedeutung sind. In erster Linie ist hier das System TEXT zu nennen (McKeown, 1985), das Antworttexte zu Anfragen über Datenbankschemata erzeugt, sowie das System KAMP (Appelt, 1985), das instruierende Äußerungen eines Experten für einen Laien generiert, der eine bestimmte Reparaturaufgabe leisten sollte. Die in diesen beiden Systemen realisierten Generierungsprinzipien waren der schemabasierte Ansatz (TEXT) und der planbasierte Ansatz (KAMP). Ersterer richtet sich an den Strukturen sprachlicher Texte aus, während letzterer die Sprachproduktion als von Intentionen geleitete Aktivität betrachtet, die vor allem das Wissen und die Fähigkeiten des Adressaten in den Planungsprozeß mit einbezieht. Gleichzeitig mit diesen ersten Systemen wurde eine systematische Einteilung des Generierungsprozesses entwickelt: die Unterscheidung zwischen Inhaltsfestlegung (strategische Generierung, ‘Deciding what to say’) und Formfestlegung (taktische Generierung, ‘Deciding how to say something’). In einem späteren System PAULINE (Hovy, 1988), das man ebenfalls als paradigmatisch bezeichnen kann, wurde als dritte Aufgabe die Bedeutung pragmatischer Aspekte für die Sprachproduktion (‘Deciding why to say something’) in die Diskussion eingebracht.

Alle drei Teilaufgaben sind heute generell akzeptiert, wobei allerdings umstritten ist, wie sie zusammenwirken sollen und welche Entscheidungen welcher Teilaufgabe zuzuordnen sind (Hoeppner, 1995). Im Bereich der linguistischen Grundlagen waren zwei Entwicklungen für die Generierungsforschung von zentraler Bedeutung: die systemische Grammatik (Fawcett & Young, 1988; Halliday, 1985), die sich wegen der parallelen Behandlung syntaktischer, semantischer und pragmatischer Aspekte für Generierungsaufgaben besonders eignet, und die Rhetorical Structure Theory (RST; Mann & Thompson, 1988), die ein Inventar semantischer Relationen zwischen Textpropositionen aufstellt.

Neben den bisher dargestellten Ansätzen, in denen die Problembetrachtung auf der Textebene im Vordergrund steht, sind intensive Untersuchungen auch im Bereich der Satzgenerierung erfolgt. Hier ist insbesondere eine enge Wechselwirkung mit neueren Entwicklungen der Grammatikforschung (als Teil der theoretischen Linguistik) festzustellen. Die Konzeption der HPSG ist sowohl den Grundannahmen der Chomskyschen Linguistikkonzeption einerseits als auch den Bedingungen einer computerlinguististischen Sprachverarbeitungstheorie verpflichtet (Shieber et al., 1990; Gerdemann & Hinrichs, 1995). Während die Kooperation zwischen theoretischer Linguistik und Computerlinguistik meist den Bereich formaler, mathematischer Beschreibungen für syntaktische und semantische Strukturen und deren Umsetzung durch maschinelle Verfahren betrifft, liegen andererseits auch wichtige Ansätze zur Verbindung psycholinguistischer und computerlinguistischer Konzeptionen zur Sprachproduktion vor. Kempen & Hoenkamp (1987) und de Smedt (1990) haben maschinelle Systeme der Satzgenerierung entwickelt, die auf psycholinguistischen Erkenntnissen zur inkrementellen Natur von natürlichen Sprachproduktionsprozessen basieren. Die von Levelt (1989) vorgestellte kognitive Architektur für die Sprachproduktion erfährt in den Arbeiten der SYNPHONICS-Gruppe an der Universität Hamburg eine computerlinguistische Erweiterung und Realisierung, wobei insbesondere die im ursprünglichen Ansatz eher skizzierte Konzeptualisierungskompenente in den Vordergrund der Untersuchungen gerückt wird (Herweg, 1992; Günther et al., 1996).

Im Bereich der Anwendung sind bislang vor allem die folgenden Bereiche untersucht worden: Generierung von Erklärungstexten (z.B. im Zusammenhang mit Expertensystemen), Generierung von Antworttexten (z.B. im Zusammenhang mit natürlichsprachlichen Datenbankschnittstellen), Generierung von Instruktionen und technischen Dokumentationen, multimodale Texterzeugung, multilinguale Generierung und maschinelle Übersetzung. Es existieren auf all diesen Gebieten Systeme, die für bestimmte, eng begrenzte Anwendungsfälle Lösungen anbieten. Was jedoch kaum erkennbar ist, sind Ansätze, die den Sprachproduktionsprozeß nach generellen Prinzipien modellieren. Zur Überwindung dieses Defizits wäre eine viel stärkere Beachtung der Arbeit anderer Disziplinen notwendig.

Zusammenfassend kann der heutige Stand der Forschung dadurch gekennzeichnet werden, daß die Problembereiche bei der Textgenerierung hinreichend erkannt worden sind, um prinzipiellen und allgemeingültigen Lösungen nachgehen zu können (vgl. Hoeppner & Horacek, 1995; Hoeppner, 1995). Eine Konzentrierung und interdisziplinäre Einbettung der bislang eher vereinzelten Forschungsprojekte verspricht auf der Basis eines fundierten Problemverständnisses, daß das noch bestehende Defizit bei Modellen der Sprachproduktion im Vergleich zu denen der Sprachanalyse ausgeglichen wird.

Überblicke über den Bereich der Sprachgenerierung finden sich in Busemann & Novak (1993), McDonald (1987) sowie McKeown & Swartout (1988).

 

1.3 Arbeitsprogramm

Ziel des hier vorgeschlagenen SPP ist, die anstehenden Probleme der Sprachproduktionsforschung aus interdisziplinärer Perspektive zu bearbeiten. Dies scheint uns zwingend notwendig zu sein, um signifikante Fortschritte erreichen zu können. Eine Gliederung des Arbeitsprogramms kann sich daher nicht an den Einzelwissenschaften orientieren, sondern muß auf inhaltliche Bereiche ausgerichtet sein. Da zudem in allen beteiligten Disziplinen der Prozeßcharakter der Sprachverarbeitung eindeutig im Mittelpunkt stehen soll, bietet es sich an, das Arbeitsprogramm entsprechend der Makrostufen der Sprachproduktion zu gliedern, wie wir sie in diesem Vorschlag zur Einrichtung eines SPP bereits mehrfach skizziert haben.

1.3.1 Konzeptualisierung

Am Beginn der Generierung einer sprachlichen Äußerung steht notwendigerweise die inhaltliche Planung dessen, was gesagt werden soll und eine Intention, warum dieser Inhalt kommuniziert werden soll. Damit sind zum einen die Repräsentationen angesprochen, die den Inhalt formen. Sie können sehr unterschiedlicher Art sein und umfassen im Prinzip den gesamten Bereich menschlicher Erfahrungen. Einige dieser Repräsentationen mögen sehr ‘sprachnah’ oder direkt sprachlich gebunden sein, wie ein Teil unseres enzyklopädischen Wissens. Andere, z.B. musikalische Wahrnehmungen oder Gerüche, sind selbst nicht lexikalisiert und erfordern indirekte Übersetzungsprozesse, um sprachlich ausgedrückt werden zu können.

Zum anderen ist damit das Wissen über die Kommunikationspartner angesprochen. Äußerungsinhalte entwickeln sich nicht im sozialen Vakuum. Vielmehr muß bei der konzeptuellen Planung in Rechnung gestellt werden, was der Kommunikationspartner bereits weiß, welcher Art die soziale Beziehung zu ihm ist oder als welcher Sprechakt die Äußerung von ihm verstanden werden soll (ob als Befehl, Frage oder Versprechen etc.). Dieses Annahmengefüge wirkt sich signifikant auf die Informationsstrukturierung aus: welche Information kann als bekannt vorausgesetzt werden, welche muß fokussiert werden?

Schließlich werden sprachliche Äußerungen in der Regel nicht isoliert, sondern im Kontext einer Rede oder eines Textes generiert. Das bedeutet, daß bei der Konzeptualisierung auch dieser Zusammenhang zu berücksichtigen ist. Er beeinflußt nicht nur die Wahl dessen, was gesagt werden kann auf der Folie dessen, was bereits gesagt wurde, sondern restringiert auch in starkem Maße die sprachliche Realisierung (Pronominalisierungen, Wahl des bestimmten oder- unbestimmten Artikels etc.).

Im folgenden werden einige zentrale Fragen skizziert, die sich auf diese Stufe des Prozesses der Sprachproduktion beziehen, und die im Rahmen des geplanten SPP bearbeitet werden sollen.

- Wie wirken sich verschiedene Arten von Repräsentationen auf die nachfolgenden Prozesse aus? Ein bedeutender Unterschied könnte darin bestehen, ob die Repräsentationen mehr oder weniger direkt lexikalisiert sind oder zunächst ‘in Sprache transformiert’ werden müssen. Das könnte Einfluß auf den Zeitverlauf der konzeptuellen Planung, auf die Größe der Planungseinheiten, wie auch auf die Beschränkungen der Suche im mentalen Lexikon haben.

- Sowohl die Eingangsgrößen als auch das Ergebnis der Konzeptualisierung müssen in einer formalen Repräsentation vorliegen. Welche Darstellungsweisen sind dafür geeignet? Welche Information muß explizit in der Bedeutungsstruktur enthalten sein?

- Wie müssen wir uns die Schnittstelle zwischen Konzeptualisierung und dem semantisch/syntaktischen System vorstellen? Eine wichtige Frage ist, ob es feedback-Prozesse zwischen Lexikon und Syntax auf der einen Seite und den konzeptuellen Prozessen auf der anderen gibt. Bildet die Konzeptualisierung ‘lediglich’ den Input für die semantisch-syntaktische Weiterverarbeitung, oder werden die konzeptuellen Prozesse ihrerseits durch Lexikon und Syntax geformt? Wie müssen Lexikon und Syntax formal beschrieben werden, damit sie solche Prozesse abbilden können? Wie gut sind vorhandene Theorien dafür gerüstet?

- Wie läßt sich der Hörerbezug modellieren? Welche Informationen über den Hörer sind von primärer Bedeutung, wenn Sprechakte gelingen sollen? Welches Wissen über den Hörer ist relevant für die Informationstrukturierung? Auf welchen nachgeschalteten sprachlichen Ebenen wird die Informationsstrukturierung wie abgebildet? Gibt es hier Rückwirkungen auf die Konzeptualisierung?

- Welchen Einfluß haben verschiedene Text- bzw. Diskurssorten auf die Konzeptualisierung? Wie sind Elemente, die größer sind als ein Satz, mental repräsentiert, und wie können diese Elemente auf mehrere, linear angeordnete Sätze verteilt werden?

1.3.2 Formulierung

Auf der Stufe der Formulierung werden konzeptuelle Repräsentationen in spezifisch sprachliche Strukturenüberführt. Dazu müssen konzeptuelle Einheiten lexikalisiert und in eine syntaktische Struktur eingebunden werden. Der Umfang des mentalen Lexikons beträgt mehrere zehntausend Einträge. Es gibt verschiedene Modelle, wie dieses Lexikon aufgebaut ist. Im Prinzip stehen sich zwei Auffassungen gegenüber: eine merkmalsbasierte, nach der lexikale Einträge durch Mengen von Merkmalen definiert werden, und eine assoziativ-konnektionistische, nach der den lexikalen Einträgen Knoten korrespondieren, die untereinander netzartig in Verbindung stehen. Definiert werden die Bedeutungen durch die Art der Verknüpfungen im Netz.

Die Beziehung zwischen mentalem Lexikon und syntaktischer Komponente muß interaktiv sein. Einerseits restringieren lexikale Einträge den syntaktischen Aufbau. Verben haben unterschiedliche Valenzen und lassen damit bestimmte Argumente (beispielsweise als Dativobjekt) zu oder nicht; Präpositionen verlangen einen bestimmten Kasus etc. Andererseits kann eine sich entwickelnde syntaktische Struktur die Wahl im Lexikon restringieren. Wenn bereits bestimmte Argumente festgelegt worden sind, muß ein Verb gewählt werden, daß ein solches Argument erlaubt etc. Diese wechselseitigen Einschränkungen gehen auf den inkrementellen Charakter der Prozesse zurück.

Wenn eine Kette von Morphemen in der syntaktisch richtigen Reihenfolge vorliegt, muß sie phonologisch kodiert werden. Vieles spricht für die Trennung der semantisch-syntaktischen Repräsentationen lexikaler Einträge von deren phonologischer Repräsentation (vgl. 1.1.2 und 1.2.1.). Die Analyse von Sprechfehlern hat deutlich werden lassen, daß die phonologischen Formen der Wörter nicht als fertige Einheiten abgerufen werden. Dafür sprechen die häufig beobachteten systematischen Phonemvertauschungen oder -verschiebungen, bei denen die Silbenposition beibehalten wird. Das heißt aber nicht, daß Wortformen nicht komplett abgerufen werden können. Dafür, daß das möglich ist, spricht, daß phonematische Fehler bei Wörtern der geschlossenen Klasse (Artikel, Präpositionen, Konjunktionen etc.), die in der Sprache mit hoher Frequenz vorkommen, so gut wie nicht zu beobachten sind.

Für die Stufe der Formulierung stellen sich folgende zentrale Fragen:

- Wie interagieren die semantische und die syntaktische Komponente? Welche Eigenschaften muß eine syntaktische Theorie haben, damit sie diese interaktiven Prozesse modellieren kann? Inwieweit zwingt eine Prozeßperspektive syntaktische Theorien zum Überdenken des Verhältnisses von Semantik und Syntax? Inwieweit können semantisch-syntaktische Theorien sowohl die Prozesse der Sprachproduktion als auch des Sprachverstehens abbilden?

- Wie groß sind die Einheiten der syntaktischen Planung? Wovon hängt ihre Größe ab? Inwieweit restringiert der allgemeine syntaktische Rahmen die Größe der Planungseinheiten? Welche Implikationen ergeben sich daraus für den zeitlichen Verlauf der Prozesse?

- Wie sieht der Zeitverlauf des Zugriffs auf das Lexikon aus? Bisher konnte empirisch untermauert werden, daß semantische Information vor phonologischer Information aktiviert wird und daß beide Prozesse nicht überlappen. Was fehlt, sind überzeugende Belege für den Zeitpunkt der Aktivierung syntaktischer Wortmerkmale.

- Wie verläuft die phonologische Kodierung? Welche Rolle spielen dabei die Silben? Inwieweit werden Wörter, Morpheme und Silben Phonem für Phonem aufgebaut, unter welchen Bedingungen können sie als fertige Bausteine abgerufen werden?

- Wie wird die Informationsstrukturierung durch die phonologische Komponente realisiert? Mit welchen Mitteln wird auf der phonologischen Ebene die Unterscheidung von Topik und Fokus, von alter und neuer Information signalisiert? Welche Repräsentationen auf den vorangehenden Stufen (Konzeptualisierung, Syntax) steuern auf welche Weise die phonologische Realisierung der Informationsstrukturierung?

1.3.3 Artikulation

Auf dieser Stufe stellen sich wegen der Beteiligung motorischer Prozesse grundlegend andere Fragen. Während die Artikulation ein traditionelles Gebiet der Phonetik innerhalb der theoretischen Linguistik ist und in diesem Rahmen auf eine reiche Ernte von Forschungsergebnissen zurückgegriffen werden kann, wurde sie von der Psycholinguistik und Computerlinguistik bisher eher vernachlässigt. Die Computerlinguistik hat sich vornehmlich auf die Generierung schriftlicher Texte konzentriert hat, was dazu geführt hat, daß Probleme der Artikulation weniger ins Blickfeld gerieten (vgl. jedoch etwa die Arbeiten der Synphonics-Gruppe an der Universität Hamburg). Diese Situation beginnt sich mit der zunehmenden Bedeutung akustischer Sprachausgabe bei der Interaktion zwischen Mensch und Maschine zu ändern.

Im folgenden werden einige wichtige Fragen skizziert, die in einem SPP ‘Sprachproduktion’ bearbeitet werden sollen.

- Alle Modelle gehen davon aus, daß der Umsetzung phonologischer Repräsentationen in motorische Aktivität ein Buffer vorgeschaltet ist. Das artikulatorische System entnimmt diesem Buffer Einheiten als Input für motorische Prozesse. Damit stellt sich die Frage, wie groß der Buffer ist und wie groß die Einheiten des motorischen Inputs sind.

- Eine entscheidende Frage ist die der Zielrepräsentationen. Es gibt zwei alternative Möglichkeiten: sie könnten motorisch definiert sein (als Bewegungsmuster der beteiligten Artikulatoren) oder akustisch (als Klangvorstellung). Vieles spricht für die zweite Alternative. Das setzt jedoch ein kompliziertes Wechselspiel zwischen abstrakter Zielvorstellung, Information über den augenblicklichen Stand der Artikulatoren und Wissen über die jeweilig notwendigen Maßnahmen zu ihrer Veränderung voraus, über das noch viel zu wenig bekannt ist.

1.3.4 Allgemeine Architektur

In jeder kognitionswissenschaftlichen Domäne stellt sich die Frage nach der allgemeinen Architektur, in der sie zu modellieren ist. Es gilt einerseits die Systeme zu identifizieren, die an der generellen Aufgabe beteiligt sind, andererseits die Prozesse, die zwischen den Systemen vermitteln. In den letzten 15 Jahren hat sich diese Frage auf die Auseinandersetzung zwischen zwei pointiert verschiedenen Ansätzen fokussiert: dem seriell-modularen Ansatz auf der einen Seite (vgl. Fodor, 1983) und dem interaktiv-konnektionistischen Ansatz auf der anderen (vgl. Rumelhart & McClelland, 1986). Einen entscheidenden Stellenwert nimmt in dieser Auseinandersetzung die Frage ein, ob es feedback-Prozesse zwischen den Systemen gibt. Während seriell-modulare Modelle diese Frage verneinen, sind feedback-Prozesse ein konstituierendes Element in konnektionistischen Modellen.

Der wissenschaftliche Disput um die adäquate Charakterisierung der allgemeinen Architektur kognitiver Systeme und Prozesse wurde in der Psycholinguistik auf dem Gebiet der Sprachproduktion in für die gesamte Kognitionswissenschaft exemplarischer Weise geführt. Turnierplatz war das Problem des lexikalen Zugriffs (vgl. 1.2.1). Während eine Gruppe um Willem Levelt (vgl. Levelt et al., 1991) am MPI für Psycholinguistik in Nijmegen die Befunde eigener Experimente als eine Bestätigung für eine seriell-modulare Verarbeitung semantischer und phonologischer Wortmerkmale interpretierte, wurde von Gary Dell und seinen Mitarbeitern versucht, diese empirischen Ergebnisse in einem konnektionistischen Modell zu erklären (vgl. Dell & O’Seaghdha, 1991). Die Auseinandersetzung wurde in mehreren Stufen geführt. Augenblicklich spricht mehr Evidenz für den modular-seriellen Ansatz, doch kann die Debatte keinesfalls als entschieden gelten und dauert an. Es gibt in Deutschland ausgewiesene Vertreter beider Positionen, so daß zu hoffen wäre, das auch von dem geplanten SPP wichtige Impulse dafür ausgehen.

Die Frage der allgemeinen Architektur hat Implikationen für alle Disziplinen, die sich mit kognitiven Leistungen beschäftigen. In der theoretischen Linguistik gibt es beispielsweise recht unterschiedliche Vorstellungen über eine direkte Einbindung der semantischen Repräsentationen in die Syntax. Diese Frage kann man formal-computationell zu lösen versuchen. Letztlich aber ist es eine empirische Frage, wenn die Theorie ernsthaft beansprucht, eine Theorie des menschlichen Geistes zu sein. Dann aber kann sie nur interdisziplinär bearbeitet werden.

In der KI und Computerlinguistik kann man einerseits Probleme der maschinellen Sprachgenerierung aus eher ingenieurwissenschaftlicher Perspektive betrachten, ohne den Anspruch zu haben, die reale Verarbeitung des Menschen zu modellieren. Selbst dann jedoch gilt, daß der Mensch das insgesamt leistungsfähigste System ist, dessen genaue Kenntnis auch bei der Entwicklung maschineller Verfahren von großem Wert sein kann. Das für die Bereiche der KI und Computerlinguistik, die andererseits das Ziel verfolgen, ‘kognitiv plausible’ Modelle zu formulieren, die Erarbeitung fundierten Wissens über kognitive Architekturen von essentiellem Interesse ist, ist ohnehin evident.

 

1.4 Vorgehensweise, methodische und thematische Abgrenzung

Das Spektrum der Methoden, die im Schwerpunktprogramm eingesetzt werden sollen, spiegelt die Unterschiedlichkeit der beteiligten Disziplinen wider:

a. experimentelle Untersuchungen, wie sie in der kognitiven Psychologie/ Neuropsychologie üblich sind,

b. systematische Analysen von sprachlichen Daten in der methodischen Tradition der struktur-orientierten, theoretischen Linguistik,

c. Computermodellierungen, Simulationen und Realisierung von einsetzbaren Systemen mit dem Methodeninventar der Informatik,

d. die Erarbeitung von formalen Modellen für Prozesse und Strukturen der Sprachproduktion, wie sie in der theoretischen Linguistik (formale Syntax und Semantik) und der Computerlinguistik üblich ist.

Hieraus ergibt sich ein Methodenspektrum, das den Bereich von empirisch-experimenteller Forschung über mathematische Modelle bis zu Computer-Realisierungen umfaßt.

Die im Arbeitsprogramm (s. 1.3) skizzierten Forschungsaufgaben sind bisher überwiegend aus Sicht einer Disziplin bzw. unter Verwendung einer der oben genannten Methoden untersucht worden. Im SPP soll eine interdisziplinäre Vorgehensweise gewählt werden, bei der das Zusammenwirken dieser Methoden eine wesentliche Rolle spielt. Hierdurch kann eine veränderte Perspektive eingenommen werden, die einerseits zu neuen Erkenntnissen, aber insbesondere auch zu neuen Fragestellungen führen wird.

Die zentralen Ziele der Sprachproduktionsforschung, die u.E. in einem interdisziplinären Forschungskontext angegangen werden sollten, sind:

(1) die detaillierte Beschreibung des gesamten Prozesses (a, b, c, d),

(2) die Aufdeckung der beteiligten strukturellen Komponenten (a, b, d),

(3) die sprachvergleichende Untersuchung von Produktionsprozessen (a, b, c),

(4) die Einbindung in die allgemeine kognitive Architektur, in den Ablauf übergeordneter kognitiver Prozesse (wie Gedächtnis, Wahrnehmung, Aufmerksamkeit etc.) (a, c, d) und

(5) die Frage, inwieweit Prozesse modular oder interaktiv verlaufen (a, b, c, d).

Obwohl Sprachproduktion das Forschungsthema des SPP bildet, soll auch auf Erkenntnissen aus der Sprachverstehensforschung, Untersuchungen zum Spracherwerb und insbesondere auf Resultaten der struktur-orientierten Forschung der theoretischen Linguistik aufgebaut werden, ohne daß jedoch eine primäre Weiterentwicklung dieser Bereiche angestrebt würde.

Die Zusammenarbeit im Schwerpunktprogramm wird durch die im Abschnitt 1.3 dargestellte Einteilung in thematische Forschungsbereiche strukturiert. In allen Themenbereichen ist interdisziplinäre Forschung notwendig. Diese kann auf zwei Arten realisiert werden, entweder durch Interdisziplinarität innerhalb eines Projektes oder durch die Bildung von ‘Projekttandems’ mit überlappenden Fragestellungen, bei denen die Methoden verschiedener Disziplinen synergetisch zusammenwirken. Für die erste Phase des SPPs ist vorgesehen, durch die Spezifizierung von exemplarischen Leitbeispielen - hierbei könnte es sich um spezielle Detailausarbeitungen der Beispiel 1.1.1. - 1.1.3 handeln - einen Satz gemeinsam zu bearbeitender Fragestellungen zu entwickeln. Durch die parallele Bearbeitung derartiger Fragen soll die interdisziplinäre Diskussion zwischen Projekten unterschiedlicher disziplinärer und methodischer Ausrichtung gefördert werden.

Für den interdisziplinären Diskurs im SPP, insbesondere die Bildung und inhaltliche Abstimmung von Projekttandems - oder größeren Gruppierungen - sowie die Erarbeitung der Leitbeispiele und der hieraus abgeleiteten exemplarischen Fragestellungen - ist die Durchführung von Schwerpunktskolloquien von essentieller Bedeutung. Diese sollen als interdisziplinäre Symposien durchgeführt werden, bei denen jeweils auf spezifische Teilaspekte der Sprachproduktion fokussiert wird. Die Veröffentlichung einer aus diesen Symposien hervorgehenden Bestandsaufnahme wäre ein wertvoller Beitrag, der eine Konzentration und Koordination der vielfältigen, bisher weitgehend unabhängig voneinander durchgeführten Forschungsaktivitäten bewirken kann.

 

2. Verhältnis zu anderen laufenden Programmen

Die Beschäftigung mit der Sprachproduktion wurde - wie in Abschnitt 1 dargestellt - in den genannten Disziplinen Linguistik, Psychologie und Informatik bisher stark vernachlässigt. Es gibt weit mehr Arbeiten zu den Prozessen des Sprachverstehens und des Spracherwerbs sowie zu sprachlichen Strukturen ohne Berücksichtigung sprachlicher Prozesse. Diese Schwerpunktsetzung ist auch in den im weiteren angesprochenen Forschungsprogrammen zu finden.

In den Sonderforschungsbereichen 282 ‘Theorie des Lexikons’ (Düsseldorf, Wuppertal, Köln) und 340 ‘Sprachtheoretische Grundlagen für die Computerlinguistik’ (Stuttgart, Tübingen) stehen sprachliche Strukturen im Vordergrund der Untersuchungen, wobei durch die computerlinguistische Ausrichtung des SFB 340 auch prozessuale Aspekte berücksichtigt werden, dies jedoch ausschliesslich unter dem Gesichtspunkt der formalen Eigenschaften von Sprachverarbeitungsprozessen und deren maschineller Realisierung.

Sprachforschung unter einer integrierenden, Strukturen und Prozesse berücksichtigenden Perspektive wurde bzw. wird durch einzelne Projekte auch in den Sonderforschungsbereichen 245 ‘Sprache und Situation’ (Heidelberg / Mannheim), 314 ‘Künstliche Intelligenz’ (Karlsruhe, Kaiserslautern, Saarbrücken), 360 ‘Situierte Künstliche Kommunikatoren’ (Bielefeld) sowie 378 ‘Ressourcenadaptive kognitive Prozesse’ (Universität des Saarlandes) bearbeitet.

Beim geplanten SPP ‘Sprachproduktion’ soll die interdisziplinäre Orientierung aus dem Blickwinkel von mindestens drei Disziplinen dazu führen, daß ein vertieftes Verständnis der Phänomene der Sprachproduktion erreicht wird: die Integration von sprachtheoretischen und formalen Analysen der theoretischen Linguistik, experimentellen Arbeiten der Psycholinguistik, Neurolinguistik und Sprachpsychologie sowie Computermodellierungen und -realisierungen der Computerlinguistik und sprachorientierten KI-Forschung stellt den methodischen Rahmen des SPP ‘Sprachproduktion’ dar. Nur die beiden explizit kognitionswissenschaftlich orientierten SFBe 360 (Bielefeld) und 378 (Saarbrücken) besitzen eine entsprechende interdisziplinäre Ausrichtung; in beiden Fällen stehen jedoch die Prozesse der Sprachrezeption bzw. andere, nicht-sprachliche kognitive Fähigkeiten im Vordergrund der Arbeiten.

Eine interdisziplinäre Herangehensweise der Art, wie sie für den Schwerpunkt vorgesehen ist, wurde im - inzwischen abgeschlossenen - SPP ‘Kognitive Linguistik’ praktiziert. Ebenso findet einschlägige interdisziplinäre Forschung in den Graduiertenkollegs ‘Kognitionswissenschaft’ (Hamburg), ‘Kognitionswissenschaft’ (Saarbrücken) und ‘Menschliche und Maschinelle Intelligenz’ (Freiburg) statt, wobei diese nicht nur innerhalb der Einzelkollegs, sondern insbesondere auch im Verbund dieser Kollegs, d.h. über größere räumliche Distanz, erfolgt. Darüber hinaus sind auch im computerlinguistischen Graduiertenkolleg der Universität Stuttgart für den geplanten Schwerpunkt interessante Arbeiten unter einer multidisziplinären Perspektive entstanden.

Durch das Bundesforschungsministerium wird gegenwärtig das Verbundvorhaben VERBMOBIL gefördert, in dem unter der Zielsetzung, ein System für die maschinelle Übersetzung zu entwickeln, anwendungsorientierte Forschung zum Sprachverstehen und zur Sprachproduktion durchgeführt wird.

Zusammenfassend läßt sich feststellen, daß in Deutschland ein gutes Forschungsumfeld für das geplante SPP ‘Sprachproduktion’ existiert, in dem jedoch die Forschung im Bereich des Sprachverstehens bzw. strukturorientierter Untersuchungen ohne Berücksichtigung sprachlicher Prozesse im Vordergrund steht. Außerdem ist ein Desiderat im Bereich der kognitionswissenschaftlichen Sprachforschung unter konsequenter Einbeziehung der drei Richtungen Linguistik, Psychologie und Informatik zu konstatieren.

3. Internationale Zusammenarbeit

In der internationalen Forschung zur Sprachproduktion haben sich in den letzten Jahren - ebenso wie in Deutschland - Zentren mit spezifischen Forschungsschwerpunkten herausgebildet:

Bergen (inkrementelle Grammatiken, konnektionistische Produktionsmodelle)

Edinburgh / Glasgow (Informationsstrukturen, Syntax und Semantik, Szenarientheorie)

ISI, Marina del Rey (Systemische Textgenerierung, Textmodelle)

Leiden (syntaktische Modelle für die Sprachgenerierung)

Montreal (multilinguale Generierung)

New York (Schemabasierte Generierung, Multimodalität)

Nijmegen (Zeitverlauf des lexikalen Zugriffs, phonologische und artikulatorische Prozesse)

Paris (Interaktion von Lexikon und Syntax bei der automatischen Sprachgenerierung)

Philadelphia (Planungsprozesse, Partnermodellierung)

Tucson, Arizona (psycholinguistische Modelle der Sprachproduktion)

Wien (Generierungsarchitekturen, Grammatikmodelle)

Zu den hier aufgeführten Zentren existieren intensive Arbeitskontakte durch die Initiatoren bzw. durch einige der in Abschnitt 5 genannten ‘potentiellen Antragsteller’ des geplanten Schwerpunktprogramms.

Seit Anfang der 90er Jahre werden im deutschsprachigen Raum mit zunehmender Häufigkeit interdisziplinäre Kolloquien und Workshops zur Sprachproduktion durchgeführt, an denen zunehmend auch Wissenschaftler aus dem europäischen Ausland teilnehmen. Die Ansiedlung dieser Veranstaltungen im Workshop-Programm größerer Tagungen, wie der TEAP (Tagung der experimentell arbeitenden Psychologen), der KI-Tagung (der Gesellschaft für Informatik) oder der KONVENS (gemeinsame computerlinguistische Tagung der Sprachwissenschaftlichen und Informatischen Gesellschaften Deutschlands und Österreichs) hat dazu geführt, daß die Fragestellung ‘Sprachproduktion’ über den engeren Kreis der aktiv in diesem Bereich arbeitenden Wissenschaftler weitere Beachtung erhalten hat. Gleichzeitig hierzu sind internationale Tagungsserien entstanden, etwa EWNLG (European Workshop for Natural Language Generation) und INLG (International Workshop on Natural Language Generation), eine Veranstaltung, die abwechselnd in Nordamerika und Europa stattfindet.

An diesen Tagungen waren stets mehrere Wissenschaftler aus dem Kreis des geplanten Schwerpunktprogramms aktiv beteiligt; einige dieser Tagungen wurden aus diesem Kreis heraus (mit-)organisiert. Eines der Ziele des SPP ‘Sprachproduktion’ besteht darin, die internationale Diskussion zur Sprachproduktion zu intensivieren und insbesondere alle beteiligten Disziplinen zu einem intensiven Erfahrungsaustausch zusammenzubringen. Zu diesem Zweck soll über Schwerpunkttreffen hinaus im Abstand von zwei Jahren ein internationales Kolloquium stattfinden, das durch die Fokussierung auf jeweils einen spezifischen Themenkomplex zur Strukturierung der nationalen - aber auch internationalen - Forschungsansätze beitragen soll. Durch diese Kolloquien würden nicht nur die Resultate des SPP der internationalen wissenschaftlichen Öffentlichkeit bekanntgemacht werden, sondern es bestände die Möglichkeit, die bisher existierenden ‘bilateralen Forschungskontakte’ zwischen lokalen Institutionen zu Kontakten zum SPP - als überlokaler Forschungsgruppe - zu erweitern.

 

4. Programmausschuß

Initiatoren (Die Koordinatoren sind durch * gekennzeichnet):

* Prof. Dr. Christopher Habel, FB Informatik und FB Sprachwissenschaften, Universität Hamburg

Prof. Dr. Wolfgang Hoeppner, FB Computerlinguistik, Universität Duisburg

* Prof. Dr. Thomas Pechmann, Institut für Sprach- & Übersetzungswissenschaften (Psycholinguistik), Universität Leipzig

Prof. Dr. Anita Steube, Institut für Sprach- & Übersetzungswissenschaften (Allgemeine Sprachwissenschaft), Universität Leipzig

beratend:

Prof. Merrill F. Garrett, Ph.D., Department of Psychology, University of Arizona, Tucson

Prof. Dr. Ed Hovy, ISI, Marina del Rey (USA)

Prof. Dr. Gerard Kempen, Kognitionswissenschaft, Rijksuniversiteit Leiden

Prof. Dr. Willem J.M. Levelt, Max-Planck-Institut für Psycholinguistik, Nijmegen

Prof. Dr. Gert Rickheit, Fakultät für Linguistik und Literaturwissenschaft, Universität Bielefeld

Prof. Dr. Hans Uszkoreit, Computerlinguistik, Universität des Saarlandes

 

5. Teilnehmer

Potentielle Antragsteller:

Prof. Dr. Ruth Albert, FB Allgemeine und Germanistische Linguistik und Philologie, Philipps-Universität Marburg

Sprachproduktion und Mehrsprachigkeit

Prof. Dr. Josef Bayer, Institut für Sprachwissenschaft, Friedrich-Schiller-Universität Jena,

Sprachproduktion und Aphasie

PD Dr. Thomas Berg, Institut für Anglistik, Universität Oldenburg

Phonologische Verarbeitung in der Sprachproduktion

PD Dr. Gerhard Blanken, Forschungsgruppe Neurolinguistik, Universität Freiburg

Störungen in der Wortproduktion

Prof. Dr. Hans-Georg Bosshardt, Fakultät für Psychologie, Ruhr-Universität Bochum

Der Einfluß von mentalem Aufwand auf die Koordination von Sprechbewegungen und auf die Sprechflüssigkeit

Prof. Dr. Werner Deutsch, Institut für Psychologie, TU Braunschweig

Vergleich gesprochener und gesungener Sprache

Prof. Dr. Monika Doherty, Institut für Anglistik, Humboldt-Universität Berlin

Sprachspezifische, parametrisierte Informationsstrukturen

Prof. Dr. Gisbert Fanselow & Prof. Dr. Rainer Dietrich, FB Linguistik, Universität Potsdam

Komplexität und Grammatiktheorie

Dr. Joachim Grabowski, Lehrstuhl für Psychologie III, Universität Mannheim

Repräsentationale Bedingungen der Raumauffassung und die Semantik dimensionaler Präpositionen

Prof. Dr. Christopher Habel, FB Informatik & FB Sprachwissenschaften, Universität Hamburg

Konzeptualisierungsprozesse

Prof. Dr. Hubert Haider, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart

Studien zur Wortstellung im Deutschen

Prof. Dr. Karin Harbusch, Institut für Computerlinguistik, Universität Koblenz-Landau

Sprachproduktion mit Tree Adjoining Grammars

Prof. Dr. H. Helbig, FB Informatik, Fernuniversität Hagen

Antwortgenerierung aus hierarchischen semantischen Netzen

Prof. Dr. Peter Hellwig & Dr. Ralf Meyer-Klabunde, Computerlinguistik, Universität Heidelberg

Aufbau und sprachliche Realisierung informationsstruktureller Merkmale in der Sprachproduktion

Prof. Dr. Erhard Hinrichs, Dr. Steven Abney & Dr. Dale Gerdemann, Seminar für natürlich-sprachliche Systeme, Universität Tübingen

Stochastische Texterzeugung, Sprachproduktion und Wortstellung

Prof. Dr. Wolfgang Hoeppner, FB Computerlinguistik, Gerhard-Mercator-Universität Duisburg

Interaktionen zwischen Inhalts- und Formbestimmung in der Textgenerierung

Dr. Jörg Jescheniak, Institut für Psychologie, FU Berlin,

Lexikalisierungspozesse in der Sprachproduktion

Prof. Dr. Reinhold Kliegl, Institut für Psychologie, Universität Potsdam

Parameter der syntaktischen Komplexität in der Sprachproduktion

Prof. Dr. Helen Leuninger, Germanistische Linguistik, Universität Frankfurt

Sprachliche Fehlleistungen

Prof. Dr. Aditi Lahiri, Fachgruppe Sprachwissenschaft, Universität Konstanz

Phonologische Aspekte der Sprachproduktion

Prof. Dr. Bernd Mahr, FB Informatik, TU Berlin

Maschinelle Generierung: Diskurspartikel und Präzisierungsmechanismen

Prof. Dr. Dieter Metzing, Universität Bielefeld

Sprachgenerierung und Agentenmodelle

Dr. Antje Meyer & Prof. Dr. Herbert Schriefers, MPI für Psycholinguistik, Nijmegen / Katholieke Universiteit Nijmegen,

Syntaktische Planungsprozesse bei der Sprachproduktion

Prof. Dr. Susan Olson, Institut für Anglistik, Universität Leipzig

Konzeptuelle Umsetzung lexikalischer Argumente in thematische Rollen

Prof. Dr. Thomas Pechmann, Institut für Sprach- und Übersetzungswissenschaft, Universität Leipzig,

Die Aktivierung syntaktischer Information

PD Dr. Bernd Pomino-Marschall, Zentrum für Allgemeine Sprachwissenschaft Berlin

Zeitstruktur der interartikulatorischen Koordination

Prof. Dr. C.-R. Rollinger, Institut für semantische Informationsverarbeitung, Universität Osnabrück

Präsuppositionen in der Sprachgenerierung

Prof. Dr. Dietmar Rösner, Fakultät für Informatik, Otto-von-Guericke-Universität Magdeburg

Generierung technischer Texte

Prof. Dr. W. Schnotz, FB Psychologie, Universität Koblenz-Landau

Kognitive Prozesse bei der integrierten Produktion visueller und sprachlicher Mitteilungen

Dr. Ulrich Schade, Fakultät für Linguistik und Literaturwissenschaft, Universität Bielefeld

Die Produktion von Relativsätzen

Prof. Dr. Anita Steube, Institut für Sprach- und Übersetzungswissenschaft, Universität Leipzig

Die Beziehung zwischen dem semantischen und konzeptuellen System unter dem Aspekt der Sprachproduktion

Prof. Dr. Gerhard Strube, Institut für Informatik und Gesellschaft, Universität Freiburg

Sprachproduktion und Arbeitsgedächtnis

Dr. Christiane von Stutterheim, Institut für Deutsch als Fremdsprache, Universität Heidelberg

Sprachbezogene Konzeptualisierungsprozesse

Prof. Dr. Richard Wiese, FB Allgemeine und Germanistische Linguistik und Philologie, Philipps-Universität Marburg / Institut für Allgemeine Sprachwissenschaft, Universität Düsseldorf

Konzeptualisierung, Formulierung und die Rolle der Morphologie

Prof. Dr. Pienie Zwitserlood & Dr. Jens Boelte, Institut für Psychologie II, Universität Münster

Wissensstruktur und Verarbeitungsprozesse auf der Ebene der phonologischen und morphologischen Kodierung beim Sprechen

Prof. Dr. Gerhild Zybatow, Institut für Slavistik, Universität Leipzig

Einzelsprachliche und übereinzelsprachliche Determinanten der Informationstrukturierung in der Interaktion

 

6. Schätzung des Mittelbedarfs

Wir veranschlagen einen Bedarf

1. für 15 Forschungsprojekte à DM 150.000/Jahr DM 4,5 Mio / 2 Jahre

2. für Kolloquien des Schwerpunkts DM 75.000 / 2 Jahre

Zu 1.: Die Projekte sind im Mittel mit einer ganzen bzw. zwei halben Positionen für wissenschaftliche Mitarbeiterinnen/Mitarbeiter veranschlagt. Darüber hinaus werden für die Projekte studentische Hilfskräfte benötigt.

Sowohl im experimental-psychologischen als auch im computerlinguistischen Bereich ist außerdem mit erhöhten Sachmittelausgaben zu rechnen, etwa für Versuchspersonengelder, Kleingeräte, etc.

Zu 2.: Kolloquien des Schwerpunkts sollen jährlich stattfinden, wobei jedes zweite Jahr durch Einladung ausländischer Teilnehmer ein internationales Diskussionsforum geschaffen werden soll. Bei den internen Kolloquien sind ca. 45 Teilnehmer (2-3 je Projekt + Gutachter) zu veranschlagen; bei durchschnittlichen Kosten von im Mittel 600 DM ergeben sich Kosten von 27.000 DM. Bei den externen, internationalen Kolloquien sollten zusätzlich ca. 15 SPP-externe Wissenschaftler eingeladen werden; 5 aus Deutschland (jeweils 600 DM), 5 aus dem europäischen Ausland (jeweils 1200 DM), 5 aus dem außereuropäischen Ausland (jeweils 2500 DM), hiermit ergibt sich ein zusätzlicher Bedarf von 21.500 DM (alle 2 Jahre).

 

7. Gründe für die Förderung dieses Programms

* Das Forschungsthema ‘Sprachproduktion’ besitzt eine hohe Forschungsrelevanz im Bereich der Grundlagenforschung für alle am geplanten Schwerpunktprogramm beteiligten Ausrichtungen der Linguistik, Psychologie und Informatik.

Es bietet sich hier ein Feld, in dem die Resultate interdisziplinärer, kognitionswissenschaftlicher Forschung mittelfristig auch die Basis für zukunftsweisende und gesellschaftlich relevante Anwendungen bilden werden: dies betrifft den Einsatz in der maschinellen Sprachverarbeitung ebenso wie die Entwicklung neuer Methoden für den Fremdsprachenunterricht und die Therapie von Sprach- und Sprechstörungen.

* Das Forschungsgebiet ‘Sprachproduktion’ ist in den letzten 10 bis 15 Jahren durch neue Strömungen gekennzeichnet, die zu bedeutsamen Fortschritten geführt haben. Diese Entwicklung beruht insbesondere darauf, daß zunehmend das Phänomen der Sprachproduktion aus einer interdisziplinären Perspektive angegangen wird, in der gleichberechtigt Methoden der Linguistik, der experimentellen Psychologie und Neurowissenschaften sowie der Informatik verwendet werden.

Auf der Basis eines wechselseitigen Interesses und Verständnisses des methodischen Rüstzeuges ist es jetzt möglich, die in den Einzeldisziplinen gewonnenen Resultate zu vergleichen und zu integrieren und hierauf aufbauend gemeinsam neue Fragestellungen zu bearbeiten. Die Forschungsresultate der Einzeldisziplinen sind soweit vorangeschritten, daß ein symbiotischer Effekt zu erwarten ist, wenn eine verstärkte Kooperation zwischen den Disziplinen stattfindet. Insbesondere können hierdurch die - im Vergleich zur Sprachverstehensforschung - bestehenden Forschungsdesiderate überwunden werden.

* Darüber hinaus versprechen Forschungen zur Sprachproduktion neue Einsichten / Erkenntnisse generell für die ‘Sprachforschung’: Dies betrifft einerseits die Wechselbeziehungen zwischen Sprachproduktion und Sprachverstehen und hierbei insbesondere die Frage nach ‘gemeinsam genutzten Wissensbeständen’, andererseits die Ergänzung struktur-orientierter linguistischer Forschung durch prozeß-orientierte Untersuchungen. Nach einer langen Forschungsphase, in der die Perspektive des Sprachverstehens im Vordergrund stand, ist von einem Perspektivenwechsel auf die Sprachproduktion ein systematischer Erkenntnisfortschritt für den gesamten Phänomenbereich ‘sprachliche Prozesse und Strukturen’ zu erwarten.

* Die deutsche Forschung auf dem Gebiet der Sprachproduktion nimmt - in Teilbereichen - international durchaus eine bedeutende Stellung ein; dies betrifft insbesondere den Einfluß syntaktischer und semantischer Faktoren beim Aufbau von Informationsstrukturen, Prozesse des lexikalischen Zugriffs und der syntaktischen Planung sowie die Interaktion von sprachlichen und außer-sprachlichen Wissensbeständen in der Konzeptualisierung.

Zu den Zielen des SPP Sprachproduktion gehört es, einerseits durch Konzentration von Forschungskapazitäten in den genannten Bereichen weitere wissenschaftliche Fortschritte zu erzielen und andererseits auch diejenigen Problemstellungen, die bisher nicht hinreichend intensiv untersucht wurden, in Angriff zu nehmen.

* Als nicht zu unterschätzende Voraussetzung für den geplanten SPP Sprachproduktion kann angeführt werden, daß jetzt in Deutschland eine ‘kritische Masse’ für Spitzenforschung in diesem Bereich vorhanden ist. Ersehen läßt sich dies insbesondere an der großen Anzahl einschlägiger Publikationen in nationalen und internationalen Publikationsorganen. Die mittlerweile regelmäßig stattfindenden Arbeitstreffen und Tagungen mit hoher Beteiligung können ebenfalls als Indiz für gute Startbedingungen angesehen werden.

Entscheidend für das Gelingen eines Schwerpunktprogramms ist insbesondere die Verfügbarkeit hochqualifizierter, motivierter und insbesondere eingearbeiteter WissenschaftlerInnen. Im Forschungsumfeld der in Abschnitt 2 genannten Sonderforschungsbereiche, des SPP ‘Kognitive Linguistik’, der spezifisch linguistisch- oder generell kognitionswissenschaftlich orientierten Graduiertenkollegs sowie des BMFT-Verbundvorhabens Verbmobil sind in den letzten Jahren zahlreiche Dissertationen zu einschlägigen Fragen entstanden bzw. sind solche im Entstehen (etwa 5 - 8 Dissertationen pro Jahr). Dies betrifft sowohl Themenstellungen aus dem engeren Bereich der Sprachproduktionsforschung als auch dem weiteren der am Zusammenspiel von Prozessen und Strukturen orientierten Ausrichtungen der theoretischen Linguistik, Psycho- und Computerlinguistik. Daher ist sichergestellt, daß die Projekte des SPPs auf hervorragend geeignete WissenschaftlerInnen zurückgreifen können. An dieser Stelle soll auch darauf hingewiesen werden, daß vermutlich nur durch die Einrichtung eines SPP im Bereich der Sprachproduktion gewährleistet werden kann, daß das jetzt - insbesondere bei den NachwuchswissenschaftlerInnen - vorhandene 'know how' zu einer kognitionswissenschaftlichen Sprachforschung konzentriert erhalten bleibt. Nur durch die Aufrechterhaltung der kritischen Masse wird die jetzt erreichte Stellung der deutschen Wissenschaft bei der Sprachproduktion gehalten werden können.

 

8. Literatur

Appelt, D.E. (1985). Planning English sentences. Cambridge: Cambridge University Press.

Berg, Th. (1988). Die Abbildung des Sprachproduktionsprozesses in einem Aktivationsflußmodell. Tübingen: Niemeyer.

Bierwisch, M. (1983). Semantische und konzeptuelle Repräsentationen lexikalischer Einheiten. In R. Ruzicka & W. Motsch (Hrsg.), Untersuchungen zur Semantik. Berlin: Akademie-Verlag.

Bierwisch, M. (1989). The semantics of gradation. In M. Bierwisch & E. Lang (eds.), Dimensional adjectives: Grammatical structure and conceptual interpretation. Berlin: Springer.

Busemann, S. & Novak, H.-J. (1993). Generierung natürlicher Sprache. In G. Goerz (Hg.), Einführung in die Künstliche Intelligenz. Bonn: Addison-Wesley.

Carstairs-McCarthy, A. (1992). Current morphology. London: Routledge.

Chomsky, N. (1991). Some notes on economy of derivation and representation. In R. Freidin (ed.), Principles and parameters in comparative grammar. Cambridge.

Chomsky, N. (1992). A minimalist program for linguistic theory. MIT Occasional Papers in Linguistics 1.

de Smedt, K. (1990). Incremental sentence generation. Doctoral Dissertation, Katholieke Universiteit Nijmegen.

de Smedt, K., & Kempen, G. (1987). Incremental sentence production, self-correction and coordination. In G. Kempen (ed.), Natural language generation. Dordrecht: Nijhoff.

Dell, G. S. (1986). A spreading activation theory of retrieval in sentence production. Psychological Review, 93, 283-321.

Dell, G.S. & O’Seaghdha, P. (1991). Mediated and convergent lexical priming in language production: A comment on Levelt et al. (1991). Psychological Review, 98 (4), 604-614.

Durand, J. (1990). Generative and non-linear phonology. London: Longman.

Fanselow, G. (1991). Ein modulares Konzept der Lexikonerweiterung. Arbeitspapier des SFB 6 ‘Theorie des Lexikons’.

Fawcett, R.P. & Young, D.J. (eds.) (1988). New devlopments in systemic linguistics. London: Pinter.

Fodor, J. (1983). The modularity of mind. Cambridge, MA: MIT Press.

Garrett, M. F. (1988). Processes in language production. In F. J. Newmeyer (ed.), Linguistics: The Cambridge survey. Vol. 3: Psychological and biological aspects. Cambridge: Cambridge University Press.

Gerdemann, D. & Hinrichs, E. (1995). Some open problems in head-driven generation. In J. Cole, G. Green & J. Morgan (eds.), Linguistics and computation, CSLI Publications.

Günther, C.; Habel, Ch.; Schopp, A. & Ziesche, S. (1996). Perspektivierungsprozesse in Synphonics. In Ch. Habel, S. Kanngießer & G. Rickheit (Hrsg.), Perspektiven der kognitiven Linguistik - Modelle und Methoden. Wiesbaden: Westdeutscher Verlag.

Halliday, M.A.K. (1985). An introduction to functional grammar. London: Arnold.

Herrmann, T. & Grabowski, J. (1994). Psychologie der Sprachproduktion. Heidelberg: Spektrum.

Herweg, M. (Hg.) (1992). Hamburger Arbeitspapiere zur Sprachproduktion I. Graduiertenkolleg Kognitionswissenschaft, AP 9, Universität Hamburg.

Hoeppner, W. & Horacek, H. (1995). Principles of natural language generation. Papers from a Dagstuhl Seminar. Schriftenreihe Informatik Universität Duisburg, SI-12.

Hoeppner, W. (1995). Modularity in natural language generation. Proceedings of the 4th International Colloquium on Cognitive Science. San Sebastian.

Hovy, E.H. (1988). Generating natural language under pragmatic constraints. Hillsdale: Erlbaum

Jensen, J.T. (1990). Morphology. Word structure in Generative Grammar. Studies in the theory and history of linguistic science, Series, IV. Amsterdam: John Benjamins.

Kempen, G., & Hoenkamp, E. (1987). An incremental procedural grammar for sentence formulation. Cognitive Science, 11, 201-258.

Kempen, G., & Vosse, Th. (1989). Incremental syntactic tree formation in humam sentence processing. An interactive architecture based on activation decay and simulated annealing. Connection Science, 1, 273-290.

Levelt, W. J. M. (1989). Speaking. From intention to articulation. Cambridge, MA: MIT Press.

Levelt, W. J. M., Schriefers, H., Vorberg, D., Meyer, A., Pechmann, Th. & Havinga, J. (1991). The time course of lexical access in speech production. A study in priming. Psychological Review, 98, 122-142.

Mann, W.C. & Thompson, S.A. (1988). Rhetorical structure theory: Toward a functional theory of text organization. Text, 8, 243-281.

Mann, W.C. (1982). Text generation. American Journal for Computational Linguistics, 8, 62-69.

McDonald, D.D. (1987). Natural language generation. In S.C. Shapiro (ed.), Encyclopedia of Artificial Intelligence. Chichester: Wiley.

McKeown, K.R. & Swartout, W.R. (1988). Language generation and explanation. In M. Zock & G. Sabah (eds.), Advances in natural language generation, Volume 1. London: Pinter.

McKeown, K.R. (1985). Text generation: Using discourse strategies and focus constraints to generate natural language text. Cambridge: Cambridge University Press.

Meyer, A. S. (1991). The time course in phonological encoding in language production. Phonological encoding inside a syllable. Journal of Memory and Language, 30, 69-89.

Montague, R. (1970). Universal grammar. Theoria, XXXVI, 373-398.

Nespor, M. & Vogel, I. (1986). Prosodic phonology. Dordrecht: Reidel.

Pechmann, Th. (1989). Incremental speech production and referential overspecification. Linguistics, 27, 89-110.

Pechmann, Th. (1994). Sprachproduktion. Opladen: Wiesbaden.

Pierrehumbert, J. (1980). The phonetics and phonology of English intonation. Doctoral Dissertation MIT.

Pollard, I. & Sag, I.A. (1993). Head-driven phrase structure grammar. CSLI, Chicago

Rumelhart, D.E. & McClelland, J.L. (1986). Parallel distributed processing: Explorations in the microstructure of cognition. Cambridge, MA: MIT Press.

Schade, U. (1992). Konnektionismus. Zur Modellierung der Sprachproduktion. Opladen: Westdeutscher Verlag.

Schriefers, H., Meyer, A. & Levelt, W. J. M. (1990). Exploring the time course of lexical access in language production. Picture-word interference studies. Journal of Memory and Language, 29, 86-102.

Selkirk, L. (1982). The syntax of words. Cambridge, MA: MIT Press.

Selkirk, L. (1984). Phonology and syntax: The relation between sound and structure. Cambridge, MA: MIT Press.

Shattuck-Hufnagel, S. (1987). The role of word-onset consonants in speech production planning. New evidence from speech error patterns. In E. Keller, & M. Gopnik (eds.), Motor and sensory processes of language. Hillsdale: Erlbaum.

Shieber, S.; van Noord, G.; Moore, R. & Pereira, F. (1990). A semantic-head-driven generation algorithm for unification-based formalisms. Computational Linguistics, 16. 30-42.

Shieber, S.M. (1986). An introduction to unification-based approaches to grammar. CSLI 4, Chicago

Wiese, R. (1988). Silbische und lexikalische Phonologie. Tübingen: Niemeyer.

Wiese, R. (1992). Über die Bedeutung der Phonologie für die Morphologie. Deutsch als Fremdsprache, 29 (3), 131-135.


Wir freuen uns über Anmerkungen und Anregungen!
Letzte Änderung: 26.06.2000 10:54