Arbeitsbereich Wissens- und Sprachverarbeitung

Universität Hamburg - Fachbereich Informatik

Fachbereich Informatik
Universität Hamburg

18.478 Oberseminar Wissens- und Sprachverarbeitung

Veranstalter
 Carola Eschenbach
Christopher Habel
Frank Schilder
Hedda Schmidtke
Markus Guhe
Zeit/Ort
 Do 16 - 18 F-334
Inhalt
  Vorträge über Vorhaben und Ergebnisse von Studien- und Diplomarbeiten, laufenden Dissertationen und Drittmittelprojekten sowie von anderen Forschungsarbeiten aus dem Bereich der Wissens- und Sprachverarbeitung. Insbesondere wird der interdisziplinäre Charakter des Forschungsschwerpunktes berücksichtigt, d.h. die Integration von Ansätzen der Informatik, Linguistik, Logik und Psychologie steht im Vordergrund der Arbeiten.
Termine
 31.10.2002 
  Hedda Schmidtke
Geometrische Charakterisierung räumlicher Granularität
  Ausgehend von der Annahme, dass räumliche Granularität sich von der Ausdehnung der Objekte in einer Szene ableitet, werde ich im Vortrag eine qualitative und regionenbasierte geometrische Charakterisierung von Ausdehnung vorstellen. In der axiomatischen Geometrie nach Hilbert wird Ausdehnung über die Länge von Strecken, oder -- anders ausgedrückt -- über die Distanz zwischen Punkten definiert. Die vorgestellte Geometrie hingegen charakterisiert bestimmte Regionen, denen eine eindeutige Ausdehnung zugewiesen werden kann. Globale Maximalausdehnung (Länge) und lokale Mindestausdehnung (Breite) einer Objektregion lassen sich dann einfach beschreiben.
 7.11.2002 
  Mareile Knees
Designing an Anaphora Resolution Algorithm for Route Instructions
  In dem Vortrag Designing an Anaphora Resolution Algorithm for Route Instructions werde ich die wesentlichen Befunde und Ergebnisse meines Master-Projektes in Edinburgh vorstellen. Ziel der Arbeit war die Entwicklung eines Anaphern-Auflösungsalgorithmus' für Routeninstruktionen. Die Idee der Arbeit entstand im Rahmen eines größeren Forschungsprojektes, das derzeit von Mitarbeitern der University of Edinburgh (u.a. Johan Bos) und der University of Plymouth gemeinsam durchgeführt wird. Anliegen dieses Forschungsprojektes ist es, einen kleinen Roboter mit Hilfe von natürlich-sprachlichen Wegbeschreibungen durch eine modellierte Welt zu lotsen. Hierbei sollen Konzepte entwickelt und erprobt werden, die sich mit der Frage beschäftigen, wie man Robotern oder anderen intelligenten Systemen mittels Instruktionen neue Fertigkeiten vermittelt (z.B. sich in einer unbekannten Umwelt anhand von Wegbeschreibungen zurecht zu finden). Mein Master-Projekt war auf die sprachliche Komponente des IBL-Projektes (Instuction-based Learning) begrenzt. Es beinhaltet Vorschläge, wie einige der in den Wegbeschreibungen am häufigsten vorkommenden Anaphern (z.B. "it", "this" und "there") optimal aufzulösen sind. Da sich die pronominalen Anaphern ("it", "this" und "that") in ihrem Referenzverhalten wesentlich von den adverbialen Anaphern ("here" und "there") unterscheiden, habe ich zwei Algorithmen entwickelt. Pronominale Anaphern werden vom RIAR-Algorithmus aufgelöst, adverbiale Anaphern vom SR-Algorithmus. Der RIAR-Algorithmus benutzt sowohl Salience-Berechnung (vgl. Eckert and Strube 2000) als auch semantische Filtrierung (Byron 2002), um den Antezedenten der Anapher zu ermitteln. Der SR-Algorithmus versucht, den Antezedenten der Anaphern aus der Kombination von Verb und räumlicher PP zu schließen. Die Evaluation der Algorithmen zeigt, dass der RIAR-Algorithmus gute Ergebnisse erzielt - er löst 89% aller Personalpronomen und 60% aller demonstrativen Pronomen korrekt auf, während der SR-Algorithmus durchaus noch verbesserungswürdig ist - er löst nur 43% aller adverbialen Anaphern korrekt auf. Am Ende des Vortrags werde ich Verbesserungsvorschläge machen, die im Plenum diskutiert werden sollen.
 14.11.2002 
  Christopher Habel
Describing Motion Events: Incremental Conceptual Structures in Language Production
  We demonstrate how a semantic representation-preverbal message (Levelt 1999)-can be generated from an underlying conceptual representation in an incremental manner. Starting with the conceptual representation of an observed moving object in a very reduced setting, we analyze which conceptual entities are built up by the speaker in order to produce an utterance.After presenting some general properties of the representation formalism of Referential Nets we go into the details of criteria for selecting incrementally conceptual entities for verbalization and how the generation algorithm works in the incrementalconceptualizer INC. [Project Conceptualizing Events (ConcEv), joint work with Markus Guhe & Ladina Tschander]
 21.11.2002 
  Vicente Mendes
Routen-Direktiven und Informationelle Einheiten
  Michel Denis und Mitarbeiter hat/haben viel über die Konzeptualisierung von Routen-Direktiven (RD) geschrieben. Der Vortrag wird das Papier von 1997 fokussieren, in dem Denis 5 Klassen von informationellen Einheiten vorschlägt, die angeblich die propositionellen Ausdrücke aufbauen sollen, mit deren Hilfe man RD für ideale Navigation produzieren/verstehen könnte. Ich werde im Vortrag zeigen, welche Probleme ich in diesem Ansatz sehe und dementsprechend einige Veränderungen zum Modell darstellen, um mit diesen Problemen besser umzugehen. Diese Präsentation wird eine zweite Runde davon sein, was ich an der Universität Jena beim 37. Linguistischen Kolloquium im September vorgetragen habe. Die Reaktion des Publikums zum Vortrag bei der ersten Runde werde ich auch kurz zusammenfassen.
 28.11.2002 
  Ladina Tschander
Routenbeschreibungen sprechakttheoretisch betrachtet: Möglichkeiten und Grenzen
   Sprachliche Informationen zu spezifischen Wegen oder Wanderungen weisen ein charakteristisches Merkmal auf: Die zu begehende Route wird mittels Routenabschnitten in Form von Beschreibungen einzelner Wege, spezifischer Wegkonstellationen, der durchzuführenden Handlungen oder der anzutreffenden Umgebung angegeben. Um Routenbeschreibungen erfolgreich einsetzen zu können, muss gewährleistet sein, dass der Instruierte während der Navigation den richtigen Weg findet. Voraussetzung für eine erfolgreiche Navigation ist der Aufbau einer Repräsentation der Route (insbesondere mit räumlichen Bedingungen), die über die interne Repräsentation der verbalen Beschreibung der Route gewonnen wird. Da in Routenbeschreibungen Informationen unterschiedlicher Art gegeben werden, ist es zweckmässig, ihre Segmente erst zu klassifizieren, um die relevanten Angaben extrahieren zu können. Eine linguistische Theorie, die sich zur Aufgabe gestellt hat, Äusserungen zu klassifizieren, ist die Sprechakttheorie. Zentrale Anliegen sind zu beschreiben, was getan wird, wenn gesprochen wird, und wie Aussagebedeutungen mit Äusserungsbedeutungen zusammenhängen. Die möglichen sprachlichen Handlungsweisen werden angegeben, die zu Klassen von Äusserungen führen. Es wird beschrieben, welche Bedingungen erfüllt sein müssen, sofern eine sprachliche Handlung erfolgreich durchgeführt werden soll. Gerade diese Aspekte lassen die Sprechakttheorie für die Untersuchung von Routenbeschreibungen interessant werden. Obwohl die Sprechakttheorie nutzbringend für die Betrachtung von Routenbeschreibungen zu sein scheint, bestehen gewisse Hürden, die eine Anwendung der Theorie erschweren. So wurde die Sprechakttheorie nicht für die Interpretation von Diskursen entwickelt sondern für Äusserungsinterpretationen situiert in einer mündlichen Gesprächssituation. Zudem sind die analysierten Äusserungen meist Einzeläusserungen. Im Vortrag wird deshalb geprüft, ob die Sprechakttheorie sinnvoll auf Routenbeschreibungen anwendbar ist. Die Analyse zeigt, dass mittels der Sprechakttheorie die Unterschiede zwischen mündlichen und schriftlichen Routenbeschreibungen angegeben werden können. Es zeigt sich, dass die Inhalte vergleichbar sind, die Äusserungsbedeutungen sich jedoch aufgrund der unterschiedlichen kommunikativen Situationen unterscheiden. Mittels der sprechakttheoretischen Analyse lassen sich die Äusserungen in Routenbeschreibungen in zwei Gruppen unterteilen.
 5.12.2002 
  Jan Helwich
Berechnung von räumlichen Relationen in 2-dimensionalen Domänen
   Der geometrische Agent soll mit Hilfe einer im Voraus gegebenen Wegbeschreibung in einer 2-dimensionalen Domäne navigieren können. Während der Navigationsphase stehen ihm von der Wissensrepräsentation keine metrischen Informationen zur Verfügung. Die von ihm genutzten Informationen über Objekte und über Relationen zwischen den Objekten sind rein qualitativer Natur. Um mittels dieser qualitativen Repräsentationen navigieren zu können, muss die Perzeption in der Lage sein, zu den repräsentierten Konzepten äquivalente, räumliche Relationen in der Umgebung zu berechnen. Im Vortrag werde ich die Ergebnisse meiner Studienarbeit präsentieren. Ziel war es, eine formale Charakterisierung sowie Vorschriften für die Berechnung von räumlichen Anordnungsrelationen zu finden, die in der Sprache durch Präpositionen wie "vor", "rechts" und "zwischen" dargestellt sind. Eine axiomatische Charakterisierung bietet sich wegen der exakten Charakterisierbarkeit und dem hohen Allgemeinheitsgrad an. Ich werde zeigen, wie die Relationen für ausgedehnte 2-dimensionale Objekte charakterisiert werden können. Auf metrische Konzepte werde ich dabei verzichten. Des weiteren werde ich zeigen, wie die Charakterisierungen für die Berechnung der räumlichen Relationen in der vektoriell dargestellten, 2-dimensionalen "Welt" des geometrischen Agenten eingesetzt werden können.
 09.01.2003 
  Carola Eschenbach
Zur Verknüpfung von Wissen über Objektstruktur und Konzepten
   !!!Der Termin am 12.12.2002 ist wegen der Krankheit ausgefallen, verschoben auf den 09.01.2003!!! In der Diskussion von Wissensrepräsentationsformalismen erfolgt häufig eine Trennung von verschiedenen Arten von Wissen (räumliches Wissen, zeitliches Wissen, Wissen über Konzepte, etc.). Für die einzelnen Wissensarten werden spezifische Ansätze für die Repräsentation und die Verarbeitung diskutiert (Constraint-Verfahren vs. terminologische Logiken). In diesem Vortrag werde ich einen Ansatz vorstellen, wie Wissen über Objektstruktur (insbesondere über Objekte und ihre Teile) und Wissen über Konzepte und Relationen zwischen Konzepten kombiniert werden kann. Zu betrachten sind also (strukturelle) Relationen zwischen Objekten (einer Domäne), Relationen zwischen Konzepten und Relationen zwischen Objekten und Konzepten. Dabei werde ich verschiedene Arten, in denen Konzepte Objekten zugeordnet werden können, unterscheiden. Da insgesamt binäre Relationen und ihre Bedeutungsrelationen im Vordergrund stehen, werde ich neben axiomatischen Spezifikationen auch sich daraus ableitende Kompositionstabellen für die Relationen angeben. Die verwendeten Konzept-Relationen weichen (im Wesentlichen in der Behandlung der Negation) von den in terminologischen Logiken behandelten etwas ab. Zudem ist die Ausdrucksmächtigkeit des vorgestellten Ansatzes geringer als die der terminologischen Logiken. Der Ansatz zeigt aber beispielhaft auf, wie Wissen über Konzepte, das z.B. in einer T-Box gegeben ist, genutzt werden kann, um Inferenzen über die Objektstruktur zu ziehen.
 19.12.2002 
  Frank Schilder
Annotation von zeitlichen Ausdrücken in Nachrichtentexten
  In Schilder and Habel (2001) wurde ein semantisches tagging system für zeitliche Ausdrücke (z.B. 'heute', 'am Vormittag') vorgestellt. Dieses System ermöglicht die Extraktion zeitlicher Ausdrücke aus Nachrichtentexten sowie die Berechnung der Bedeutung dieser Ausdrücke (z.B. 'heute' wird der ISO Ausdruck 2002-12-13 zugewiesen, wenn das heutige Datum der 13.Dezember 2002 ist). Für viele zeitliche Ausdrücke läßt sich recht einfach die entsprechende Bedeutung errechnen. Für vage Ausdrücke oder Ausdrücke, deren Bedeutung erst inferriert werden muss, ist diese Ableitung jedoch meist nicht so offentsichtlich (z.B. 'seit Tagen' oder 'Sylvester'). In diesem Vortrag werde ich den Output unseres Systems mit einem kürzlich eingeführten Standard (TimeML) zur Annotation von zeitlichen Ausdrücken und Ereignissen vergleichen. Ich werde anhand von drei Klassen von Ausdrücken Vorschläge zur automatischen Berechnung deren Bedeutung machen wie auch auf weitere Probleme hinweisen. Abschließend werde ich die Relevanz von semantisch annotierten Korpora in bezug auf das 'temporal question answering' diskutieren. Beim temporal question answering handelt es sich um die automatische Extraktion von Informationen aus Textkorpora/Internet zur Beantwortung von temporalen Fragen (z.B. Wann fand die Bundestagswahl 2002 statt?).
 16.01.2003 
  Jochen Hagenstroem
Part-of-Speech Tagging als Vorverarbeitung zur Dependenzanalyse >natürlicher Sprache mit Constraint Satisfaction
   Die zentrale Idee der Diplomarbeit ist, einem mit gewichteten Constraints arbeitenden System zur Dependenzanalyse natürlicher Sprache (WCDG--Parser) einen Wortklassifizierer (engl. part--of--speech--tagger, kurz Pos--Tagger) als Vorverarbeitungsstufe zur Verfügung zu stellen, um die Effizienz und die Qualität der Sprachanalyse zu verbessern. Es wurde untersucht, ob der WCDG--Parser bei der Analyse der Sprache von den Klassifikations--Informationen des Pos-Taggers, sinnvoll geleitet wird. Obwohl die Klassifizierung der Worte einer zu analysierenden Äußerung mit zu den Aufgaben der Dependenzanalyse gehört, besteht die Hoffnung, daß die Integration eines Pos--Taggers dem WCDG--System zu mehr Effizienz und möglicherweise mehr Akkuratheit verhilft, weil moderne Pos--Tagger das Problem der Sprachanalyse weitaus effizienter als ein Parser und mit vergleichbar hoher Akkuratheit lösen. Die Pos--Tagging--Information soll also den komplexen Analyseprozeß einer natürlichesprachlichen Äußerung insofern leiten, als daß die richtige Analyse schneller, bzw überhaupt gefunden wird.
 23.01.2003 
  Carola Eschenbach
   Abstract folgt
 06.02.2003 
  Markus Guhe
   Der inkrementelle Konzeptualisierer (incremental conceptualiser, inC) besitzt eine sog. kaskadierte Architektur. Eine Kaskade besteht aus einer Folge von Prozessen, die parallel arbeiten. Ein Prozess hat dabei je einen Vorgänger und einen Nachfolger. So wird ein sequentieller Informationsstrom auf verschiedenen Ebenen durch je einen inkrementellen Prozss (parallel) verarbeitet. Der Vorteil von Modellen mit solch einer Architektur ist, dass gleichzeitig Eingaben eingelesen und Ausgaben produziert werden können. Darüber hinaus sind diese Modelle schnell und effizient, so dass sie mit beschränkten Ressourcen auskommen. Im Hinblick auf diese "Genügsamkeit" sind sie eng verwandt mit Modellen, die anytime Algorithmen verwenden. In diesem Vortrag werde ich ausgehend von dem Modell inC kaskadierte Architekturen beschreiben und u.a. auf die Ähnlichkeiten mit anytime Techniken eingehen.

Wir freuen uns über Kommentare und Hinweise zu diesen Seiten.
letzte Änderung am Mon Feb 3 15:19:00 CET 2003