| News |
| Achtung, ungewöhnliche Anfangszeit und anderer Raum für den OS Termin am 16.01: 14:00 in Raum F-235! Das Oberseminar am 12.12.2002 ist ausgefallen, verschoben auf den 09.01.2003! |
|
18.478 Oberseminar Wissens- und Sprachverarbeitung
| Veranstalter |
| | Carola Eschenbach
Christopher Habel
Frank Schilder
Hedda Schmidtke
Markus Guhe
|
| Zeit/Ort |
| | Do 16 - 18 F-334 |
| Inhalt |
| |
Vorträge über Vorhaben und Ergebnisse von Studien- und
Diplomarbeiten, laufenden Dissertationen und Drittmittelprojekten
sowie von anderen Forschungsarbeiten aus dem Bereich der Wissens-
und Sprachverarbeitung. Insbesondere wird der interdisziplinäre
Charakter des Forschungsschwerpunktes berücksichtigt, d.h. die
Integration von Ansätzen der Informatik, Linguistik, Logik und
Psychologie steht im Vordergrund der Arbeiten.
|
| Termine |
| | 31.10.2002 | |
| | | Hedda Schmidtke
Geometrische Charakterisierung räumlicher Granularität |
| | | Ausgehend von der Annahme, dass räumliche Granularität sich von der
Ausdehnung der Objekte in einer Szene ableitet, werde ich im Vortrag
eine qualitative und regionenbasierte geometrische Charakterisierung von
Ausdehnung vorstellen. In der axiomatischen Geometrie nach Hilbert wird
Ausdehnung über die Länge von Strecken, oder -- anders ausgedrückt --
über die Distanz zwischen Punkten definiert. Die vorgestellte Geometrie
hingegen charakterisiert bestimmte Regionen, denen eine eindeutige
Ausdehnung zugewiesen werden kann. Globale Maximalausdehnung (Länge) und
lokale Mindestausdehnung (Breite) einer Objektregion lassen sich dann
einfach beschreiben. |
| | 7.11.2002 | |
| | | Mareile Knees
Designing an Anaphora Resolution Algorithm for Route Instructions |
| | | In dem Vortrag
Designing an Anaphora Resolution Algorithm for Route Instructions
werde ich die wesentlichen Befunde und Ergebnisse meines
Master-Projektes in Edinburgh vorstellen. Ziel der Arbeit war die
Entwicklung eines Anaphern-Auflösungsalgorithmus' für
Routeninstruktionen. Die Idee der Arbeit entstand im Rahmen eines
größeren Forschungsprojektes, das derzeit von Mitarbeitern der
University of Edinburgh (u.a. Johan Bos) und der University of
Plymouth gemeinsam durchgeführt wird. Anliegen dieses
Forschungsprojektes ist es, einen kleinen Roboter mit Hilfe von
natürlich-sprachlichen Wegbeschreibungen durch eine modellierte Welt
zu lotsen. Hierbei sollen Konzepte entwickelt und erprobt werden, die
sich mit der Frage beschäftigen, wie man Robotern oder anderen
intelligenten Systemen mittels Instruktionen neue Fertigkeiten
vermittelt (z.B. sich in einer unbekannten Umwelt anhand von
Wegbeschreibungen zurecht zu finden). Mein Master-Projekt war auf die
sprachliche Komponente des IBL-Projektes (Instuction-based Learning)
begrenzt. Es beinhaltet Vorschläge, wie einige der in den
Wegbeschreibungen am häufigsten vorkommenden Anaphern (z.B. "it",
"this" und "there") optimal aufzulösen sind. Da sich die pronominalen
Anaphern ("it", "this" und "that") in ihrem Referenzverhalten
wesentlich von den adverbialen Anaphern ("here" und "there")
unterscheiden, habe ich zwei Algorithmen entwickelt. Pronominale
Anaphern werden vom RIAR-Algorithmus aufgelöst, adverbiale Anaphern
vom SR-Algorithmus. Der RIAR-Algorithmus benutzt sowohl
Salience-Berechnung (vgl. Eckert and Strube 2000) als auch semantische
Filtrierung (Byron 2002), um den Antezedenten der Anapher zu
ermitteln. Der SR-Algorithmus versucht, den Antezedenten der Anaphern
aus der Kombination von Verb und räumlicher PP zu schließen.
Die Evaluation der Algorithmen zeigt, dass der RIAR-Algorithmus gute Ergebnisse erzielt - er löst 89% aller Personalpronomen und
60% aller demonstrativen Pronomen korrekt auf, während der SR-Algorithmus durchaus noch verbesserungswürdig ist - er löst nur
43% aller adverbialen Anaphern korrekt auf.
Am Ende des Vortrags werde ich Verbesserungsvorschläge machen, die im Plenum diskutiert werden sollen. |
| | 14.11.2002 | |
| | | Christopher Habel
Describing Motion Events: Incremental Conceptual Structures in Language Production |
| | | We demonstrate how a semantic representation-preverbal message (Levelt 1999)-can be
generated from an underlying conceptual representation in an incremental manner. Starting with the conceptual representation of an observed moving object in a very reduced setting, we analyze which
conceptual entities are built up by the speaker in order to produce an utterance.After presenting some general properties of the representation formalism of Referential Nets we go into the details
of criteria for selecting incrementally conceptual entities for verbalization and how the generation algorithm works in the incrementalconceptualizer INC.
[Project Conceptualizing Events (ConcEv), joint work with Markus Guhe & Ladina Tschander]
|
| | 21.11.2002 | |
| | | Vicente Mendes
Routen-Direktiven und Informationelle Einheiten |
| | | Michel Denis und Mitarbeiter hat/haben viel über die Konzeptualisierung von Routen-Direktiven (RD) geschrieben. Der
Vortrag wird das Papier von 1997 fokussieren, in dem Denis 5 Klassen von informationellen Einheiten vorschlägt, die angeblich die
propositionellen Ausdrücke aufbauen sollen, mit deren Hilfe man RD für ideale Navigation produzieren/verstehen könnte. Ich werde
im Vortrag zeigen, welche Probleme ich in diesem Ansatz sehe und dementsprechend einige Veränderungen zum Modell darstellen,
um mit diesen Problemen besser umzugehen. Diese Präsentation wird eine zweite Runde davon sein, was ich an der Universität Jena
beim 37. Linguistischen Kolloquium im September vorgetragen habe. Die Reaktion des Publikums zum Vortrag bei der ersten Runde
werde ich auch kurz zusammenfassen.
|
| | 28.11.2002 | |
| | | Ladina Tschander
Routenbeschreibungen sprechakttheoretisch betrachtet: Möglichkeiten und Grenzen |
| | |
Sprachliche Informationen zu spezifischen Wegen oder Wanderungen weisen ein charakteristisches Merkmal auf: Die zu begehende Route wird mittels
Routenabschnitten in Form von Beschreibungen einzelner Wege, spezifischer
Wegkonstellationen, der durchzuführenden Handlungen oder der anzutreffenden
Umgebung angegeben. Um Routenbeschreibungen erfolgreich einsetzen zu können,
muss gewährleistet sein, dass der Instruierte während der Navigation den
richtigen Weg findet. Voraussetzung für eine erfolgreiche Navigation ist der
Aufbau einer Repräsentation der Route (insbesondere mit räumlichen
Bedingungen), die über die interne Repräsentation der verbalen Beschreibung
der Route gewonnen wird. Da in Routenbeschreibungen Informationen
unterschiedlicher Art gegeben werden, ist es zweckmässig, ihre Segmente erst
zu klassifizieren, um die relevanten Angaben extrahieren zu können.
Eine linguistische Theorie, die sich zur Aufgabe gestellt hat, Äusserungen
zu klassifizieren, ist die Sprechakttheorie. Zentrale Anliegen sind zu
beschreiben, was getan wird, wenn gesprochen wird, und wie
Aussagebedeutungen mit Äusserungsbedeutungen zusammenhängen. Die möglichen
sprachlichen Handlungsweisen werden angegeben, die zu Klassen von
Äusserungen führen. Es wird beschrieben, welche Bedingungen erfüllt sein
müssen, sofern eine sprachliche Handlung erfolgreich durchgeführt werden
soll. Gerade diese Aspekte lassen die Sprechakttheorie für die Untersuchung von Routenbeschreibungen interessant werden.
Obwohl die Sprechakttheorie nutzbringend für die Betrachtung von
Routenbeschreibungen zu sein scheint, bestehen gewisse Hürden, die eine
Anwendung der Theorie erschweren. So wurde die Sprechakttheorie nicht für
die Interpretation von Diskursen entwickelt sondern für
Äusserungsinterpretationen situiert in einer mündlichen Gesprächssituation.
Zudem sind die analysierten Äusserungen meist Einzeläusserungen. Im
Vortrag wird deshalb geprüft, ob die Sprechakttheorie sinnvoll auf
Routenbeschreibungen anwendbar ist.
Die Analyse zeigt, dass mittels der Sprechakttheorie die Unterschiede
zwischen mündlichen und schriftlichen Routenbeschreibungen angegeben werden
können. Es zeigt sich, dass die Inhalte vergleichbar sind, die
Äusserungsbedeutungen sich jedoch aufgrund der unterschiedlichen
kommunikativen Situationen unterscheiden. Mittels der sprechakttheoretischen
Analyse lassen sich die Äusserungen in Routenbeschreibungen in zwei Gruppen
unterteilen.
|
| | 5.12.2002 | |
| | | Jan Helwich
Berechnung von räumlichen Relationen in 2-dimensionalen Domänen |
| | |
Der
geometrische Agent soll mit Hilfe einer im Voraus gegebenen
Wegbeschreibung in einer 2-dimensionalen Domäne navigieren können.
Während der Navigationsphase stehen ihm von der Wissensrepräsentation
keine metrischen Informationen zur Verfügung. Die von ihm genutzten
Informationen über Objekte und über Relationen zwischen den Objekten
sind rein qualitativer Natur. Um mittels dieser qualitativen
Repräsentationen navigieren zu können, muss die Perzeption in der Lage
sein, zu den repräsentierten Konzepten äquivalente, räumliche
Relationen in der Umgebung zu berechnen.
Im Vortrag werde ich die Ergebnisse meiner Studienarbeit präsentieren.
Ziel war es, eine formale Charakterisierung sowie Vorschriften für die
Berechnung von räumlichen Anordnungsrelationen zu finden, die in der
Sprache durch Präpositionen wie "vor", "rechts" und "zwischen"
dargestellt sind. Eine axiomatische Charakterisierung bietet sich wegen
der exakten Charakterisierbarkeit und dem hohen Allgemeinheitsgrad an.
Ich werde zeigen, wie die Relationen für ausgedehnte 2-dimensionale
Objekte charakterisiert werden können. Auf metrische Konzepte werde ich
dabei verzichten.
Des weiteren werde ich zeigen, wie die Charakterisierungen für die
Berechnung der räumlichen Relationen in der vektoriell dargestellten,
2-dimensionalen "Welt" des geometrischen Agenten eingesetzt werden
können.
|
| | 09.01.2003 | |
| | | Carola Eschenbach
Zur Verknüpfung von Wissen über Objektstruktur und Konzepten |
| | | !!!Der Termin am 12.12.2002 ist wegen der Krankheit ausgefallen, verschoben auf den 09.01.2003!!!
In der Diskussion von Wissensrepräsentationsformalismen erfolgt
häufig eine Trennung von verschiedenen Arten von Wissen (räumliches
Wissen, zeitliches Wissen, Wissen über Konzepte, etc.). Für die
einzelnen Wissensarten werden spezifische Ansätze für die
Repräsentation und die Verarbeitung diskutiert (Constraint-Verfahren
vs. terminologische Logiken).
In diesem Vortrag werde ich einen Ansatz vorstellen, wie
Wissen über Objektstruktur (insbesondere über Objekte und ihre Teile)
und Wissen über Konzepte und Relationen zwischen Konzepten kombiniert
werden kann. Zu betrachten sind also (strukturelle) Relationen
zwischen Objekten (einer Domäne), Relationen zwischen Konzepten und
Relationen zwischen Objekten und Konzepten. Dabei werde ich
verschiedene Arten, in denen Konzepte Objekten zugeordnet werden
können, unterscheiden. Da insgesamt binäre Relationen und ihre
Bedeutungsrelationen im Vordergrund stehen, werde ich neben
axiomatischen Spezifikationen auch sich daraus ableitende
Kompositionstabellen für die Relationen angeben.
Die verwendeten Konzept-Relationen weichen (im Wesentlichen
in der Behandlung der Negation) von den in terminologischen Logiken
behandelten etwas ab. Zudem ist die Ausdrucksmächtigkeit des
vorgestellten Ansatzes geringer als die der terminologischen Logiken.
Der Ansatz zeigt aber beispielhaft auf, wie Wissen über Konzepte, das
z.B. in einer T-Box gegeben ist, genutzt werden kann, um Inferenzen
über die Objektstruktur zu ziehen. |
| | 19.12.2002 | |
| | | Frank Schilder
Annotation von zeitlichen Ausdrücken in Nachrichtentexten |
| | | In Schilder and Habel (2001) wurde ein semantisches tagging system für
zeitliche Ausdrücke (z.B. 'heute', 'am Vormittag') vorgestellt. Dieses
System ermöglicht die Extraktion zeitlicher Ausdrücke aus
Nachrichtentexten sowie die Berechnung der Bedeutung dieser Ausdrücke
(z.B. 'heute' wird der ISO Ausdruck 2002-12-13 zugewiesen, wenn das
heutige Datum der 13.Dezember 2002 ist).
Für viele zeitliche Ausdrücke läßt sich recht einfach die entsprechende
Bedeutung errechnen. Für vage Ausdrücke oder Ausdrücke, deren Bedeutung
erst inferriert werden muss, ist diese Ableitung jedoch meist nicht so
offentsichtlich (z.B. 'seit Tagen' oder 'Sylvester').
In diesem Vortrag werde ich den Output unseres Systems mit einem
kürzlich eingeführten Standard (TimeML) zur Annotation von zeitlichen
Ausdrücken und Ereignissen vergleichen. Ich werde anhand von drei
Klassen von Ausdrücken Vorschläge zur automatischen Berechnung deren
Bedeutung machen wie auch auf weitere Probleme hinweisen.
Abschließend werde ich die Relevanz von semantisch annotierten Korpora
in bezug auf das 'temporal question answering' diskutieren. Beim
temporal question answering handelt es sich um die automatische
Extraktion von Informationen aus Textkorpora/Internet zur Beantwortung
von temporalen Fragen (z.B. Wann fand die Bundestagswahl 2002 statt?).
|
| | 16.01.2003 | |
| | | Jochen Hagenstroem
Part-of-Speech Tagging als Vorverarbeitung zur Dependenzanalyse >natürlicher Sprache mit Constraint Satisfaction |
| | |
Die zentrale Idee der Diplomarbeit ist, einem mit gewichteten Constraints
arbeitenden System zur Dependenzanalyse natürlicher Sprache
(WCDG--Parser) einen Wortklassifizierer (engl. part--of--speech--tagger,
kurz Pos--Tagger) als Vorverarbeitungsstufe zur Verfügung zu stellen, um
die Effizienz und die Qualität der Sprachanalyse zu verbessern.
Es wurde untersucht, ob der WCDG--Parser bei der Analyse der Sprache von
den Klassifikations--Informationen des Pos-Taggers, sinnvoll geleitet
wird. Obwohl die Klassifizierung der Worte einer zu analysierenden
Äußerung mit zu den Aufgaben der Dependenzanalyse gehört, besteht die
Hoffnung, daß die Integration eines Pos--Taggers dem WCDG--System zu
mehr Effizienz und möglicherweise mehr Akkuratheit verhilft, weil
moderne Pos--Tagger das Problem der Sprachanalyse weitaus effizienter
als ein Parser und mit vergleichbar hoher Akkuratheit lösen. Die
Pos--Tagging--Information soll also den komplexen Analyseprozeß einer
natürlichesprachlichen Äußerung insofern leiten, als daß die richtige
Analyse schneller, bzw überhaupt gefunden wird.
|
| | 23.01.2003 | |
| | | Carola Eschenbach
|
| | |
Abstract folgt
|
| | 06.02.2003 | |
| | | Markus Guhe
|
| | |
Der inkrementelle Konzeptualisierer (incremental conceptualiser, inC)
besitzt eine sog. kaskadierte Architektur. Eine Kaskade besteht aus einer
Folge von Prozessen, die parallel arbeiten. Ein Prozess hat dabei je einen
Vorgänger und einen Nachfolger. So wird ein sequentieller Informationsstrom
auf verschiedenen Ebenen durch je einen inkrementellen Prozss (parallel)
verarbeitet. Der Vorteil von Modellen mit solch einer Architektur ist, dass
gleichzeitig Eingaben eingelesen und Ausgaben produziert werden können.
Darüber hinaus sind diese Modelle schnell und effizient, so dass sie mit
beschränkten Ressourcen auskommen. Im Hinblick auf diese "Genügsamkeit"
sind sie eng verwandt mit Modellen, die anytime Algorithmen verwenden. In
diesem Vortrag werde ich ausgehend von dem Modell inC kaskadierte
Architekturen beschreiben und u.a. auf die Ähnlichkeiten mit anytime
Techniken eingehen.
|
|