MIN-Fakultät
Fachbereich Informatik
Arbeitsbereich Wissens- und Sprachverarbeitung

64-479 Oberseminar: Wissens- und Sprachverarbeitung
Wintersemester 2010/11

Veranstalter
Christopher Habel, Wolfgang Menzel, Carola Eschenbach, Matthias Kerzel, Felix Lindner, Isabelle Streicher
Zeit/Ort
Di 16-18 F-534, Beginn: 2.11.10, entsprechend Ankündigungen
Inhalt
Vorträge über Vorhaben und Ergebnisse von Bachelor-, Master- und Diplomarbeiten, laufenden Dissertationen und Drittmittelprojekten sowie von anderen Forschungsarbeiten aus dem Bereich der Wissens- und Sprachverarbeitung. Insbesondere wird der interdisziplinäre Charakter des Forschungsschwerpunktes berücksichtigt, d.h. die Integration von Ansätzen der Informatik, Linguistik, Logik und Psychologie steht im Vordergrund der Arbeiten.
Termine
28.09.2010, 16:15, F-534 Sondertermin
Christian Ritter
Einsatz von TopicMaps für die Navigation und Suche in regelbasierten Systemen am Beispiel TAXOR
Im Rahmen der Bachelorarbeit wurde versucht, eine Erklärungskomponente des wissensbasierten Systems TAXOR mit Hilfe von TopicMaps zu entwerfen und zu realisieren. Dabei war es Hauptziel, eine stets aktuelle Wissensstruktur des in TAXOR zusammengefassten Wissens erstellen und darstellen zu können. Es wird zunächst das Projekt TAXOR und die Notwendigkeit einer Erklärungskomponente erläutert. Hierbei wird auf Systemarchitektur, Wissensbasis und Regelmaschine eingegangen. Darauf aufbauend wird der Bezug und die vom Projekt ausgehende Erwartungshaltung zu einer Lösung mit TopicMaps vorgestellt. Des weiteren werden Grundlagen zu TopicMaps und Wissensstrukturen dargestellt. Im Anschluss daran werden die Ergebnisse der Arbeit vorgestellt und die Lösungsansätze mit verschiedenen Implementierungsmöglichkeiten diskutiert sowie eine abschließende Bewertung und ein Ausblick für aufbauende Arbeiten gegeben.
09.11.2010 Lisa Beinborn
Post-Editing: A crosslinguistic analysis of the temporal, technical and cognitive effort
Human inspection and correction of machine translations is still indispensable to ensure accurate and stylistically acceptable output. This process of retrospective modification of machine translation output is called Post-Editing. In this study, the post-editing process is analyzed under temporal, technical and cognitive aspects. Crosslinguistic data from a prior productivity test constitutes the basis for the analysis. English source segments had been machine-translated by a statistical system into Italian, Spanish, French and German, and then post-edited by professional translators. Segments with higher temporal, technical and cognitive effort are identified in order to detect crosslinguistic negative translatability indicators. The results show that the translatability of the source segment is not the only factor that has influence on the post-editing effort. A comparison of post-editing and translation effort highlights the difference between the two processes. Finally, possible improvements for the post-editing working conditions are proposed.
16.11.2010 Alexander Eberling
Geometrische und thematische Ergänzungen von graphischen Karten - Repräsentationen für die haptische Exploration>
Visuelle Karten sind für blinde und sehbehin-derte Menschen unbrauchbar, jedoch können sie haptische Karten verwenden. Die Arbeit setzt einen Teil des VAVETaM-Projekts (ver-bally assisting virtual-environment tactile maps) um und soll die Grundlage für ein Assistenzsys-tem erstellen. Z.B. können zusätzlich verbale Hilfestellungen generiert werden, um den Be-nutzer dabei zu unterstützen, sich in der Umge-bung der Karte zurechtzufinden. Die Grundlage des Systems ist, eine Karte der Umgebung in ein internes Modell zu überführen und das in-terne Modell mit proportionalen Informationen über Karten-Objekte zu ergänzen. Im internen Modell kann die Karte durch Verarbeitungspro-zesse analysiert und modifiziert werden. Diese Arbeit wird sich mit der Erstellung des internen Modells, der Verarbeitungsprozesse und den Ergänzungen befassen.
23.11.2010 Paulo Mendes
Assoziationsanalyse für das Wissensmanagement
Ausgangspunkt ist die zunehmende Bedeutung der Komponente Wissen in der Unternehmenswelt, die nach Meinung vieler Experten in der heutigen Zeit als wichtigstes Unternehmenskapital gesehen wird. Eine geeignete Methode, mit der Organisationen den Wissensdrang befriedigen, ist das Sammeln und Analysieren von Daten, um sie anschließend in Wissen umzuwandeln. Die Herausforderung liegt in der Prüfung der großen Datenmengen auf Muster bzw. Zusammenhänge durch geschulte Analysten, was Unternehmen auf computergestützte Systeme, die auf Data-Mining-Methoden basieren, zurückgreifen lassen. Dieser Vortrag zeigt das Zusammenspiel zwischen den beiden Forschungsgebieten Wissensmanagement und Data Mining auf. Weiterhin wird die Assoziationsanalyse, ein Data-Mining-Verfahren, näher betrachtet. Es wird der für die Warenkorbanalyse verwendete Apriori-Algorithmus beschrieben und auf die Bewertung der Assoziationsregeln eingegangen. Der Einsatz der Assoziationsanalyse wird anhand eines Fallbeispiels bei einem Personaldienstleister vorgestellt, der mit seiner umfangreichen Bewerberdatenbank über ein großes Potenzial aus Data-Mining-Sicht verfügt. Es wird auf die Vorbereitung der Daten und die in der Arbeit für die Assoziationsanalyse verwendete Data-Mining-Software WEKA 3 eingegangen. Abschließend werden die Ergebnisse der Assoziationsanalyse (WEKA-Report) vorgestellt.
07.12.2010 Isabelle Streicher
Ereignisfaktualität in Texten und deren automatische Annotation
Natürliche Sprache bietet die Möglichkeit sowohl über faktische als auch über kontrafaktische Ereignisse zu kommunizieren - einerseits Ereignisse, die zu einer gegebenen Zeit an einem gegebenen Ort stattgefunden haben, andererseits solche, die keinen Referenten in der Welt besitzen.
Über diese Polaritätsmarkierung hinaus, erlaubt uns Sprache eine epistemische Haltung zu den denotierten Ereignissen zu vermitteln. Ist sich eine Quelle der (Kontra-)Faktizität eines Ereignisses sicher oder erlaubt der Wissensstand lediglich eine Charakterisierung als Möglichkeit/Wahrscheinlichkeit?
In diesem Vortrag wird ein an der Brandeis University entwickelter Ansatz zum automatischen Taggen solcher Faktualitätsinformationen vor- und zur Diskussion gestellt.
14.12.2010 Christopher Baumgärtner
On-Line Cross-Modal Context Integration for Natural Language Parsing
When humans process language, they are able to use information from other modalities to enhance their capability of language understanding. This can be observed when humans understand utterances of their communication partners by watching their mimics and gestures. It also applies to the understanding of written language, which is better understood when graphics are used that contain information related to the text. In my talk I will present an architecture that incorporates characteristics of human interaction between vision and language.
The first characteristic of cross-modal interaction between language and vision in humans is the continuous availability of information in one modality for use during the processing of information in the other modality. New visual information is immediately used to better understand a sentence and language information is directly helpful when perceiving a scene. The second characteristic the influence of language on human attention while searching a fitting scene of reference. The scene, once found, can be used to enhance the understanding of natural language.
In my talk I will show how a system can be build that exhibits these traits of interaction between the two modalities. The system consists of a language parser of German, a knowledge base and a representation of visual context. I will show how these components can be connected for the benefit of the performance of every subsystem. In order to show how visual attention is influenced, a model for visual human attention is integrated.
18.01.2011 Felix Lindner
Aktionsplanung in sozial konstituierten Räumen
Es existieren eine Vielzahl Algorithmen zur Planung kollisionsfreier, zielgerichteter Aktionssequenzen von Robotern. Erst wenige Ansätze erlauben es, auch zusätzliche Optimalitätskriterien in den Planungsprozess einzubeziehen - wie beispielsweise die soziale Angemessenheit von Aktionen. Im Vortrag stelle ich meine aktuellen Überlegungen zur Aktionsplanung in Mensch-Roboter-Interaktion-Kontexten vor. Ich führe eine Taxonomie von Raumtypen ein, die typischerweise in Interaktionskontexten konstituiert werden. Dann argumentiere ich, dass das Wissen über diese Räume bei der Planung sozial angemessener Aktionssequenzen gewinnbringend einbezogen werden kann.
25.01.2011 Monica Gavrila
MT Experiments for Romanian, German and English, using Empirical Approaches
Machine translation (MT) plays an important role in ensuring global communication, especially in a multilingual world, where people have access to digital data, due to the Internet, in a multitude of languages. Unfortunately less spoken languages have to overcome a major gap in language resources and tools. Based mainly on the existence of a parallel corpus, corpus-based machine translation (CBMT) seems to be a solution for these languages.
In this talk the results of several CBMT experiments for English-Romanian and German-Romanian (in both directions of translation) are presented. In the experimental settings several parameters are changed: the MT system, the corpus type and size, etc. In this context we got a better view on the behavior of the systems, also when no "standard" language pairs are considered. Two example-based MT (EBMT) systems (Lin-EBMT - the baseline system, and Lin-EBMTREC+ - an improved version of the Lin-EBMT), which were implemented during the research, and, for comparison reasons, a Moses-based SMT system are examined. Although the SMT system outperforms the EBMT system in all the experiments, the behaviors of the systems noticed when changing the parameters in the experimental settings, proof the large impact the data has on both of the empirical approaches. It was also noticed that the difference between the approaches decreases, when a smaller corpus is considered, and/or when the baseline EBMT system is improved.
01.02.2011 Die TeilnehmerInnen des Projektes: Animationswerkzeug
Bericht aus dem Projekt: Animationswerkzeug zur Visualisierung sozialen Handelns
Die Angemessenheit räumlichen Verhaltens ist ein relevanter Faktor für die Akzeptanz sogenannter "sozialer Roboter", die mit Menschen interagieren. Bisher ist für diesen Bereich ungeklärt, inwieweit Simulationsstudien auf reale Situationen übertragbar sind. Ergebnisse aus der Psychologie zeigen aber, dass bereits einfache animierte geometrische Formen ausreichen, um bei menschlichen Betrachtern den Eindruck sozial handelnder Agenten zu erzeugen. Im Rahmen des Projektes entstand ein Werkzeug, mit dem solche Animationen über eine graphische Schnittstelle erstellt, bearbeitet und abgespielt werden können.
02.02.2011 Sondertermin
Maximilian Stegen
Erzeugung von 3D Objekten zur Kartenexploration mit Phantomschnittstellen
Vortrag zur Bachelorarbeit
09.02.2011 Sondertermin
Das Projektteam
Projekt Opinion Mining: Kann eine Maschine feststellen, wie zufrieden ich bin?
Die Vorstellung des Projekts besteht aus zwei Teilen: einem Vortrag, in dem wir erläutern um was es sich bei dem Projekt handelt und was wir erreicht haben und einem Interaktiven Teil, bei dem jeder einmal direkt mit dem OpinionMiner experimentieren kann.
Opinion Mining bedeutet nicht nur Daten über ein bestimmtes Thema zu sammeln, sondern diese auch dahingehend zu verarbeiten, dass die in Freitexten (z.B. Reviews) enthaltenen Meinungen und Haltungen der Autoren extrahiert und verarbeitet werden können.
Im Projekt Opinion Mining (WS2010/11) wurde das bereits bestehende Opinion Mining Framework SO-CAL weiterentwickelt. SO-Cal existiert bisher für Englisch und Spanisch und musste daher an die Besonderheiten der deutschen Sprache angepasst werden. Da jede Sprache jedoch ihre eigenen Ausdrucksformen hat, mussten viele Teile des Systems überarbeitet und übersetzt werden.
Die Extraktion von Meinungen aus Freitexten gestaltet sich als äußerst schwierig, da es viele verschiedene Möglichkeiten gibt, eine Meinung beziehungweise eine Haltung zu formulieren. Die Schwierigkeit liegt also darin, der Maschine beizubringen mit diesen Formulierungen und Verschachtelungen umzugehen.
SO-CAL ermittelt mit Hilfe von Wörterbüchern und entsprechenden Heuristiken, ob ein Text eine eher zustimmende oder eine eher ablehnende Haltung gegenüber dem bewerteten Produkt hat und wie stark diese Haltung ist. Berücksichtigt werden unter anderem Negationen, Steigerungsformen und die Schreibweise der Wörter. Das System wurde ergänzt um einen deutschen Tagger und einen Lemmatisierer. Zusätzlich wurden die Heuristiken an die Gegebenheiten der deutschen Sprache angepasst. Getestet wurde auf Reviews aus einem breiten Spektrum unterschiedlicher Produktkategorien.