|
Veranstalter
|
|
Christopher Habel,
Wolfgang Menzel,
Carola Eschenbach,
Matthias Kerzel,
Felix Lindner,
Isabelle Streicher
|
|
Zeit/Ort
|
|
Di 16-18 F-534, Beginn: 2.11.10, entsprechend Ankündigungen
|
|
Inhalt
|
|
Vorträge über Vorhaben und Ergebnisse von Bachelor-, Master- und Diplomarbeiten,
laufenden Dissertationen und Drittmittelprojekten sowie von anderen Forschungsarbeiten aus
dem Bereich der Wissens- und Sprachverarbeitung. Insbesondere wird der interdisziplinäre
Charakter des Forschungsschwerpunktes berücksichtigt, d.h. die Integration von Ansätzen der
Informatik, Linguistik, Logik und Psychologie steht im Vordergrund der Arbeiten. |
|
Termine
|
|
| 28.09.2010, 16:15, F-534 |
Sondertermin
Christian Ritter
Einsatz von TopicMaps für die Navigation und Suche in regelbasierten Systemen am Beispiel TAXOR
Im Rahmen der Bachelorarbeit wurde versucht, eine Erklärungskomponente des
wissensbasierten Systems TAXOR mit Hilfe von TopicMaps zu entwerfen und zu
realisieren. Dabei war es Hauptziel, eine stets aktuelle Wissensstruktur des in
TAXOR zusammengefassten Wissens erstellen und darstellen zu können. Es wird
zunächst das Projekt TAXOR und die Notwendigkeit einer Erklärungskomponente
erläutert. Hierbei wird auf Systemarchitektur, Wissensbasis und Regelmaschine
eingegangen. Darauf aufbauend wird der Bezug und die vom Projekt ausgehende
Erwartungshaltung zu einer Lösung mit TopicMaps vorgestellt. Des weiteren werden
Grundlagen zu TopicMaps und Wissensstrukturen dargestellt. Im Anschluss daran
werden die Ergebnisse der Arbeit vorgestellt und die Lösungsansätze mit
verschiedenen Implementierungsmöglichkeiten diskutiert sowie eine abschließende
Bewertung und ein Ausblick für aufbauende Arbeiten gegeben.
|
|
|
| 09.11.2010 |
Lisa Beinborn
Post-Editing: A crosslinguistic analysis of the temporal, technical and cognitive effort
Human inspection and correction of machine translations is still
indispensable to ensure accurate and stylistically acceptable output. This
process of retrospective modification of machine translation output is called
Post-Editing. In this study, the post-editing process is analyzed under
temporal, technical and cognitive aspects. Crosslinguistic data from a prior
productivity test constitutes the basis for the analysis. English source
segments had been machine-translated by a statistical system into Italian,
Spanish, French and German, and then post-edited by professional translators.
Segments with higher temporal, technical and cognitive effort are identified in
order to detect crosslinguistic negative translatability indicators. The results
show that the translatability of the source segment is not the only factor that
has influence on the post-editing effort. A comparison of post-editing and
translation effort highlights the difference between the two processes. Finally,
possible improvements for the post-editing working conditions are
proposed.
|
|
|
| 16.11.2010 |
Alexander Eberling
Geometrische und thematische Ergänzungen von graphischen Karten - Repräsentationen für die haptische Exploration>
Visuelle Karten sind für blinde und sehbehin-derte Menschen unbrauchbar,
jedoch können sie haptische Karten verwenden. Die Arbeit setzt einen Teil des
VAVETaM-Projekts (ver-bally assisting virtual-environment tactile maps) um und
soll die Grundlage für ein Assistenzsys-tem erstellen. Z.B. können zusätzlich
verbale Hilfestellungen generiert werden, um den Be-nutzer dabei zu
unterstützen, sich in der Umge-bung der Karte zurechtzufinden. Die Grundlage des
Systems ist, eine Karte der Umgebung in ein internes Modell zu überführen und
das in-terne Modell mit proportionalen Informationen über Karten-Objekte zu
ergänzen. Im internen Modell kann die Karte durch Verarbeitungspro-zesse
analysiert und modifiziert werden. Diese Arbeit wird sich mit der Erstellung des
internen Modells, der Verarbeitungsprozesse und den Ergänzungen befassen.
|
|
|
| 23.11.2010 |
Paulo Mendes
Assoziationsanalyse für das Wissensmanagement
Ausgangspunkt ist die zunehmende Bedeutung der Komponente Wissen in der
Unternehmenswelt, die nach Meinung vieler Experten in der heutigen Zeit als
wichtigstes Unternehmenskapital gesehen wird. Eine geeignete Methode, mit der
Organisationen den Wissensdrang befriedigen, ist das Sammeln und Analysieren von
Daten, um sie anschließend in Wissen umzuwandeln. Die Herausforderung liegt in
der Prüfung der großen Datenmengen auf Muster bzw. Zusammenhänge durch geschulte
Analysten, was Unternehmen auf computergestützte Systeme, die auf
Data-Mining-Methoden basieren, zurückgreifen lassen. Dieser Vortrag zeigt das
Zusammenspiel zwischen den beiden Forschungsgebieten Wissensmanagement und Data
Mining auf. Weiterhin wird die Assoziationsanalyse, ein Data-Mining-Verfahren,
näher betrachtet. Es wird der für die Warenkorbanalyse verwendete
Apriori-Algorithmus beschrieben und auf die Bewertung der Assoziationsregeln
eingegangen. Der Einsatz der Assoziationsanalyse wird anhand eines Fallbeispiels
bei einem Personaldienstleister vorgestellt, der mit seiner umfangreichen
Bewerberdatenbank über ein großes Potenzial aus Data-Mining-Sicht verfügt. Es
wird auf die Vorbereitung der Daten und die in der Arbeit für die
Assoziationsanalyse verwendete Data-Mining-Software WEKA 3 eingegangen.
Abschließend werden die Ergebnisse der Assoziationsanalyse (WEKA-Report)
vorgestellt.
|
|
|
| 07.12.2010 |
Isabelle Streicher
Ereignisfaktualität in Texten und deren automatische Annotation
Natürliche Sprache bietet die Möglichkeit sowohl über faktische als auch
über kontrafaktische Ereignisse zu kommunizieren - einerseits Ereignisse, die zu
einer gegebenen Zeit an einem gegebenen Ort stattgefunden haben, andererseits
solche, die keinen Referenten in der Welt besitzen. Über diese
Polaritätsmarkierung hinaus, erlaubt uns Sprache eine epistemische Haltung zu
den denotierten Ereignissen zu vermitteln. Ist sich eine Quelle der
(Kontra-)Faktizität eines Ereignisses sicher oder erlaubt der Wissensstand
lediglich eine Charakterisierung als Möglichkeit/Wahrscheinlichkeit? In
diesem Vortrag wird ein an der Brandeis University entwickelter Ansatz zum
automatischen Taggen solcher Faktualitätsinformationen vor- und zur Diskussion
gestellt.
|
|
|
| 14.12.2010 |
Christopher Baumgärtner
On-Line Cross-Modal Context Integration for Natural Language Parsing
When humans process language, they are able to use information from other
modalities to enhance their capability of language understanding. This can be
observed when humans understand utterances of their communication partners by
watching their mimics and gestures. It also applies to the understanding of
written language, which is better understood when graphics are used that contain
information related to the text. In my talk I will present an architecture that
incorporates characteristics of human interaction between vision and
language. The first characteristic of cross-modal interaction between
language and vision in humans is the continuous availability of information in
one modality for use during the processing of information in the other modality.
New visual information is immediately used to better understand a sentence and
language information is directly helpful when perceiving a scene. The second
characteristic the influence of language on human attention while searching a
fitting scene of reference. The scene, once found, can be used to enhance the
understanding of natural language. In my talk I will show how a system can
be build that exhibits these traits of interaction between the two modalities.
The system consists of a language parser of German, a knowledge base and a
representation of visual context. I will show how these components can be
connected for the benefit of the performance of every subsystem. In order to
show how visual attention is influenced, a model for visual human attention is
integrated.
|
|
|
| 18.01.2011 |
Felix Lindner
Aktionsplanung in sozial konstituierten Räumen
Es existieren eine Vielzahl Algorithmen zur Planung kollisionsfreier,
zielgerichteter Aktionssequenzen von Robotern. Erst wenige Ansätze erlauben es,
auch zusätzliche Optimalitätskriterien in den Planungsprozess einzubeziehen -
wie beispielsweise die soziale Angemessenheit von Aktionen. Im Vortrag stelle
ich meine aktuellen Überlegungen zur Aktionsplanung in
Mensch-Roboter-Interaktion-Kontexten vor. Ich führe eine Taxonomie von Raumtypen
ein, die typischerweise in Interaktionskontexten konstituiert werden. Dann
argumentiere ich, dass das Wissen über diese Räume bei der Planung sozial
angemessener Aktionssequenzen gewinnbringend einbezogen werden kann.
|
|
|
| 25.01.2011 |
Monica Gavrila
MT Experiments for Romanian, German and English, using Empirical Approaches
Machine translation (MT) plays an important role in ensuring global
communication, especially in a multilingual world, where people have access to
digital data, due to the Internet, in a multitude of languages. Unfortunately
less spoken languages have to overcome a major gap in language resources and
tools. Based mainly on the existence of a parallel corpus, corpus-based machine
translation (CBMT) seems to be a solution for these languages. In this talk
the results of several CBMT experiments for English-Romanian and German-Romanian
(in both directions of translation) are presented. In the experimental settings
several parameters are changed: the MT system, the corpus type and size, etc. In
this context we got a better view on the behavior of the systems, also when no
"standard" language pairs are considered. Two example-based MT
(EBMT) systems (Lin-EBMT - the baseline system, and Lin-EBMTREC+ - an improved
version of the Lin-EBMT), which were implemented during the research, and, for
comparison reasons, a Moses-based SMT system are examined. Although the SMT
system outperforms the EBMT system in all the experiments, the behaviors of the
systems noticed when changing the parameters in the experimental settings, proof
the large impact the data has on both of the empirical approaches. It was also
noticed that the difference between the approaches decreases, when a smaller
corpus is considered, and/or when the baseline EBMT system is improved.
|
|
|
| 01.02.2011 |
Die TeilnehmerInnen des Projektes: Animationswerkzeug
Bericht aus dem Projekt: Animationswerkzeug zur Visualisierung sozialen Handelns
Die Angemessenheit räumlichen Verhaltens ist ein relevanter Faktor für die
Akzeptanz sogenannter "sozialer Roboter", die mit Menschen
interagieren. Bisher ist für diesen Bereich ungeklärt, inwieweit
Simulationsstudien auf reale Situationen übertragbar sind. Ergebnisse aus der
Psychologie zeigen aber, dass bereits einfache animierte geometrische Formen
ausreichen, um bei menschlichen Betrachtern den Eindruck sozial handelnder
Agenten zu erzeugen. Im Rahmen des Projektes entstand ein Werkzeug, mit dem
solche Animationen über eine graphische Schnittstelle erstellt, bearbeitet und
abgespielt werden können.
|
|
|
| 02.02.2011 |
Sondertermin
Maximilian Stegen
Erzeugung von 3D Objekten zur Kartenexploration mit Phantomschnittstellen
Vortrag zur Bachelorarbeit
|
|
|
| 09.02.2011 |
Sondertermin
Das Projektteam
Projekt Opinion Mining: Kann eine Maschine feststellen, wie zufrieden ich bin?
Die Vorstellung des Projekts besteht aus zwei Teilen: einem Vortrag, in dem
wir erläutern um was es sich bei dem Projekt handelt und was wir erreicht haben und
einem Interaktiven Teil, bei dem jeder einmal direkt mit dem OpinionMiner
experimentieren kann. Opinion Mining bedeutet nicht nur Daten über ein
bestimmtes Thema zu sammeln, sondern diese auch dahingehend zu verarbeiten, dass die
in Freitexten (z.B. Reviews) enthaltenen Meinungen und Haltungen der Autoren
extrahiert und verarbeitet werden können. Im Projekt Opinion Mining
(WS2010/11) wurde das bereits bestehende Opinion Mining Framework SO-CAL
weiterentwickelt. SO-Cal existiert bisher für Englisch und Spanisch und musste daher
an die Besonderheiten der deutschen Sprache angepasst werden. Da jede Sprache jedoch
ihre eigenen Ausdrucksformen hat, mussten viele Teile des Systems überarbeitet und
übersetzt werden. Die Extraktion von Meinungen aus Freitexten gestaltet sich
als äußerst schwierig, da es viele verschiedene Möglichkeiten gibt, eine Meinung
beziehungweise eine Haltung zu formulieren. Die Schwierigkeit liegt also darin, der
Maschine beizubringen mit diesen Formulierungen und Verschachtelungen umzugehen.
SO-CAL ermittelt mit Hilfe von Wörterbüchern und entsprechenden Heuristiken,
ob ein Text eine eher zustimmende oder eine eher ablehnende Haltung gegenüber dem
bewerteten Produkt hat und wie stark diese Haltung ist. Berücksichtigt werden unter
anderem Negationen, Steigerungsformen und die Schreibweise der Wörter. Das System
wurde ergänzt um einen deutschen Tagger und einen Lemmatisierer. Zusätzlich wurden
die Heuristiken an die Gegebenheiten der deutschen Sprache angepasst. Getestet wurde
auf Reviews aus einem breiten Spektrum unterschiedlicher
Produktkategorien.
|
|