Arbeitsbereich WSVFachbereich Informatik
Universität Hamburg

18.054 Proseminar Markup-Sprachen in der Sprachtechnologie

Veranstalter
 Frank Schilder
Zeit/Ort
 Mo 14-16 F-334
Inhalt
  Dieses Proseminar hat die Verwendung der eXtensible Markup Language (XML) im Bereich der Sprachtechnologie zum Thema. XML ist eine einfach zu erlernende und flexible Repräsentationssprache, die es nicht nur erlaubt, Daten strukturiert darzustellen und sondern auch Daten über Daten (Meta-Daten) zu erfassen. Aus diesen Gründen ist XML auch äußerst interessant für die Entwicklung von sprachverarbeitenden Systemen (z.B. automatische Übersetzungs- oder Dialog-systeme), da hier sowohl die Struktur als auch der Inhalt von Sprache erfaßt wird. Nach einer Einführung in XML und Anwendungen, die die mittels XML dargestellten Daten weiterverarbeiten können (z.B. XSL, XLink, RDF etc.), werden einzelne Anwendungsmöglichkeiten für die Sprachtechnologie vorgestellt. Dabei handelt es sich z.B. um die Annotation sprachlicher Daten (Korpuslinguistik), und geht über das automatische Erkennen von sprachlichen Einheiten wie Personennamen (Named Entity Recognition) bis hin zur inhaltlichen Analyse von ganzen Texten (Information Extraction).
Literatur
 
Termine
 07.04.2003 
  Frank Schilder
Einleitung
  Überblick Sprachtechnologie/Warum XML?
[PDF] 
 14.04.2003 
  Frank Schilder
Markupsprachen
  Einführung in XML (Ray, 2001, Kap. 2)
[PDF] 
 28.04.2003 
  Frank Schilder
Markupsprachen
  Präsentationstechniken/LaTeX Einführung
[PDF] [PDF] 
 05.05.2003 
  Stephan Hohmann
DTD/XML Schema
  Ray (2001, Kap. 5)
  Stephan Hohmann
Style sheets: CSS
  Ray (2001, Kap. 4)
 12.05.2003 
  Kenan Bahavan
Elektronisches Publizieren: SGML beim Fischer Weltalmanach
  Kamps et al. (1999)
  Kenan Bahavan
Elektronisches Publizieren: XML in Nachrichtenagenturen
  Sprick (1999)
 19.05.2003 
  Jens Wächter
Semantisches Tagging: Nachrichten
  Knorz und Möhr (1999)
  Jens Wächter
Semantisches Tagging: Zeitliche Information
   Setzer and Gaizauskas (2000)
 26.05.2003 
  Dennis Spitzhorn
Diskurstheorie
  Rehm (1999)
  Dennis Spitzhorn
Diskursmarker
  Berger, Reiter und Stede (2002)
 02.06.2003 
 16.06.2003 
 23.06.2003 
 30.06.2003 
 07.07.2003 
 14.07.2003 
Links
 LaTeX:
  • DANTE, Deutschsprachige Anwendervereinigung TeX e.V.
Tips zu Präsentationstechniken:

Wir freuen uns über Kommentare und Hinweise zu diesen Seiten.
letzte Änderung am Tue Apr 29 12:31:33 CEST 2003