Arbeitsbereich WSVFachbereich Informatik
Universität Hamburg

18.413 Seminar Content Management: intelligente Inhaltserschließung von Dokumenten

Sommersemester 2002

Veranstalter
 Frank Schilder
Zeit/Ort
 Mi 12 - 14 F-635
Inhalt
 Content Management ist ein Begriff, der sich zunehmender Beliebtheit bei der Erstellung von Informationssystemen erfreut, ohne eine genaue Definition seiner Verwendungsweise zu besitzen. Ziel dieses Seminars ist es daher, eine genauere Beschreibung dieses Begriffes zu erarbeiten und neue zukunftsweisende Entwicklungen aus diesem Gebiet vorzustellen und zu diskutieren. Eine mögliche Kernbedeutung des Begriffs Content Management kann in der Erstellung und Verwaltung von Redaktionssystemen gefunden werden. Redakteure erstellen Texte (Content), welche verwaltet und in geeigneter Form präsentiert werden (Management). Am Anfang des Seminars erfolgt daher eine Einführung in neue Techniken zur Erstellung von web pages mittels XML und XSL(T). Aufbauend auf dieser Kernbedeutung werden dann weitergehende Anforderungen spezifiziert. Insbesondere neuere Methoden zur automatischen Inhaltserschließung von Dokumenten (z.B. Texte, Tabellen, Graphiken etc.) werden hierbei im Mittelpunkt stehen. Traditionelle Ansätze im Rahmen des Information Extraction bzw. Information Retrieval setzen meist auf eine sehr flache Verarbeitung. In neueren Arbeiten werden nun zunehmend tiefere semantische Analysen der Textinhalte hinzugenommen.
Literatur
 
  • Gunther Rothfuss and Christian Ried (2001). Content Management mit XML. Springer, Berlin. HTML
  • Andrew Warzecha, December 23, 2000. "Differentiating Content Management, Document Management, and Portals. As the definitions of these three product categories become more blurred, it's important to learn the distinct characteristics of each." The Meta Group: www.metagroup.com. HTML
  • Katherine C. Adams (2001). The Web as a Database: New Extraction Technologies and Content Management. Katherine C. Adams (2001). HTML
  • Tim Berners-Lee, James Hendler and Ora Lassila (2001). The Semantic Web. in Scientific American 05/01. HTML
  • Bijan Parsia (2001). RDF Applications with Prolog. in XML.com. July 2001. HTML
  • Ricardo Baeza-Yates and Berthier Ribeiro-Neto (1999), Modern Information Retrieval, Addison Wesley, Wokingham, UK. HTML
  • Lehnert, Wendy. "Cognition, Computers and Car Bombs: How Yale Prepared Me for the '90s" in Beliefs, Reasoning, and Decision Making: Psycho-logic in Honor of Bob Abelson (eds: Schank & Langer), Lawrence Erlbaum Associates, Hillsdale, NJ. (1994): pp. 143-173. Shorter version of the essay without graphics (PDF)
  • Intelligent Multimedia Information Retrieval edited by Mark T. Maybury, AAAI Press, 1997. HTML
  • James Hendler (2001), Agents and the semantic web, in IEEE Intelligent Systems, March/April 2001.
  • Neil Day (2001), MPEG-7: Solutions for Rich Content Management HTML
Weitere Literatur wird am Anfang des Seminars bekanntgegeben.
Termine
 03.04.2002Einleitung
  Seminarüberblick/Vorstellung der Themen
Einleitung in die Thematik 
  Wie halte ich einen Vortrag? Erstes Beispiel einer Markup-Sprache: LaTeX
Präsentationstechniken/LaTeX Intro 
 10.04.2002Begriffsfindung
  Was ist Content Management? Was sind die Unterschiede/Gemeinsamkeiten zu Knowledge Management/Document Management/Portals etc.? (Wrazecha, 2000; Adams, 2001)
 17.04.2002Kernbedeutung
   Was leistet das traditionelle Publishing? Welche neuen Herausforderungen entstehen durch Hypertext, dynamisches Einbinden von Datenbanken in web pages, Cross-media Publishing etc.? Welche Lösungsansätze bietet Content Management? (Rothfuss und Ried, 2001:Kap. 2 & 3)
Vortrag Andy Adiwidjaja 
 24.04.2002Techniken
   Welche Vorteile bringt XML für die Strukturierung der Inhalte? Welche zusätzlichen Vorteile bringen Namensräume (name spaces)? Wie erhalte ich Zugriff auf die in XML kodierten Daten (Name Space, XQL, XPATH)? (Rothfuss und Ried, 2001:Kap. 6; Behme und Mintert, 2000:Kap. 4 & 5); http://www.w3.org/XML/)
Vortrag
	Andrzej Walczak 
 08.05.2002Gastvortrag
   Einsatz von XML-Technologien im Content Management System Contelligent finix
 15.05.2002Systeme
   Welche Vor-und Nachteile haben verschiedene CMS? Z.B. CoreMedia, webdynamix und OpenCMS (Rothfuss und Ried, 2001:Kap. 4)
Vortrag von Irina Froese (Content Management Systeme) 
 29.05.2002Semantic Web
   Was verbirgt sich hinter der Vision des Semantic Web? Wie können Inhalte mittels RDF modelliert werden? (Parsia, 2001; http://www.w3.org/RDF/)
 05.06.2002Semantic Web
  Was sind Topic Maps? Was unterscheiden Topic Maps vom RDF? (Widhalm & Mück, 2001; Rath, 2001)
Vortrag Andy Adiwidjaja (Topic Maps) 
 12.06.2002Gastvortrag
  Gastvortrag von 7d
 19.06.2002Wie schreibe ich eine Seminararbeit?
   Wie finde ich das Thema zu meiner Seminararbeit sein? Wo finde ich weiterführende Literatur? Wie zitiere ich richtig? etc.
Vortrag zu Seminararbeit 
 26.06.2002Information Extraction
  Wie finde ich Antworten auf meine Fragen in einem relevanten Dokumenten? Was sind die Nachteile von vorgefertigten templates? Wie kann ich automatisch Wissen aus Texten extrahieren? (Lehnert, 1994)
Vortrag von Mirco Schröder (Information Extraction) 
 03.07.2002Rich Content Management
   Wie können Informationen in anderen Formaten als reinen Textdateien in einem CMS verwaltet werden? Welche Standards existieren zur Darstellung von Bild-, Video-, Ton- und/oder Graphikmaterial? (Day, 2001)
 10.07.2002Multimedia Summarisation
  Was steht eigentlich in diesem 200-seitigen Dokument? Was wird in in diesem Video gezeigt? Wie bekomme ich die Inhalte aus unterschiedlichen Modalitäten (Text, Sprache, Graphiken etc.) komprimiert in kurzer Form zusammengefasst? (Maybury, 1997) Zukünftige Entwicklungen: Agenten, Ontologien etc. (Hendler, 2001)
Links
 LaTeX:
  • DANTE, Deutschsprachige Anwendervereinigung TeX e.V.
Links
 Tips zu Präsentationstechniken:

Wir freuen uns über Kommentare und Hinweise zu diesen Seiten.
letzte Änderung am Mon Feb 3 12:52:56 CET 2003