AutoJAKOB: Parsing und semantische Annotation von Zeitungstexten

In diesem Projekt wird die Analyse von Textausschnitten aus NZZ und Tages-Anzeiger demonstriert, wie sie das Analysetool AutoJAKOB leistet.

  • Die Zeitungsausschnitte werden für die Eingabe als Story in das Analyseprogramm formal aufbereitet und, wo nötig, manuell präprozessiert (z.B. werden Relativsätze entschachtelt), so dass für die Analyse einfache Satzkonstruktionen vorgegeben sind.
  • Die Story wird mit einem Titel versehen, sowie mit Quellenangaben und allfälligen weiteren Kommentaren und innerhalb eines Projektes segment- und wortweise  abgespeichert. Gleichzeitig erfolgt eine syntaktische Analyse des Textes durch den Parser (ParZu – The Zurich Dependency Parser for German (Pro3GresDE).
  • In der daraus resultierenden tabellarischen Darstellung wird die erfasste Story als eine Folge von Einzelsätzen dargestellt, die mit syntaktischen und semantischen Markern versehen sind. Die einzelnen bedeutungstragenden Wörter im Satz sind in vier Slots nach dem Muster „WER | TUT | WAS | WIE“ eingeordnet (Satzrollen für Subjekt, verb, Objekte(e), Ergänzungen). Die vollständigen semantischen Attribute sind in der aktuellen Programmversion nur im JAKOB-Lexikon ersichtlich; die tabellarische Storyübersicht zeigt nur die Sloteinteilung).
  • Eine manuelle Nachbearbeitung der Segmente ist in jeder Phase möglich.

Hintergrund:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert