Dissertationsschrift (PDF-File, 182 S.):
ISBN 3-931757-00-5, CS Press 1996, Carl-Orff-Bogen 139, 80939 München
"Inkrementelle linguistische Interpretation inkrementell erzeugter Wortgraphen"
Das Thema gehört in das Gebiet der Computer-Linguistik, ist aber auch als echte Ingenieur-Leistung zu verstehen, da es sich um die programmierte Steuerung eines einsatzfähigen Computersystems zur Stimmerfassung-, bearbeitung, -beantwortung von Zugauskunfts-Anfragen im aktuellem Bundesbahnfahrplan handelt. Es wurde auf der Industrie-Messe in Hannover 1994 in praxi vorgestellt.
Wortgraphen sind die i.A. mehrdeutigen Ergebnisse von Computer-Worterkennern. Inkrementell sind dieselben, weil Sie während der laufenden Computeranalyse der Spracheingabe sukzessive erzeugt werden, so dass bereits
mit der linguistischen Interpretation des vermeintlichen Inhalts der Anfrage begonnen werden kann. Inkrementell steht auch für schritthaltende Analyse entlang der Zeitachse, zumal die beiden internen Abbilder (Wortgraph + Interpretationsgraph) miteinander gekoppelt werden. Das war damals technischer Höchststand, wobei der Worterkenner als Vorleistung der Forschungsgruppe von Prof. Sagerer genutzt wurde. In seiner List of publications finden sich 5 Einträge meiner Mitarbeit.
Da die Interpretationsgraphen der linguistischen (syntaktischen/semantischen/pragmatischen) Analyse die Form semantischer Netze nach der Theorie von Sagerer hatten und mit einer linguistischen Wissensbasis ebenfalls in Form eines semantischen Netzes interagierten, zählten solche Arbeiten damals zum Gebiet der künstlichen Intelligenz (KI). Reell gehören die verwendeten Methoden aber in das klassische Gebiet der Mustererkennung.
In der damaligen wie heutigen Forschungslandschaft dominieren dem Anschein nach im Gebiet der Computerlinguistik sog. Parser, welche die Grammatikalität, d.h. primär die syntaktische Korrektheit, im Computer abgebildeter sprachlicher Sätze prüfen. Verdienst der Arbeit ist es, ein mittels semantischer Netze arbeitendes System diesen gängigen Systemen an die Seite zu stellen. Beide Ansätze wurden Mitte der 90iger im gemeinsamen Projekt "Verbmobil" staatlich gefördert. Diese Arbeit zeigt auf, dass das Konzept der semantischen Netze als eine Art Tiefenstruktur-Parser zu verstehen ist, und dazu die notwendigen technischen Vorteile für die inkrementelle Abarbeitung gestattet. Parsen sei am Beispiel verdeutlicht:
"Ich möchte nach dort" |
"Ich möchte nach Dortmund"
|
ein zulässiger Satz im Wortgraphen |
der tatsächlich gesprochene Satz |
Der 1. Satz wird von herkömmlichen Parsern als grammatisch akzeptiert, erbringt aber keine echte Zuganfrage. Die semantische Netzkonzeption unterstellt den Parser einer pragmatische Komponente, die etwas von Städten/Bahnhöfen "versteht". Klarerweise verliert ein solches Computersystem an Universalität.
Das Erkennen/Verstehen der notwendig begrenzten Universalität von Computer-Anwendungsprogrammen- und systemen, ja des Computers i.A. selbst ist eine Domäne des forschenden Informatikers und heutzutage beleibe nicht Allgemeingut. Das kann und muss sich ändern.
Die Tiefenstruktur eines Satzes, in welcher Form auch immer computer-codiert,
ist eine Erschliessung der eigentlichen themen-relevanten "Botschaft" des Satzes. Sie schliesst überflüssige Wortpartikel ebenso aus wie andere verhüllende Aspekte der Oberflächenform des Satzes, d.h. seiner tatsächlichen Form, also z.B. auch der gegebenen Reihenfolge der Worte, deren Umstellung den Inhalt gegebenfalls unverändert lässt. Für einen Computer i.U. zum Menschen sind das auf jeden Fall verschiedene Sätze. Das Heraushören der Tiefenstruktur ist eine "humane Kunstleistung", die meist erst wieder beim Erlernen von Fremdsprachen problematisch wird. Das Thema des humanen (nicht computermässigen) Spracherwerbs ist daher ein dauerhaftes Parallel-Thema eines Forschers in diesem Arbeitsfelde.
Das Thema der semantischen Netze als praktikable Form der Wissensspeicherung in Computern ist in der Periode der abgeklungenen KI-Euphorie bisher kaum in die Öffentlichkeit gedrungen. Es gewinnt gegenwärtig neues Interesse in Form der sog. "ontologischen" Suche im WWW. Auch "semantic mining" figuriert als Schlagwort in der Universitäts-Szene. Dabei steht das der Philosophie entlehnte Attribut zunächst mal für den Aufputz der vermeintlich höheren Suchleistung für alle Arten semantisch-gestützter Text-Durchsuchung, simpel alles was über blosse Stichwort-Suche hinausgeht. Das ist ein weites, offenes Feld, auch für alle Arten angeblicher "Kunstleistungen" mittels Computer.