ZielHintergrundPartnerForumTest!KontaktVeröffentlichungenHomepage
FAQ - einige Fragen und Antworten
F Was ist GETESS ?
A GETESS (German Text Exploitation and Search System) ist ein Versuch, Recherchen in natürlichsprachlichen Textdokumenten (NL-Texte) für Benutzer zu vereinfachen.
Dabei werden die NL-Texte
  • zuerst linguistisch (syntaktisch/semantisch) bearbeitet und aufbereitet (semantisch/pragmatisch).
  • dann entsprechend der linguistischen Bearbeitung in einer Datenbank gespeichert.
Diese gespeicherten und bearbeiteten Texte nennen wir jetzt Abstract. Die Bearbeitung der NL-Texte erfolgt anhand einer Ontologie (Beispiel einer Ontologie [Ausschnitt] und siehe auch bei SemanticWeb). Wir können also faktisch sagen, daß der NL-Text den Blättern des Ontologiebaumes zugeordnet ist (Ein NL-Text ist vielen Ontologie-Knoten zugeordnet).
Mit einer einfachen Anfragesprache (der natürlichen Sprache) kann nun über ein entsprechendes Interface in den Abstracts gesucht werden. Dabei stellt GETESS seine Informationen im Dialog dem Benutzer dar und zur Verfügung.
F Was kann GETESS ?
A GETESS ist in der Lage
  • einfache Textphrasen sehr schnell zu erkennen und zu speichern
  • Begriffe miteinander in Beziehung zu setzen (über die Ontologie)
  • mittels Dialoginterface den Benutzer durch die NL-Texte zu führen
  • in der Intranet-Lösung per grafischem Interface Multimedia-Techniken für das Ontologie-Browsing zu nutzen
F Was kann GETESS NICHT?
A Das GETESS-System ist kein HAL9000!, d.h. GETESS ist kein "Superhirn", daß alle Anfragen beantworten kann.
Probleme bereiten insbesondere:
  • das leidige "Weltwissen"
  • Das Modellieren der Welt, in der wir uns mit dem System bewegen (Ontologie). Je mehr Konzepte modelliert werden, desto mehr Beziehungen müssen modelliert und beachtet werden.
  • Das Erkennen bestimmter grammatikalischer Konstrukte in den NL-Texten, da bei der linguistischen Analyse ein flaches Parsingverfahren verwendet wird. So kann ein verschachtelter Satz wie eine Unterkunft an der See mit Wintergarten und Tennishalle in der Nähe nur mittels heuristischer Methoden semantisch und pragmatisch bewertet werden. Die linguistische Analyse Satzes ergibt eine Aneinanderreihung von Nominal- und Präpositionalphrasen (NP/PP).

    Beispiel:
    NP eine Unterkunft; PP an der See; CPP mit Wintergarten und Tennishalle; PP in der Nähe

PS: Wer hier weitere Informationen haben möchte, sollte ein Blick auf die Seiten von Günter Neumann beim DFKI Saarbrücken werfen. Das ist der Beste! ;)) Wir verwenden SMES
F Wie kann ich GETESS benutzen?
A Die Benutzung von GETESS ist denkbar einfach.
In das Eingabefeld einfach nur eine Anfrage eintippen und enter drücken! Beispiele sind:
  • Langversion:
    Ich suche ein Hotel an der Ostsee
  • oder verkürzt:
    Hotel an der Ostsee

GETESS verwendet ein Verfahren, Wörter wie Hotel mit Phrasen wie an der Ostsee in Beziehung zu setzen. Wenn eine solche Beziehung in der Ontologie modelliert ist und die Wörter (Hotel, Ostsee) im Wörterbuch bekannt sind, berechnet GETESS eine Relation Hotel->Ostsee. Mit dieser Relation wird dann in der Datenbank gesucht. Was GETESS berechnet hat, ist dann auf der Antwortseite in der "Dialog-History" zu erfahren. In der Spalte "was wir daraus erkannt haben" steht der vom GETESS-System erkannte und berechnete Ausdruck, mit dem in der Datenbank gesucht wurde.

siehe auch das Beispiel 1

F In der "Dialog-Strategy" steht "Wir kennen verschiedenen Arten von xxxx. Treffen Sie eine Auswahl!" und es tauchen Checkboxen auf?
Beispiel 2
A Das GETESS-System hat "etwas" aus Ihrer Anfrage erkannt und mit diesem Ausdruck in der Datenbank gesucht. Dabei hat es sehr viele Dokumente gefunden, die zur Ihrer Anfrage "passen".
GETESS versucht daraufhin, zusammen mit Ihnen (also im Dialog), den Suchraum einzuschränken. Dafür nutzt GETESS Informationen sowohl der Ontologie als auch zum Füllstand der Datenbank.
Eine Strategie dabei ist, bei recht allgemeinen Begriffen (etwa Unterkunft) nachzufragen, ob nicht etwa ein speziellerer Begriff (etwa Hotel oder/und Pension etc.) angegeben werden kann, d.h also Unterkunft ist in unsrer Welt als Konzept so modelliert, daß es noch verschiedene "Unter-arten (Untertypen) besitzt. Das ist also gemeint mit dem Satz: Wir kennen verschiedenen Arten (oder Typen. hier: Hotel, Pension, ...) von xxxx (hier: Unterkunft). Sie sehen hier faktisch einen Ausschnitt der Ontologie.

Klicken Sie einfach ein paar Untertypen aus der Liste an oder IGNORIEREN Sie einfach diese Nachfrage, indem Sie die Checkbox "ignorieren" anklicken. Anschließend müssen Sie noch auf "Anfrage absenden" drücken, um GETESS zu antworten.

F in "Dialog-History" steht bei Anz. Ergebnisse 1034. GETESS zeigt aber nur 11 Dokumente an?
A Das ist kein Fehler von GETESS, sondern nur meine Faulheit. Diese Site dient lediglich zu Demonstrationszwecken und soll das Funktionieren der ausgedachten Algorithmen zeigen. Sorry!
F Unter "Dialog-Strategy" steht die Frage: Geben Sie bitte einen Wert ein für :
A O.k.! GETESS hat ihre Anfrage erkannt und sehr viele Treffer gefunden. Anhand der Informationen der Ontologie und des Füllstandes der Datenbank, versucht GETESS nun, den Suchraum im Dialog mit dem Benutzer einzuschränken.
Bei dieser Nachfrage hat sich GETESS dazu entschieden, bestimmte Attribute eines erkannten Begriffes nachzufragen. Diese Attribute (auch Relationierungen) wurden bei der Ontologiemodellierung einem Konzept der Ontologie zugeordnet (z.B. ein Hotel hat_eine_Adresse oder die Stadt gehört_zu_einem_Bundesland etc.).
Sie haben jetzt die Möglichkeit
  • einen bestimmten Begriff in das Textfeld einzugeben (z.B. den Namen einer Stadt etc) oder
  • einen allgemeinen Begriff über die Select-Box auszuwählen. Diese Begriffe (Konzepte) stammen aus der Ontologie und passen zum nachgefragten Attribut.
Auch hier können Sie die Nachfrage ignorieren und die entsprechende Checkbox anklicken. Klicken Sie dann auf "Anfrage absenden"
F Wenn ich eine Frage an das System gestellt habe, dauert das ewig, bis GETESS antwortet!?
A Leider! Das ist ein derzeitiges Problem der Implementation und technischen Ausstattung.
Das soll natürlich keine Ausrede sein, aber ...

GETESS übergibt Ihre Anfrage zuerst an den Parser, bewertet dann die Ergebnisse, sucht in der Datenbank und berechnet zum Schluß den Abstract für das gesamte Dokument. Das alles wird dann als XML-File an die Web-Applikation gesendet und dort in HTML-Code umgewandelt. Dabei ist vor allem das Berechnen eines Abstracts eine recht zeitraubende Geschichte, da in der Testversion von GETESS keinerlei Optimierungen an der Datenbank vorgenommen wurden.
Die gesamte Abarbeitung erfolgt auf einer 450-er SUN-Workstation, die noch vielen Entwicklern für völlig andere Projekte treue Dienste leisten muß.

F Unter "Dialog-Results" stehen so komische Sachen. Was bedeuten die Ergebnisse eigentlich?
A Das Ergebnis einer Anfrage ist immer zwei(2)-geteilt. Einmal ist da die Dialog-Strategy, zum Anderen sind da die Dialog-Results. Eine kurze Erklärung zu den "Dialog-Results" gibts hier.



Startseite   Ziel   Hintergrund   Partner   Forum   Test!   Kontakt