Advertisement

Strukturelle Beschreibung der Wissensquellen des Text-Parsers

Chapter
  • 19 Downloads
Part of the Informatik-Fachberichte book series (INFORMATIK, volume 243)

Zusammenfassung

Der hier beschriebene Text-Parser verfügt über drei213 Typen von Wissensquellen:
  1. (1)

    Wissen über die konzeptuelle Struktur des Weltausschnitts, auf den sich die zu analysierenden Texte beziehen. Dieses Wissen wird in Kap. 3.1 exemplarisch im Rahmen eines Frame-Repräsentationsmodells beschrieben, durch das die semantischen Primitive des Wortexpertensystems festgelegt sind.

     
  2. (2)

    Wissen über den operationellen Ablauf des Parsing-Prozesses. Entsprechende Informationen enthält das Parser-Bulletin, in dem die im Verlauf der Textanalyse betrachteten lexikalischen Einheiten und die zwischen ihnen identifizierten semantischen und syntaktischen Bezüge protokolliert sind. Dieses Wissen wird in Form einer tabellenartigen Struktur repräsentiert und zusammen mit den dazugehörigen Kommunikationsprimitiven in Kap. 3.3 beschrieben.

     
  3. (3)

    Prüfungen der konzeptuellen und operationellen Konstellationen, in die ein lexikalisches Element im Text eingebunden ist, machen den Spezifikationskern jedes Wortexperten aus. Daraus folgende (Zwischen-)Ergebnisse werden als interne Zustände einzelner Wortexperten in Form von Variablenbelegungen, Statusmeldungen, Anlaufbedingungen usf. akkumuliert und in geeigneter Weise in den Botschaftsaustausch zwischen einzelnen Wortexperten einbezogen. Deren Struktur wird in Kap. 3.2 eingehender betrachtet.

     

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literature

  1. 215.
    Liskov/Zilles 1974.Google Scholar
  2. 216.
    Vollständige(re) Beschreibungen von FRM enthalten REIMER/HAHN 1985 und Reimer 1989.Google Scholar
  3. 217.
    Die damit realisierte Abstraktion für die Interaktionen des Wortexperten-Parsers mit der Systemkomponente, die das Weltwissen enthält (die sog. Weltwissensbasis), zählte bislang zu den hervorstechendsten methodischen Desiderata des Standardmodells (vgl. Small 1980, S.192–193; Adriaens 1986b, S.222–223).Google Scholar
  4. 220.
    Spezialisierungsrelationen und Attribution finden sich in ähnlicher Weise auch in der sortenlogischen Repräsentationssprache (M)SRL (HABEL/REDDIG/ROLLINGER 1981) wieder, die die semantische Zielsprache der in Eimermacher 1983a beschriebenen Wortexpertenentwicklung ist und die somit ebenfalls auf ein von der jeweiligen Wortexperten-Spezifikation unabhängiges Wissensrepräsentationssystem rekurriert.Google Scholar
  5. 221.
    Die Behandlung von Defaults befindet sich erst in einem explorativen Modellstadium; s. Reimer 1989, Kap.5.Google Scholar
  6. 222.
    Ebd., S.30–35. Referentielles Wissen hat in der hier betrachteten Textklasse im übrigen einen wesentlich geringeren Stellenwert als etwa in Frage-Antwort-System-Kontexten, da Produktbeschreibungen oder Testberichte stets den jeweiligen Prototypen zum Gegenstand haben und (wenn überhaupt) nur am Rande auf Auffälligkeiten des speziellen Testexemplars eingehen.Google Scholar
  7. 226.
    In diesem und in den Anschlußkapiteln 3.2 und 3.3 wird ergänzend zu den formalen Charakterisierungen der Wissensquellen durch Funktionen und Mengen eine diesen Beschreibungen entsprechende Darstellung im Kalkül der conceptual representations (CR) (vgl. Kap. 2.3 dieser Arbeit bzw. Yonezawa 1977, S.17–37) gegeben. Die Beschreibungen durch Funktionen und Mengen sind die Grundlage der Spezifikation des Vokabulars der Wortexperten in Kap. 3, während in Kap. 4 die Spezifikation der eigentlichen Textgrammatik auf den Beschreibungen der durch conceptual representations gegebenen Datenstrukturen beruht. Der Grund für diese Doppelgleisigkeit liegt in dem Versuch, beide Beschreibungen zu entkoppeln und für sich möglichst lesbar zu halten. Die hier beschriebenen Wissensquellen, aber mehr noch die auf ihnen ausführbaren Operationen sind somit in einem allgemeinverständlichen und weitverbreiteten Kalkül spezifiziert, die textgrammatische Spezifikation gewinnt demgegenüber durch die Verwendung von conceptual representations ihrerseits stark an Lesbarkeit. Die konsistente Transformation von Ausdrücken aus dem FOL- oder Funktionenkalkül in äquivalente CR-Ausdrücke wird hier nicht gezeigt. Aber mit den semantischen Restriktionen der zulässigen Werte für alle Komponenten einer solchen Darstellung (s.u.) ist die Anbindung an die Jeweils äquivalente FOL- oder Funktionendarstellung in hinreichender Weise festgelegt.Google Scholar
  8. 227.
    Die Ebene von individuellen Referenzobjekten wird hier nicht betrachtet; s. Reimer 1989, S.30–35.Google Scholar
  9. 230.
    Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.338 bzw. Reimer 19–89, S.41 und S.49/50.Google Scholar
  10. 231.
    Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.340 bzw. Reimer 1989. S.56/58.Google Scholar
  11. 236.
    Vgl. zur Illustration Appendix-3, die Bulletin-Positionen 009 und 157. Google Scholar
  12. 238.
    S. Reimer 1989, Kap. 4.2, S.99 zu einer semantischen Spezifikation.Google Scholar
  13. 239.
    S. Reimer 1989, Kap.4.2, S. 102–105, 106–107 zu einer semantischen Spezifikation.Google Scholar
  14. 240.
    S. Reimer 1989, Kap.4.2, S. 102–105 zu einer semantischen Spezifikation dieser Operation.Google Scholar
  15. 242.
    Dies entspricht den Rahmenbedingungen des TOPIC-Systems; vgl. HAHN/REIMER 1986 und Hahn 1990.Google Scholar
  16. 260.
    norm ist eine Funktion, die aus einem flektierten Texttoken die morphologische Normalform (Grundform) erzeugt. In der hier beschriebenen Version des Text-Parsers wird lediglich die Nominalflexion normalisiert (Verben und entsprechende Konjugationsformen werden nicht betrachtet) und entsprechende Grundformen erzeugt. Die in norm abgespaltenen Flexive werden nicht weiter betrachtet. Dies kann sich grundlegend ändern, wenn etwa weitergehende syntaktische Tests (etwa auf Kongruenz) durchgeführt werden müssen, d.h. Flexionsendungen parsing-relevant werden (bereits in den Formulierungen des Wortexperten-Standardmodells sind solche Flexiv-Experten spezifiziert worden; vgl. Small 1980, S.193–196 und Appendix B).Google Scholar
  17. 262.
    Trotz nahezu gleichlautender Namen hat das hier beschriebene “Parser-Bulletin”, dessen Grundfunktion die Protokollierung der Parser-Historie ist, kaum Ähnlichkeit mit dem bulletin board des Standardmodells des Wortexperten-Parsing (vgl. Rieger/Small 1979, S.725). Dort dient es eindeutig als globales Medium für vielfältige Steuerungsinformationen des Wortexperten-Parsers und enthält Zustandsbeschreibungen jedes einzelnen Wortexperten, des gesamten Parsers und Details der inkrementell aufgebauten Wissensrepräsentationsstrukturen — es besitzt in dieser Hinsicht viel Ähnlichkeit mit dem aus dem Hearsay-System bekannten blackboard-Konzept (vgl. Erman et al. 1980). Ein solch globales Steuerungsinstrument widerspricht nicht nur Prinzipien der Aktorenspezifikation, sondern ist spezifikationstechnisch auch unnötig, da Wortexperten nur gezielt miteinander kommunizieren (vgl. die Ausführungen zum Aktorenmodell als lokales Berechnungsmodell, Kap. 2.3). Wesentlich ausgeprägter ist dagegen die konzeptionelle Nähe des “Parser-Bulletins” zur blackboard (verschieden vom gleichnamigen Konzept in Hearsay!), wie sie in einer theoretischen Vorphase der Wortexper-ten-Modellierung in Small 1978, S.16 beschrieben ist und insbesondere der auch für die hier entwickelte Modellvariante wichtige Effekt der Bedeutungs- und Inferenzkonditionierung für nachfolgende Prozesse durch die Protokollierung der Parser-Historie eine wesentliche Rolle spielt.Google Scholar
  18. 264.
    Eine genau korrespondierende Beschreibung würde die Einführung zusätzlicher Konstrukte aus dem Kalkül der conceptual representations verlangen (vgl. Yonezawa 1977, S. 17–35), ohne daß daraus ein spürbarer Darstellungsgewinn für die hier zu beschreibenden Phänomene resultieren würde.Google Scholar
  19. 268.
    Beim momentanen Stand der Modellierung des Wortexperten-Parsers wird auf jede Form phrasenstruktureller Analysen verzichtet. Dies soll keine prinzipielle Einschränkung sein, reflektiert jedoch die Arbeitshypothese, daß linguistisch relevante Ko-Okkurrenzbeziehungen primär semantisch motiviert sind (vgl.a. Rieger 1978, S.97–98).Google Scholar
  20. 275.
    Eine Variante dieser Spezifikation, die das abgeleitete Thema mehrerer Absätze berechnet, gibt Hahn 1990.Google Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 1990

Authors and Affiliations

  1. 1.Fakultät für Mathematik und InformatikUniversität PassauPassauDeutschland

Personalised recommendations