Intelligente Informations- und Kommunikationssysteme
English version deutsche Version

Wissensrepräsentation mit Mehrschichtigen Erweiterten
Semantischen Netzen 
Hermann Helbig

hermann.helbig@fernuni-hagen.de
In dieser kurzen Präsentation wird das Wissensrepräsentationsparadigma der mehrschichtigen erweiterten semantischen Netze (das sogenannte MultiNet-Paradigma) beschrieben. Die wesentlichen Komponenten dieses Wissensrepräsentationssystems, das aus der älteren Version MESNET hervorgegangen ist, und deren Beziehungen zu den Sprach- und Wissensverarbeitungs-Prozessen sind in Abb. 1 dargestellt.

Infeb
Abb. 1: Einbettung der Darstellungsmittel in die Wissensverarbeitungskomponenten
Den Kern der Wissensbasis bildet ein semantische Netz (SN), dessen Knoten Begriffe und dessen Kanten Beziehungen zwischen den Begriffen (genauer: Relationen und Funktionen) repräsentieren (s. hierzu auch die Werkbank für den Wissensingenieur MWR). Die Knoten sind bestimmten Sorten eines vorgegebenen Klassifikationssystems, einer sogenannten Ontologie, zugeordnet und werden entsprechend verschiedener semantischer Dimensionen durch Merkmale und deren Werte charakterisiert.

Die Ontologie von vordefinierten Sorten zeigt die Abb. 1a (entsprechend der oberen Schicht aus der Hierarchie von MultiNet-Konzepten, die durch die Relationen SUB und SUBS definiert wird):

Ontology Sorts
Abb. 1a: Ontologie der Sorten (die obere Begriffsschicht der Konzepte in MultiNet)
Jeder Begriff ist mit immanentem Wissen verbunden (siehe auch Ebene I in Abb.1), das den Begriff in seiner Bedeutung definiert, und mit situativem Wissen (siehe auch Ebene II in Abb.1), das der Verwendung des Begriffs bei der Charakterisierung bestimmter Situationen entspricht. Die Relationen (Ebene III in Abb.1) und Funktionen (Ebene IV in Abb.1) entstammen einem festen Repertoire von semantischen Darstellungsmitteln (Beispiel s. Relation CAUS) und können selbst wieder als Knoten von abstrakten Begriffsnetzen aufgefaßt werden, deren Bedeutung durch Axiome festgelegt wird. Dabei unterscheiden wir R-Axiome (Ebene V in Abb.1), die keine Repräsentanten natürlichsprachlicher Begriffe enthalten, und B-Axiome oder Bedeutungspostulate (Ebene VI  in Abb.1), in denen Begriffsrepräsentanten als außerlogische Konstante vorkommen. Beispiele für solche Axiome finden sich in der Beschreibung der Kausalbeziehung CAUS in Abb. 2. Der Zusammenhang zwischen CAUS und Konzepten, wie verursachen oder bewirken, würde jeweils über ein B-Axiom in Ebene VI zu spezifizieren sein. Darüber hinaus werden aus darstellungsökonomischen Gründen Axiomenschemata eingesetzt (Ebene VII in Abb.1), die ganze Klassen von Axiomen der Ebenen V und VI beschreiben und auch Ausdrucksmittel der Prädikatenlogik höherer Stufe verwenden. Die Unterteilung in immanentes und situatives Wissen wird mit den Methoden der Schichtenbildung und Kapselung erreicht.
Für die Beschreibung der Darstellungsmittel von MultiNet gibt es eine umfangreiche Dokumentation. Abb. 2 vermittelt einen Eindruck von der Methodik nach der die etwa hundert Relationen und Funktionen von MultiNet beschrieben werden. Diese digital verfügbaren Beschreibungen stehen auch als Online-Hilfe in den Werkzeugen für die Wissensverarbeitung zur Verfügung.

CAUS: Kausalbeziehung, Relation zwischen Ursache und Wirkung
CAUS:  si' × si'    (Signatur stützt sich auf Sorten der Begriffsontologie)
Definition
Die Relation (s1 CAUS s2) gibt an, daß die reale Situation s1 Ursache für die reale Situation s2 ist.1  s2 ist die tatsächlich von s1 hervorgerufene Wirkung. Die Relation CAUS ist transitiv, asymmetrisch und nicht reflexiv.
Mnemonik
cause - Ursache
Fragemuster
{Warum/Wieso/Weshalb/Weswegen} <s2>?
{Woran/An <WM>} {[sterben]/[leiden]/[erkranken]/...} <d>?
Wodurch [verursacht werden] <s2>?
Worin liegt die Ursache für <s2>?
Welche Wirkung {hat/hatte} <s1>?
{Dank/Aufgrund} <WS> <s1> {[geschehen]/[eintreten]/...} <s2>?
Kommentar
Die Kausalitätsbeziehung steht in engem Zusammenhang zur Zeitrelation ANTE, da die Wirkung zeitlich nicht vor der Ursache liegen kann:
(x CAUS y) rightarrow  ¬(y ANTE x)   (1)
Zwischen den Relationen CSTR und CAUS besteht folgende Beziehung:
(s1 CSTR d) rightarrowexist s2 ([(s2 AGT d)or (s2 INSTR d)] and(s2 CAUS s1))  (2)
Als typisch für die Beschreibung einer Kausalbeziehung kann der Satz 3 unten angesehen werden. Er macht deutlich, daß durch CAUS im Gegensatz zu COND (Konditionalbeziehung) und IMPL (Implikation) immer faktische Sachverhalte, die durch das Merkmal [FACT = real] gekennzeichnet sind, miteinander verknüpft werden.
  • [1] "[Die Erregung] (caus, arg2) über [das ungewöhnliche Ereignis] (caus, arg1) ."
  • [2] "[Peter leidet] (caus, arg2) [an Gastritis] (caus, arg1) ."
  • [3] "Weil [Peter über die Straße lief,] (caus, arg1) [wurde er von einem Auto überfahren] (caus, arg2) . "



Caus


Abb. 2: Typisches Beschreibungsschema für eine Relation des MultiNet-Paradigmas

Wichtig für Wissensrepräsentationssysteme der KI, deren Wissensinhalte automatisch aus natürlichsprachlichen Informationen erschlossen werden sollen, ist die Verbindung der Bedeutungsrepräsentanten (Knoten des semantischen Netzes) mit den Wörtern der natürlichen Sprache. Diese Schnittstelle wird durch das Wörterbuch oder Lexikon gebildet (Ebene VIII in Abb.1), dessen semantische Komponenten (insbesondere die Valenzen der Verben, Adjektive und Nomen) ebenfalls mit den Darstellungsmitteln des semantischen Netzes formuliert werden (s. Werkbank für den Computerlexikographen LIA). Dadurch erhält man eine einheitliche Darstellungsform für sprachliches Wissen und "Weltwissen" (Erfüllung des sog. Homogenitätskriteriums).

SN-Dimens
Abb. 3: Einbettung von Begriffsrepräsentanten in einen mehrdimensionalen Merkmalsraum


Zur Einordnung von Objekten, Situationen, Lokationen und Zeiten2 in einen mehrdimensionalen Raum von Merkmalen wird das Komplexmerkmal LAY (abgekürzt von "layers" - Schichten) benutzt. Letzteres umfaßt die Submerkmale: Generalisierungsgrad GENER, Faktizität FACT, Referenzdeterminiertheit REFER, Variabilität VAR, intensionale Quantifikation QUANT, Extensionalitätstyp ETYPE und (extensionale) Kardinalität CARD, die es gestatten, Begriffsrepräsentanten nach epistemologisch relevanten Gesichtspunkten zu klassifizieren und bestimmten Begriffsschichten zuzuordnen. Beispiele für die Einbettung von Konzepten in den durch diese Charakterisierungen aufgespannten Merkmalsraum sind in Abb. 3 angegeben.
Die Vorstellung von "Schichten" in MultiNet steht in Analogie zu den Gegebenheiten im n-dimensionalen Euklidischen Raum. Wenn man dort entlang einer bestimmten Dimension einen Wert festhält (z.B. den Wert der z-Koordinate in einem dreidimensionalen Raum von Koordinaten x, y, z), dann erhält man eine (n-1)-dimensionale Ebene (im Beispiel eine Fläche parallel zur x-y-Ebene). Ähnlich ergibt sich durch Festhalten des Wertes eines bestimmten Layer-Merkmals (z.B. [GENER = ge]) die Ebene (Schicht) der generischen Begriffe, durch Festhalten des Wertes [FACT = hypo] erhält man die Ebene (Schicht) der hypothetisch angenommenen Sachverhalte bzw. der hypothetischen Objekte und durch Fixierung von [ETYPE = 1] und [GENER = ge] wählt man alle Kollektivbegriffe (hierzu gehört z.B. Gebirge, Vieh) aus usw.

Zur Darstellung des Bedeutungsumfangs eines Begriffes benötigt man besondere Ausdrucksmittel, da es anderenfalls nicht möglich wäre, in einem semantischen Netz anzugeben, welche relationalen Verbindungen (Kanten) einen bestimmten Begriff definieren und welche lediglich auf den Begriff Bezug nehmen. In MultiNet geschieht die Eingrenzung des Begriffsumfangs durch das Konzept der Begriffskapsel und ihrer Komponenten (vgl. Abb. 4 a). In der bildlichen Darstellung wird eine solche Kapsel durch ein abgerundetes Rechteck dargestellt, das entsprechend der verschiedenen Begriffskomponenten in mehrere Teile untergliedert ist.
In erster Instanz sind zwei verschiedene Bedeutungsanteile hervorzuheben:

Kapsel
Abb. 4: Die verschiedenen Bedeutungskomponenten eines Begriffs


Zur Erläuterung soll der Begriff Haus herangezogen werden (vgl. Abb. 4b): Daß ein Haus bestimmte Teile (wie <ein Dach>, Mauern usw.) besitzt und ein Gebäude ist, kann als immanentes Wissen angesehen werden. Daß sich Peter ein Haus gekauft hat oder daß Häuser in München wieder teurer geworden sind, gehört nicht zum immanenten Anteil des Begriffsumfangs von Haus, sondern zum situativen Wissen, in dessen Beschreibung der Begriff Haus vorkommt.

Innerhalb des immanenten Wissens lassen sich wiederum zwei verschiedene Anteile voneinander trennen und zwar ein kategorischer Anteil (diese Komponente ist im Bild dunkel schattiert und mit einem K gekennzeichnet) und ein prototypischer Anteil , auch Default-Anteil genannt, der aber a priori nur bei generischen Begriffen auftritt (diese Komponente ist im Bild hell schattiert und mit einem D gekennzeichnet).3 Das wesentliche Unterscheidungsmerkmal dieser Komponenten bezieht sich auf die inferentiellen Prozesse, die mit den verschiedenen immanenten Wissensanteilen verknüpft sind. Der kategorische Teil des Bedeutungsumfangs eines generischen Begriffs wird strikt (d.h. ohne Ausnahme) auf alle Unterbegriffe und subordinierten Spezialisationen vererbt (Träger dieser Vererbung sind die Relationen SUB und SUBS). Aus logischer Sicht sind also die Merkmalsaussagen des kategorischen Anteils mit einer Allquantifizierung verbunden. Wenn man die Darstellung in Abb. 4 für den Begriff Haus zum Ausgangspunkt nimmt, bedeutet dies, daß jedes spezielle Haus (<eine Villa >,<ein Lagerhaus>, <Pauls neues Haus> usw.) ein Gebäude ist, ein Dach besitzt und durch ein Baujahr charakterisiert werden kann.

Demgegenüber ist der prototypische Anteil des Bedeutungsumfangs eines generischen Begriffs als Default-Wissen anzusehen, das kategorische Wissen wird in der Begriffshierarchie von oben nach unten vererbt. Dabei versteht man unter einem Default eine grundsätzliche Annahme, die so lange gilt, wie keine anderslautende Information vorhanden ist. Sie kann aber im Gegensatz zum kategorischen Wissen in Ausnahmefällen revidiert oder überschrieben werden.

So ist es z.B. sinnvoll, für ein Haus anzunehmen, daß es Fenster und Türen hat oder daß es einem Besitzer gehört. Man kann sich aber durchaus Häuser vorstellen, die keine Fenster oder Türen aufweisen (ein Lagerhaus ohne Fenster, ein Pueblo-Haus ohne Türen, dafür mit einer Einstiegsluke usw.). Auch kann ein Haus herrenlos geworden sein, d.h. keinen Besitzer mehr haben usw. Aus dem Gesagten wird deutlich, daß das kategorische Wissen mit strikt monotonen Schlußweisen verknüpft ist, wie sie in der klassischen Prädikatenlogik gelten, während das prototypische Wissen durch nicht-monotone Schlußweisen charakterisiert wird, für die das Default-Reasoning typisch ist.

Für das MultiNet-Paradigma stehen Software-Werkzeuge zur Verfügung, die wesentliche Aspekte des Wissensmanagement, nämlich die Wissensakquisition, die Wissensrepräsentation und die Wissensmanipulation, unterstützen. Zu diesen Werkzeugen gehören:

In den Präsentationen dieser Tools (über die markierten Links erreichbar) finden sich auch entsprechende Anwendungsbeispiele und Netzdarstellungen für natürlichsprachliche Ausdrücke. Eine der wichtigsten praktischen Anwendungen von MultiNet ist der Gebrauch als semantische Zwischensprache für die Informationsrecherche im Internet, realisiert unter anderem in dem Natürlichsprachlichen  Interface NLI-Z39.50.
Notes
(1) Der Merkmalswert [FACT = real] wird durch einen Strich am Sortensymbol symbolisiert. 
(2) Für die anderen Sorten treffen die nachstehend behandelten Charakteristiken nicht zu. 
(3) Der Terminus Default-Wissen erklärt auch die Abkürzung D für den prototypischen Wissensanteil. Durch Vererbung kann auch ein Individualbegriff Default-Wissen übertragen bekommen (das bei Hinzutreten neuer Information überschrieben werden darf).
Ausgewählte Publikationen

Publikationen des Lehrgebiets IICS



MultiNet MWR WOCADI (NatLink) VILAB NLI-Z39.50 HaGenLex / LIA

Hermann Helbig - Leiter des Lehrgebiets Intelligente Informations- und Kommunikationssysteme - FernUniversität Hagen