Ontologie (Informatik)
aus Wikipedia, der freien Enzyklopädie
Unter einer Ontologie versteht man in der Informatik im Bereich der Wissensrepräsentation ein formal definiertes System von Begriffen und Relationen. Zusätzlich enthalten Ontologien Inferenz- und Integritätsregeln, das heißt, Regeln der Schlussfolgerung und zur Gewährleistung ihrer Gültigkeit. Der wohl bekannteste Definitionsversuch stammt von T. Gruber. Dieser bezeichnet Ontologien als "explizite formale Spezifikation einer gemeinsamen Konzeptualisierung (Begriffsbildung)".[1]
Diese Übersetzung des bekanntesten Definitionsversuchs stimmt nicht mit dem englischen Text des als Quelle genannten Artikels überein. Dort wird zwar gelegentlich von shared ontologies geredet aber nicht von ontologies as shared conceptualization. Das Orginalzitat lautet An ontology is an explicit specification of a conceptualization. - Vielleicht ist die eigentliche Quelle dieser Übersetzung eine Interpretation dieser Definition. Es ist unter Umständen sinnvoll dann auf diese zu verweisen und nicht auf Gruber.
Ontologien haben mit der Idee des „Semantic Web“ in den letzten Jahren einen Aufschwung erfahren. Eine allgemeine Definition des Begriffes „Ontologie“ ist schwierig, da je nach Autor verschiedene Systeme darunter subsumiert werden. So lassen sich mehrere bereits länger existierende Formate und Ansätze wie Frames und Semantische Netze aus der Künstlichen Intelligenz oder Klassifikationen und Thesauri aus der Dokumentationswissenschaft wahlweise als Vorläufer, Alternativen oder als spezielle Formen von Ontologien auffassen.
Ontologien dienen in verschiedenen Bereichen als Mittel der Strukturierung und zum Datenaustausch, um bereits bestehende Wissensbestände zusammenzufügen – beispielsweise genetische Daten in der Bioinformatik. Experten aus verschiedenen Gebieten widmen sich der Modellierung ihres jeweiligen Spezialwissens und notwendiger Inferenzprozesse, so dass auf dieser Basis deklaratives Wissen, Problemlösungstechniken und Schlussfolgerungsmechanismen von mehreren Systemen geteilt werden können.
Der große Unterschied zur Taxonomie ist der, dass die Ontologie ein Netzwerk von Informationen mit logischen Relationen darstellt, während die Taxonomie eine hierarchische Untergliederung bildet.
Eine Ontologie ist vergleichbar mit einem UML-Klassen-Diagramm. Dieses modelliert nach dem Konzept der objektorientierten Softwareentwicklung einzelne Klassen, deren Eigenschaften sowie die Beziehungen zwischen den verschiedenen Klassen. Ontologien haben die gleiche Aufgabe. Es werden jedoch keine Softwareklassen modelliert, sondern einzelne Begriffe.
Inhaltsverzeichnis |
[Bearbeiten] Ontologiesprachen
Formale Sprachen zur Beschreibung von Ontologien sind unter Anderem RDF-Schema, DAML+OIL, F-Logic, die vom World Wide Web Consortium für das semantische Web propagierte Web Ontology Language (OWL), die Web Service Modeling Language (WSML) und die unter ISO/IEC 13250:2000 normierten Topic Maps. Auch das Knowledge Interchange Format (KIF) wird gelegentlich benutzt.
[Bearbeiten] Geschichte
Ursprünglich ist Ontologie als Lehre vom Seienden eine philosophische Disziplin und Teil der Metaphysik.
Als Vorläufer einer expliziten Formalisierung des Ontologiebegriffs sind Charles S. Peirce und Edmund Husserl zu nennen. Eine formale Sicht auf die philosophische Ontologie hatte auch Alonzo Church 1958 (Ontological Commitment, in: The Journal of Philosophy, 55:1008-1014), sowie Willard Van Orman Quine. Quine hat einen Ontologiebegriff vorgetragen, der mit der Tradition der klassischen Auffassung des Ontologiebegriffs in der Philosophie brach. Nach Quine ist Sein: Wert einer gebundenen Variable zu sein. (Einschlägige Texte sind Von einem logischen Standpunkt, engl. Orig. 1961 und Ontologische Relativität, engl. Orig. 1969). In Unterwegs zur Wahrheit findet sich folgende Darstellung: "Empirisch von Belang sind an einer Ontologie ausschließlich die besagten neutralen Knoten, die sie zur Struktur der Theorie beiträgt." (W.V.O.Quine, Unterwegs zur Wahrheit, §13 Auflösung der Ontologie, Paderborn u.a. 1995, S.45.). Siehe auch Stellvertreterfunktion.
Im Bereich der künstlichen Intelligenz wurde der Begriff „Ontologie“ ab Anfang der 1990er durch einen Artikel von Neches et al.[2] und nachfolgende Publikationen[1] populär.
Von da an hat sich der Begriff „Ontologie“ als explizite Formalisierung ausgebreitet, wurde in der Künstliche-Intelligenz-Forschung verwendet und von der Bioinformatik (Ashburner 2000) und weiteren Fächern aufgegriffen.
1999 stellte Tim Berners Lee seine Vision des Semantic Web vor. Heute am häufigsten zitiert ist Berners Lee 2001.
[Bearbeiten] Aufbau von Ontologien
Analog zu einer Datenbank, wo Struktur (Datenbankschema) und Inhalt (Daten) ein Ganzes bilden, gehören auch bei einer Ontologie die Regeln und die Begriffe zusammen. Während klassische Datenbanken keine Informationen über die Bedeutung der gespeicherten Daten haben, besitzen auf Ontologien beruhende Datenbankanwendungen eine formale Beschreibung der Daten sowie Regeln über deren Zusammenhang. Diese Regeln erlauben es, Rückschlüsse aus den vorhandenen Daten zu ziehen, Widersprüche in den Daten zu erkennen und fehlendes Wissen selbständig aus dem Vorhandenen zu ergänzen. Diese Rückschlüsse werden durch Inferenz abgeleitet, also durch logisches Folgern.
Unter „Ontology learning“ (vielleicht mit „ontologisches Lernen“ zu übersetzen) kann der Prozess beschrieben werden, bei dem eine Ontologie durch automatische Verfahren weiteres Wissen akquiriert und dadurch weiter an Umfang und Struktur zunimmt. Dafür spielen Inferenzen eine wichtige Rolle. In diesem Prozess erzeugt die Ontologie gewissermaßen selbst Wissen, während Ontologien sonst durch Input seitens menschlicher Experten hinzulernen.
Von der Möglichkeit von Relationen über Relationen (in RDF als Reification bezeichnet) und Regeln wird unter anderem aufgrund ihrer Komplexität in der Praxis relativ selten Gebrauch gemacht, obwohl gerade diese Merkmale Ontologien von anderen Begriffssystemen unterscheiden.
[Bearbeiten] Bestandteile
Begriffe (im Englischen: "concepts", manchmal auch unscharf als „Konzepte“ ins Deutsche übersetzt)
Die Beschreibung gemeinsamer Eigenschaften wird als Begriff definiert. Begriffe werden auch als Klassen bezeichnet. Diese können in einer Klassenstruktur mit Über-und Unterklasse angeordnet werden (z.B. der Begriff „Stadt“ oder „Land“)
Instanzen
Instanzen repräsentieren Objekte in der Ontologie und stellen das zur Verfügung stehende Wissen dar. Diese werden anhand vorher definierter Begriffe erzeugt und auch als Individuals bezeichnet (z.B. München oder Deutschland).
Relationen
Instanzen vom gleichen Typ, müssen an verschiedene Gegebenheiten angepasst werden. Dazu werden Relationen verwendet, die beschreiben, welche Beziehungen zwischen den Instanzen bestehen, (z.B. Stadt München liegt in Land Deutschland). Relationen werden auch als Eigenschaften bezeichnet.
Vererbung
Es ist möglich, Relationen und Eigenschaften der Begriffe zu vererben. Dabei werden alle Eigenschaften an das zu vererbende Element weitergegeben. Mehrfachvererbung bei Begriffen ist grundsätzlich möglich. Durch den Einsatz von Transitivität können Instanzen in einer Bottom-Up-Hierarchie aufgebaut werden. Dabei spricht man von Delegation.
Axiome
Axiome sind Aussagen innerhalb der Ontologie, die immer wahr sind. Diese werden normalerweise dazu verwendet, Wissen zu repräsentieren, das nicht aus anderen Begriffen abgeleitet werden kann (z.B. zwischen Amerika und Europa existiert keine Zugverbindung).
[Bearbeiten] Ontologietypen
Grundsätzlich unterteilt man Ontologien in zwei Typen: lightweight-Ontologien beinhalten Begriffe, Taxonomien und Beziehungen zwischen Begriffen und Eigenschaften, welche diese beschreiben. heavyweight-Ontologien sind eine Erweiterung von lightweight-Ontologien und fügen diesen Axiome und Einschränkungen hinzu, wodurch die beabsichtigte Bedeutung einzelner Aussagen innerhalb der Ontologie klarer wird.
[Bearbeiten] Ontologiebau
Eine Ontologie ist abhängig davon, wer diese einsetzt. Beispielsweise kann es bei einer Ontologie über Weine für ein Restaurant wichtig sein, auch passende Speisen zu den Weinen in der Ontologie aufzunehmen. Ist der Benutzer dagegen ein Weinabfüller, dann dürfte der Bereich der Speisen völlig uninteressant sein. Dagegen ist es für den Abfüller wichtig, welche verschiedenen Glas- und Flaschensorten existieren.
Zur Erstellung und Erweiterung von Ontologien wurden verschiedene formalisierte Prozessabläufe vorgeschlagen. Die Verfahren nach Holsapple und Joshi, nach Gómez-Pérez oder Uschold widmen sich verstärkt der Zusammenarbeit von Experten des Wissensgebietes der Ontologie und Informatikern oder allgemeiner Formalisten. Automatisch unterstützende Verfahren haben entweder das Ziel, eine vollständige Konstruktion der Ontologie vorzunehmen (wie etwa das Verfahren von Mädche) oder bestehende Ontologien durch Begriffsvorschläge zu erweitern (beispielsweise das Verfahren von Faatz und Steinmetz). Bei der Erstellung von Ontologien kann auch die Verschmelzung bestehender Ontologien von Interesse sein. Hierzu gibt es ein formales Verfahren nach Stumme und Mädche.
[Bearbeiten] Beispielontologie
Die folgende Abbildung zeigt das Funktionsprinzip einer Ontologie. Die obere Ebene zeigt die Ontologie, welche Begriffe und Relationen enthält. Begriffe werden durch Ellipsen dargestellt und Relationen durch Pfeile. Die Rechtecke stellen einfache Container für Informationen dar. Die Relationen verbinden zwei Konzepte miteinander und schränken diese gleichzeitig ein, beispielsweise muss ein Künstler ein Kunstwerk erzeugen.
Begriffe können zur Vererbung herangezogen werden. Aus diesem Grund besitzen die Maler und Bildhauer ebenfalls die Relationen Name und Vorname. Der dicke Pfeil kennzeichnet die Vererbung. Die beiden Relationen "schlägt" und "malt" sowie "gemaltVon" und "geschlagenVon" sind vererbte Relationen von "erzeugt" und "hergestelltVon". Die ursprünglichen Relationseigenschaften bleiben dabei erhalten, können jedoch erweitert werden.
Die Relationen malt und gemaltVon besitzen inverse Beziehungen zueinander, wodurch weitere Logik in die Ontologie integriert wird, die es ermöglicht, dass von einem Maler auf seine Kunstwerke und umgekehrt, von einem Bild zum Maler, geschlossen werden kann.
Die untere Ebene der Abbildung zeigt Instanzen der Ontologie. Diese werden durch einen schwarzen Punkt dargestellt. Das Kürzel (I1) steht dabei für den einmaligen Ressourcennamen der Instanz. Im Semantischen Web wird eine URI zur Kennzeichnung verwendet. Eine Besonderheit besitzt die Instanz des Malers Raffaelo Santi. Dieser verwendet bereits existierende Instanzen, nämlich I3 vom Typ Ölzeichnung und I6 vom Typ Galleria dell’Accademia.
[Bearbeiten] Ontologie-Editoren
Verschiedene Software-Werkzeuge unterstützen die Konstruktion von Ontologien in diversen Ontologie-Sprachen. Siehe Hauptartikel Ontologie-Editor.
[Bearbeiten] Kategorisierung von Ontologien
[Bearbeiten] Nach der internen Struktur
- Kontrolliertes Vokabular
- Glossare
- Thesauri: Objekte werden beliebig miteinander in Beziehung gesetzt (z. B. „A ist ein B“, „A ist verwandt mit B“).
- informelle "ist-ein"-Hierarchien (Taxonomie und Klassifikationen: Objekte werden streng hierarchisch klassifiziert (z. B. „A ist Kind von B“). Taxonomien werden häufig durch Bäume visualisiert.)
- formale "ist-ein"-Hierarchien
- Frames – schließen Klassen und deren Eigenschaften ein
- Ontologien, die Wertvorgaben enthalten (Ankunftsdatum ist ein DATUM)
- Logik-Richtlinien oder auch Logisch-mathematische Repräsentation: Objektbeziehungen werden über formale Notationen dargestellt (z. B. „
synonym(a, b) := synonym(b, a);
“). Die Prädikatenlogik der ersten Stufe (first order logic) ist ein formales Modell einer Logik.
[Bearbeiten] Nach ihrem Gegenstand
- Wissensrepräsentationen (Knowledge Representation – KR)
- Allgemeine (engl. common) Ontologien
- Top-level- bzw. Upper-level-Ontologien - siehe w:Upper ontology (computer science)
- Domänen-Ontologien: Beim Wissensbereich (Wissensdomäne), aus dem die Begriffe und Relationen der Ontologie stammen, gibt es unterschiedliche, oftmals komplementäre Typen:
- eine Ontologie kann den Versuch darstellen, Allgemeinwissen oder umfassendes und möglicherweise alltägliches Weltwissen abzubilden,
- eine Ontologie kann einen eingeschränkten, fachspezifischen Wissensbereich abbilden.
- Task (Aufgaben)-Ontologie
- Domain-Task-Ontologie
- Methoden-Ontologie
- Anwendungs-Ontologie
Üblicherweise bilden Ontologien eine statische Beschreibung einer Domäne ab. Bestimmte Ontologien versuchen aber auch, zeitliche Abläufe zu formalisieren, wie z.B. die in KIF geschriebene PSL (Process Specification Language).
[Bearbeiten] Siehe auch
- Gerichteter azyklischer Graph, eine Repräsentationsmöglichkeit von Ontologien
- Ontologiebibliothek
- CIDOC Conceptual Reference Model, eine Ontologie für Begriffe und Informationen im Bereich des Kulturerbes
[Bearbeiten] Quellen
- ↑ a b T. R. Gruber: A translation approach to portable ontologies. In: Knowledge Acquisition, Band 5, Nummer 2, Seite 199-220, 1993 [1]
- ↑ Robert Neches, Richard Fikes, Tim Finin, Thomas Gruber, Ramesh Patil, Ted Senator, William R. Swartout: Enabling technology for knowledge sharing. In: AI Magazine, Band 12, Nummer 3, 1991 [2]
[Bearbeiten] Literatur
- Steffen Staab und Rudi Studer (Hg.), Handbook on Ontologies, Springer Verlag, Heidelberg, 2004
- Siegfried Handschuh und Steffen Staab (Hg.), Annotation for the Semantic Web, IOSPress, Amsterdam, 2003
- Clyde W. Holsapple und K. D. Joshi, A collaborative approach to ontology design, Communications of the ACM, Volume 45, Issue 2 (February 2002), S. 42–47, 2002, http://portal.acm.org/citation.cfm?id=503147
- Asunción Gomez-Perez, Mariano Fernández-Lopez und Oscar Corcho, Ontological Engineering, Springer Verlag, 2004
- Mike Uschold und Michael Grüninger, Ontologies: principles, methods, and applications, 1996, S. 93–155, Knowledge Engineering Review, Vol. 11, Nr. 2, http://citeseer.ist.psu.edu/uschold96ontologie.html
- Alexander Mädche, Ontology Learning for the Semantic Web, Kluwer Academic Publishers, 2002
- Tim Berners-Lee, Ora Lassila, James Hendler: The Semantic Web. In: Scientific American, May/2001
- Zum Verfahren von Faatz und Steinmetz und zur Evaluation automatischen Ontologiebaus: ftp://ftp.kom.e-technik.tu-darmstadt.de/pub/papers/FHSS01-paper.pdf und http://olp.dfki.de/ecai04/final-faatz.pdf
- Barry Smith, et al. Relations in Biomedical Ontologies. In: Genome Biology, 2005/6/5: http://genomebiology.com/2005/6/5/R46
- Barry Smith und Bert Klagges, Philosophische Dimensionen der biomedizinischen Forschung, Allgemeine Zeitschrift für Philosophie 30: 1 (2005), 5–26, http://ontology.buffalo.edu/bio/Lebensformen.pdf.
[Bearbeiten] Weblinks
- Literatur über Ontologie (Informatik) in Bibliothekskatalogen: DNB, GBV (Wissensverarbeitung)
- Literatur über Ontologie (Informatik) in Bibliothekskatalogen: DNB, GBV (Wissensbasis)
[Bearbeiten] Grundlegendes zu Ontologie
- What is an Ontology? "An ontology is a specification of a conceptualization." (Tom Gruber)
- Lexikoneintrag zu Ontologie auf der Web-Site der Deutschen Gesellschaft für Informatik
- Buffalo Ontology Site
- Barry Smith's Ontology Page
- National Center for Ontological Research
- Institute for Formal Ontology and Medical Information Science
[Bearbeiten] Biomedizinische Ontologie
- Research Group: Ontologies in Medicine IMISE, Universität Leipzig
- Ontologies at the MPI for Evolutionary Anthropology
- Gene Ontology Consortium
- Gene Ontology Database
- Ontologiesammlung der Enzymdatenbank BRENDA
- National Center for Biomedical Ontology
[Bearbeiten] Anwendungen
- Semantische Wikipedia
- KAON2 OWL-DL und 'DL-safe rules' Inferenzmaschine
- MyTrip blog and guide - Ontologie-basierter Reiseführer
- protégé: Grafischer Ontology-Editor (Open Source)
- CIDOC Conceptual Reference Model: Ontologie für Begriffe und Informationen im Bereich des Kulturerbes (engl.)
- Jena – A Semantic Web Framework for Java (engl.)