Ontologie-basierte Informationsnutzung
2. Kapitel aus dem Buch
Information Sharing on the Semantic Web
von Heiner Stukenschmidt und van Harmelen
Lehrgebiet: Multimedia und Internetanwendungen
(Univ.-Prof.Dr.-Ing. M.L. Hemmje)
Thema: Daten-, Informations- und Wissensmanagement im Internet
FernUniversität Hagen ws2006/07- Christina Sergel
1.0 Inhalt
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
1.0 Semantische Heterogenität
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
1.1 Semantische Heterogenität
• Konflikte durch semantische Heterogenität:
– Verwechslungskonflikte: Käfer = Auto oder Tier?
– Skalierungskonflikte: 3-Sterne Hotel = traumhaftes
Hotel?
– Namenskonflikte: Lehrer = Angestellter = Person
• Mangel für ein gemeinsames Verständnis:
– nicht eindeutig, dadurch
Kommunikationsschwierigkeiten
– Unterschiedliche Spezifizierungen für ein System
Ontologien als Lösung
2.0 Ontologien
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
2. Ontologien
1.
2.
3.
4.
Der Begriff Ontologie
Was sind Ontologien
Konzeptualisierung
Gemeinsam genutztes
Vokabular
5. Spezifikation des
Wissenskontexts
6. Sinnvolle Anwendungen
Bild: Zoologische Staatssammlung
München
2.1 Der Begriff Ontologie
• Disziplin der Philosophie
– die Lehre vom Sein.
• Im Kontext der Informationstechnologie
„An Ontology is a formal, explicit specification of a shared
conceptualization“
[Gruber,1993]
• besteht aus 4 Komponenten:
Konzepte, Instanzen Relationen, Axiome.
Bild: DERRIDA‘S MACHINES 2004:Polycontextural modelling of polysemy
2.2 Was sind Ontologien
• Ontologie als ein kontrolliertes Vokabular
Eine Menge von Begriffen mit sehr detaillierter und eindeutigen
Beschreibung. Einigung auf gemeinsame Sprache
• Ontologie als Taxonomien
hierarchisch strukturierte IST-EIN-Beziehung von Konzepten und
Begriffen: Branchenbuch,ISO-Nr.
• Ontologie & Schemata
–Schemata beschreiben die Definition von Bedingungen, zB Typen,
Schemata werden entworfen für eine spez. Applikation
• Web-Ontologie sind Taxonomien mit Inferenzregeln
Das Ziel ist ein bestimmtes Fachgebiet mit einer großen Community
zu konzeptualisieren.
Bild: Zoologische Staatssammlung München
2.3 Konzeptualisierung
• ein abstraktes Modell von
Konzepten und seinen
Beziehungen für ein
allgemein anerkanntes
Weltbild
• Ein Konzept ist eine
gedankliche Vorstellung über
ein reales Ding in der Welt.
• Eine explizite Spezifizierung
gibt den Konzepten und
Beziehungen des abstrakten
Modells explizit Namen und
Eigenschaften.
Semantisches Dreieck von Ogden et al.
2.4 Gemeinsam genutztes Vokabular
Eigenschaften von begrifflichen Ordnungssystemen [RWTH01]
Für ein gemeinsames Verständnis für Mensch und Maschine:
• Erstellung eines standardisierten und „kontrollierten“ Vokabulars,
das von allen Beteiligten allgemein anerkannt und genutzt wird.
• Vokabular muss einschränkend + spezifisch genug sein,
• hinreichend flexibel + so allgemein wie möglich,
• Disjunkt (Pizza<> Eis )und vollständig (Länder einer Welt)
Martin Pflüglmayer: Computerbasierte Terminologie:“Medizinische Ordnungssysteme,
Terminologien und Ontologien“; Aachen 2001
2.4.1 Commen Sense Knowledge CyC
Die CyC-Wissens-Pyramide
• hunderttausende Begriffe
• Formt eine Upper-Ontologie
• Seit April 2006 unabhängige
non-profit Organisation
OpenCyC
• Ontologisches Wissen +
passende Inferenzmechanismen
• Eigene CyCL-Sprache
Quelle: http://www.cyc.com/
2.5 Die Spezifikation des Wissenskontext
Rot (X)
dieser Apfel ist rot
karmesinrot ist ein rot
diese Person ist ein rot(er)
[Quelle:Guarino: The ontological Level ‚95]
• Wissen implementierungsunabhängig auf dem
Wissenslevel in einer Repräsentationsform
beschreiben
• Wissen implementierungsabhängig von
Programmiersprache und – konzepte spezifizieren.
2.5.1 Grad der Formalität
• Total informal: Lose formulierter Text
• Semi- informal
– Kontrolliertes Vokabular reduziert Mehrdeutigkeiten :Glossare
• Semi-formal
- mit Regelsystemen kann Wissen schnell und einfach in Regeln
ausgedrückt werden. Nachteil: Beschreibung komplexer Problembereiche
- Frames, ein Modell zur Darstellung von Konzepten, meist als OODatenmodell implementiert
- Semantische Netze, Knoten mit gerichteten Graphen
• Rigoros Formal
Prädikatenlogik mit verschiedenen Ableitungsregeln (HORN-Logik,
Resolutionskalkül, Transitivität,Inverse) ermöglicht automatische
Konsistenzüberprüfung und Inferenzfähigkeit: DL, TOVE, relationale
Datenbanken
Bild: D. Oberle, S. Staab, R Volz: Three Dimensions of Knowledge Representation in WonderWeb
2.5.2 Maß der Definitionstiefe
Kriterien: Ausdrucksstärke, Inferenzmächtigkeit und
Entscheidbarkeit
• XML: Syntax für strukturierte Dokumente, keine Semantik
• RDF: Datenmodell, dass Relationen zwischen Ressourcen
eindeutig mit URIs beschreibt
• RDFS: Stellt Mechanismen bereit, um Relationen zw.
Attributen und Ressourcen zu definieren.
• OIL: Ontology Interchange L.. Enthält entscheidbare
Fragmente der Prädikatenlogik (DL)
• OWL-L, OWL-DL, OWL-FULL
Bild: Fensel, van Harmelen:OIL:An Ontology Infrastructure for the Semantic
Web, 2001
2.6 Sinnvolle Anwendungsbereiche
Kommunikation
Information
Retrieval
Ontologie
Interoperabilität
Systemtechnik
2.6.1 Kommunikation
– Normatives Modell:
Ontologien als ein
gemeinsamer Wissensspeicher
(Archive, Gesetzestexte,
Regeln)
– Beziehungsnetzwerke:
Ontologien stellen
wirtschaftliche und soziale
Beziehungsnetze bereit
(FOAF) P2P-Systeme
– Konsistenz und
Mehrdeutigkeiten: konsistente
Ontologie durch Reasoners
– Integration von verschiedenen
Ansichten: ffPoirot
ONTOLOGIES: Principles,
Methods and Applications von
Mike Uschold & Michael
Gruninger ,1996
2.6.2 Systemtechnik
• Spezifikation: von Anforderungen für ein ITSystem (Dokumentation)
• Zuverlässigkeit: informale bzw. formale
Konsistenzüberprüfung
• Wiederverwendbarkeit: easy to re-use-Bibliothek,
Aufbau der Ontologie-Bibliotheken.
• Erweiterbarkeit, Offenheit: OntologieBibliotheken müssen erweiterbar sein
2.6.3 Interoperabilität
• Ontologien als Austauschformat (KIF)
Gemeinsam genutztes Vokabular erleichtert Interoperabilität
Quelle:ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger
,1996
2.6.4 Information Retrieval
• für die qualitative Suche
(informal und formal)
 besseres Verständnis
• Für die
Wissensgewinnung
• Ontologien für die
Evaluation von
Wissenssystemen
Content Management
Systeme (OntoWeb)
ONTOLOGIES: Principles,
Methods and Applications von
Mike Uschold & Michael
Gruninger ,1996
Ontologien in der Informationintegration
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
3.1 Welche Rollen haben Ontologien
• Repräsentation des Inhalts
Aufgabe der O. ist Wissensrepräsentation
– Single-Ontologie-Ansatz
– Multiple-Ontologie-Ansatz
– Hybrid-Ansatz
• Query-Modell
Zugriff auf die Wissensbasis
• Verifikation
Wartung der Integration und Extension
3.1.1 Single-Ontologie-Ansatz: SIMS
• Eine zentrale Ontologie
globale Sicht auf unterschiedl.
Sourcen
• Gemeinsam genutztes
Vokabular
• Vergleich d. O. einfach,
• Enge Kopplung
• Keine Wiederverwendung v. O.
• Anfällig für SourceÄnderungen
• Semantische Datenintegration?
Quelle: Tzi: methodolgies for OntologyBased Semantic Translation
sekt-d-4-2-2-SOA: Survey on ontology
Merging and Aligning
3.1.2 Multi-Ontologie-Ansatz:zB. OBSERVER
•Jede Informationsquelle hat seine
eigene Ontologie (lokal View)
•Kein gemeinsam genutztes
Vokabular  autonom
•Lose Kopplung, keine
ontologische Übereinstimmung
•Vereinfacht Integration
•Komplexität des O-Mapping
O(n2) 1:1-Mapping beim
OBSERVER,
worst case: one way Mapping
Quelle: Tzi: methodolgies for Ontology-Based
Semantic Translation; sekt-d-4-2-2-SOA: Survey
on ontology Merging and Aligning
.
3.1.3 Hybrid-Ansatz: z.B. COIN
• Jede Ressource hat seine eigene
Ontologie
• Aufgebaut aus dem global
gemeinsam genutzten Vokabular
• Neue Ressourcen können leicht
hinzugefügt werden
• Unterstützt Evolution und Erwerb
• Ontologien sind vergleichbar
• Query-Prozessing ist komplex
• Keine Wiederverwendung von O.
Quelle: Tzi: methodolgies for Ontology-Based
Semantic Translation; sekt-d-4-2-2-SOA: Survey on
ontology Merging and Aligning
3.2.0 Query-Modell
Zentrale Aufgabe von Ontologien:
• Inferenzen auf und Abfragen von Ontologien
– Abfrage auf Ontologiestruktur
– Abfrage von Fakten,
Kriterien für ein Query-Modell:
• Verständlichkeit: Abfrage mit O-Begriffen intuitiv? für
welche Aufgaben kann es genutzt werden? Antworten klar
und einfach ?
• Query Plan: klare Beschreibungen für jeden
Interaktionsschritt zwischen den Ontologien.
• Optimierung: kann die Abfrage dramatisch beschleunigen.
3.3.0 Verifikation
• Verifikation: nicht die Ontologie wird überprüft, sondern
die Korrektheit nach Mappings von Globalen zu lokalen
Ontologien und umgekehrt
• Validation einer Ontologie: in wieweit entspricht die
Ontologie dem Realitätsausschnitt, den sie abbilden soll
• Nur möglich bei formalsprachlicher Spezifikation, die
vollständig ist. (Query containment)
• Qualität der Überprüfung ist von der Vollständigkeit einer
Ontologie abhängig.
4.0 Framework für die Informationsnutzung
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
4.1 Framework für die ontologiebasierte
Informationsnutzung
2 prinzipielle Methoden für gemeinsame Nutzung von
Informationen:
• Retrieval
• Integration
mit standardisiertem Vokabular
Wiederverwendung von Ontologien
4.2 Infrastruktur eines Framework
• Architektur: Hybrid-Ansatz
• 3-Schichten Infrastruktur:
– Unterste Ebene: Daten,
Metadaten und Ressourcen
– Middleware-Ebene:
Mapping-Regeln, Verifikation,
Transformation, Queries,
Reformulierungen
– Oberste Ebene:
wiederverwendbare
Ontologien und gemeinsam
genutztes Vokabular
Quelle: M.Doerr: The CIDOC CRM, an
Ontological Approach to Schema Heterogeneity,
2005
5.0 Ontologische Vereinbarungen
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
5.1 Ontologische Vereinbarung
• Minimale
Kodierungsabweichung
Konzeptualisierung auf
der Wissensebene
• Minimal ontological
commitment:
• Zuviele Einschränkung 
begrenzt die Offenheit
• Zuwenige  erhöht
Inkonsistenz u. inkorrekte
Modulierung
Bild: Stuckenschmidt/Van Harmelen: Information Shraring 2003
5.2 Der Übersetzungsprozess
Ontologien
importieren
Ähnlichkeiten
finden
Mapping
spezifizieren
• Merging
• Mapping
• Ontology Aligning
Quelle: SEKT:D4.2.2 State-of-the-art survey on Ontology Merging and Aligning V2, 2003
6.0 Ontologie-Engineering
1.
2.
3.
4.
5.
6.
Semantische Heterogenität
Ontologien
Ontologien in der Informationsintegration
Framework für die ontologiebasierte Informationsnutzung
Ontologische Vereinbarungen
Ontologie-Engineering
6.0 Ontologie-Engineering
1. Zweck und Anwendungsbereich
identifizieren
2. Ontologie – Aufbau
1. Klassifizieren
2. Strukturieren ,
3. Integration von existierenden Ontologien
3.
4.
5.
6.
Validieren, Verifizieren
Verfeinern
Verwalten und Benutzbarkeit testen
Evaluieren
Bild: [Buitelaar: Human Language Technology for the
Semantic Web; 2005]
Ontologischer Lebenszyklus
6.0 Zusammenfassung
• Ontologien reduzieren semantische Heterogenität
• Domain-Ontologien erfassen und formalisieren semantikerhaltendes Wissen durch ein standardisiertes eindeutiges
Vokabular
• Applikations-Ontologien nutzen Ontologien für das
Wissensmanagement (ecommerce, Medizin, Umwelt,
Recht)
• Die Verwaltung von schwach-strukturierten Ressourcen
wird durch semi-automatisierte Übersetzung erleichtert

Sergel_Ontologie07