RDF-S3 und eRQL:
RDF-Technologien für
Informationsportale
Karsten Tolle und
Fabian Wleklinski
Inhalt
Speicherung:
RDF Source related Storage System (RDF-S3)
Anfrage:
easy RDF Query Language (eRQL)
Darstellung und Ranking der Ergebnisse
Ausgangspunkt
Dezentrale Speicherung
Agenten, Peer-Peer,
Alert-Systeme
Zentrale Speicherung
Datenbanken, ad-hoc Anfragen
Fehlende Quellinformationen
Im RDF Modell ist die Speicherung der Herkunft
der Daten nicht vorgesehen. Diese
Quellinformationen sind jedoch nützlich zur:
– Überprüfung der Daten (Aktualität)
– Bezug weiterer Informationen (HTML)
– Glaubwürdigkeit
Jeder kann beliebige Aussagen ins Internet stellen.
Glaubwürdigkeit
Stimmen die Angaben?
http://www.abc.com vom 23.09.2004
????
http://www.abc.com vom 23.09.2004
RDF-S3 Eigenschaften
Speicherung der Quellinformation zu jedem RDF
Tripel
Möglichkeit zum Löschen und Aktualisieren
einzelner Quellen
Optimierung durch Kombination der Generischenund Schemaspezifischen-Repräsentation der RDFDaten innerhalb der Datenbank
RDF-S3 Aufbau
hohe Datenqualität durch semantische
Überprüfungsfunktionen, die der integrierte
Validating RDF Parser (VRP) bietet
RDF-S3 Demo
Problem – Verständnis
Real-World-Beispiel:
– Zur Erzeugung dieser Präsentation wurde die Länge
der Tower Bridge gesucht
– Suche mit "Tower Bridge" length lieferte eine
Menge Ergebnisseiten, aber:
• Einheiten verschieden (z. B. “Fuß”) oder fehlend
• “Länge” einer Brücke?
– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?
– Zwei „Kontexte“ nötig: Einheit und Längendefinition
Problem – Verständnis
RDF Aussagen können oft nur in ihrem
Kontext verstanden werden
– Beispiel: Width of Golden Gate Bridge?
• 90!  90? 90 Meter, 90 Inch, 90 Feet?
rdf:comment
All units of measurements are in feet.
eRQL
Ziele
Ein-Wort-Abfragen
1. So einfach wie möglich!
2. Nutzung der Möglichkeiten
Dokumenten-Modus
durch die Speicherung der
Quellinformation!
3. Darstellung der Ergebnisse
PointOfInterest-Modus
in ihrem Kontext (siehe
Golden Gate Bridge Beispiel)!
Ein-Wort-Anfrage
SELECT ?s, ?p, ?o
WHERE
?s =~
„bridge“einsetzbar!
Sehr einfach
und ohne
Vorwissen
AND
?p =~ „bridge“
– Idee: nicht
komplizierter
als Google
AND ?o
„bridge“
Beispiel: Tripel,
die=~
„bridge“
enthalten
– eRQL: bridge ??????
– RQL: select * from [email protected]{Y} where
@P like "*[bB][rR][iI][dD][gG][eE]*"
or X like "*[bB][rR][iI][dD][gG][eE]*"
or Y like "*[bB][rR][iI][dD][gG][eE]*"
– RDQL:ähnlich wie RQL
• Perl ähnliche Notation
0: weglassen
1: einschränken
Dokumenten-Modus
Ermöglicht die Einschränkung auf ausgewählte
Quellen (oder das Weglassen nicht
vertrauenswürdiger Quellen)
Syntax: <Anfrage;Quellen-Liste;0|1>
– Beispiel: <bridge;3,4;1>
In RQL nicht vorgesehen!
In RDQL können in der from-Klausel
Einschränkungen definiert werden
– Aber kein gezieltes Weglassen
PointOfInterest-Modus
Gibt den internen Kontext (umgebener RDF
Graph) der einzelnen Treffer mit an
– Ergebnisse können besser verstanden werden (siehe
Golden Gate Bridge)
Die Größe des zu zeigenden Kontextes wird in der
Anfrage definiert
Beispiel:
[bridge]
bridge
~ bridge
~~ bridge
ohne Kontext
Kontextgröße 1 (default)
Kontextgröße 2
Kontextgröße 3 ...
eRQL  PointOfInterest
eRQL erweitert Fundstellen zu “POIs”
– benachbarte Aussagen werden hinzugefügt
• z. B. “comment” zu “Golden Gate Bridge”
s:name
Golden Gate Bridge
s:width
s:widthofsidewalk
10.5
rdf:comment
All units of measurements are feet.
90
eRQL  PointOfInterest
POIs werden auch für Sub-Queries gebildet
– "Golden Gate Bridge" OR "Tower Bridge"
s:name
s:length
90
Golden Gate Bridge
s:width
s:name
Tower Bridge
268
eRQL  PointOfInterest
POIs werden auch für Sub-Queries gebildet
– "Golden Gate Bridge" AND width
• POIs für “Golden Gate Bridge” und “width” werden gebildet
• Vereinigung der POIs, falls diese überlappen, sonst leer
• übereinstimmend mit “Google-Query”
s:name
90
s:width
Golden Gate Bridge
eRqlEngine
eRQL-Prototyp
– kein Datenbank-Backend
• arbeitet mit RDF-Dateien
• einfache Installation
Details und Download:
– www.dbis.informatik.unifrankfurt.de/~tolle/RDF/eRQL/
– www.wleklinski.de/rdf/
eRQL Demo
Zusammenfassung
RDF-S3 und eRQL bieten:
Überprüfbare Daten  mehr Glaubwürdigkeit
Antworten mit Kontext  mehr Verständnis der
Ergebnisse
Anfragen können auf ausgewählte Quellen
eingeschränkt werden  bessere Ergebnisse
sehr einfach  kann ohne Vorwissen genutzt
werden (wichtig für Portale)
Zukünftige Ziele
Steigerung der Performance von RDF-S3
und eRQL
Weitere nützliche Anfragemöglichkeiten
untersuchen
Verbesserung der Ergebnisdarstellung
Versionsunterstützung für Quellen unter
RDF-S3
...
Danke für die Aufmerksamkeit
Fragen?
Weitere Infos und Downloads:
http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/
Kontakt:
Karsten Tolle: [email protected]
Fabian Wleklinski: [email protected]

GI 2004