Grundkonzeption und Zusammenhang
mit XML
Fallstudie im Rahmen des Studienganges
„Wirtschaftsinformatik“
Christian Kleyer, Daniel Oyen, Svend Reuse
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 1
Struktur des Vortrages
1.
2.
3.
4.
Grundkonzeption SGML
Wirtschaftliche Bedeutung
Verwandtschaft zu anderen Sprachen
Fazit und Ausblick für die Zukunft
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 2
1.
Grundkonzeption SGML
1.1. Definition des Markups
Auszeichnung
erfolgt mittels
Auszeichnungsbefehlen –
sogenannten
„tags“.
Graphisches
Markup
Einleitung
TNR 16
Pkt. fett
TNR 14
Pkt.
TNR 10
Pkt.
25. Mai 2001
Kleyer/Oyen/Reuse
Kapitel
Generisches
Markup
Einleitung
Unterkapitel
Textabsätze
Folie 3
1.
Grundkonzeption SGML
1.1. Definition des Markups
• Vorteile des generischen Markups:
– Darstellung der selben Information auf verschiedenen Ausgabemedien
ohne Neuformatierung der Daten möglich.
– Hard- und Softwareunabhängigkeit der Daten gewährleistet.
– Problemloser Datenaustausch zwischen verschiedenen
Systemplattformen wird ermöglicht.
 Trennung von Struktur und Layout.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 4
1.
Grundkonzeption SGML
1.2. Definition des SGML-Standards
• Internationaler Standard (ISO 8879-1986) zur Beschreibung
von Dokumenten.
• SGML ist eine Metasprache.
– SGML stellt Vorschriften bereit, um Auszeichnungssprachen formal zu
definieren.
• SGML verwendet generisches Markup.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 5
1.
Grundkonzeption SGML
1.3. Historie von SGML
• In den 60er Jahren die ersten Ideen für ein generisches
Befehlskonzept (Tunnicliffe, Rice).
• Um 1970: Entwicklung von GML bei IBM (Goldfarb, Mosher,
Lorie).
• Weiterentwicklungen von GML führen 1980 zum ersten
funktionierenden SGML Standard.
• 1986: ISO 8879-1986
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 6
1. Grundkonzeption SGML
1.4. Aufbau von SGML-Dokumenten
• SGML Declaration
– Bestimmung der Syntax der Sprache
• Document Type Definition
– Definition der Regeln für den Aufbau von SGML-Dokumenten
(= die „Grammatik“ der Sprache)
• Dokumenteninstanz
– Inhalte und deren Auszeichnung (= das „eigentliche“ Dokument)
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 7
1. Grundkonzeption SGML
1.5. Grundbestandteile der Sprache
In der Dokumenteninstanz können drei Befehlstypen verwendet werden:
• Elements
• Attributes
• Entities
Stilsprache: Document Style Semantics and Specification Language
 sorgt für die grafische Darstellung eines strukturierten Dokuments
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 8
1. Grundkonzeption SGML
1.5. Grundbestandteile der Sprache
• Elements
– Jedes Dokument besteht aus vielen verschiedenen Elementen.
– Jedem Elementtyp wird ein Name zugewiesen (generic identifier)
– Jedes Element besteht aus start- und end-tag
Beispiel: <TITLE> Titel des Dokuments </TITLE>
Start-Tag
25. Mai 2001
generic identifier
Kleyer/Oyen/Reuse
End-Tag
Folie 9
1. Grundkonzeption SGML
1.5. Grundbestandteile der Sprache
• Attributes
– Parameter, der Informationen zu einem Element enthält
– werden dem start-tag beigefügt
Beispiel: <BODY FORMAT=“standard“ STATUS=“public“>
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 10
1. Grundkonzeption SGML
1.5. Grundbestandteile der Sprache
• Entities
– Einbindung von Objekten ins SGML-Dokument
Beispiel:
Definition in DTD:
<!ENTITY SGML “Standard Generalized Markup Language”>
Aufruf im Dokument:
<p>Hier wird die &SGML; erklärt.</p>
Ausgabe durch Parser:
Hier wird die Standard Generalized Markup Language erklärt.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 11
2. Wirtschaftliche Bedeutung
2.1. Allgemeine Vorteile (1)
•
•
•
•
•
•
•
•
Steigerung der Produktivität im Unternehmen
Wiederverwendbarkeit der Daten
Langlebigkeit der Daten
Verbesserte Datenintegrität
Bessere Datenkontrolle
Höhere Datenverteilbarkeit
Ermöglichung eines problemlosen Datenaustausches
Flexibilität der Datenausgabe
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 12
2. Wirtschaftliche Bedeutung
2.1. Allgemeine Vorteile (2)
Für Unternehmen geeignet, wenn Daten folgendes erfüllen:
• Langlebigkeit, z. B. 20 Jahre.
• Datenaustausch zwischen heterogenen Hard- und
Softwareumgebungen.
• Dokumente beinhalten Daten bzw. Informationen anderer
Abteilungen bzw. solche, die mehrere Abteilungen nutzen.
• Die Daten bzw. Informationen werden für die Ausgabe in
verschiedenen Dokumenten benötigt.
• Die Daten bzw. Informationen ändern sich häufig und werden
auch häufig benötigt.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 13
2. Wirtschaftliche Bedeutung
2.2. Verlagswesen
• Historisch bedingt: Trennung von Struktur und Inhalt
• Heutige Ziele:
– automatische Pflege des Contents
– Haltung der Daten in neutraler Form
– Generierung verschiedener Dokumente aus einer Quelle
• Formatgerechte Veröffentlichung von elektronischen
Dokumenten in jeder Umgebung
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 14
2. Wirtschaftliche Bedeutung
2.3. Industrie
• Gewachsene Strukturen bedingen verschiedene EDV Systeme
• Darstellung von Handbüchern, Regelwerken etc.
– Ohne Doppelerfassung und Redundanzen
– Mit adäquater Performance
– Leichte und schnelle Pflege des Contents, ohne umständlich das Layout
ändern zu müssen
 Prozessoptimierung durch die Anwendung einer integrierten
Metasprache.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 15
2. Wirtschaftliche Bedeutung
2.4. Internet & weltweiter Datenaustausch
• HTML als DIE Sprache des Internets
• Das gesamte WWW basiert letztendlich auf dem
Grundgedanken von SGML
• Weltweiter Datenaustausch
 Der Gedanke von Trennung in Inhalt und Layout hat auch das
Web geprägt
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 16
3. Verwandtschaft zu anderen Sprachen
3.1. Zeitlicher Ablauf
1985/6
SGML
HTML 1.0 – 3.0
Zeitstrahl
CSS 1.0 – 2.0
Ab 1992
HTML 4.0
XML
1996
XHTML
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 17
3. Verwandtschaft zu anderen Sprachen
3.2. HTML
•
•
•
•
•
HTML als Markup-Sprache des Netzes
Ein einziges DTD definiert diese Sprache (drei Ausprägungen)
Unterteilung in „body“ und „head“
Keine Erweiterung durch individuelle Definitionen möglich
CSS als „Zwischenlösung“ wegen der nicht strikten Trennung
von Struktur und Layout
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 18
3. Verwandtschaft zu anderen Sprachen
3.3. XML (1)
• XML als abgespeckte Version von SGML
• „Wie radikal die Einschnitte sind, mag man dem Umstand
entnehmen, dass die formale Definition von XML auf 33
Druckseiten möglich ist. SGML benötigt hierfür mehr als 500.“
(Macherius)
• Offene Sprache: Nutzer kann sich eigene „tags“ definieren
• Nur einige Markup-Sprachen von der W3C anerkannt
• Stilsprache: XSL, ist an DSSSL orientiert. Dient zur Umsetzung
von XML in HTML
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 19
3. Verwandtschaft zu anderen Sprachen
3.3. XML (2)
• Ermöglicht „semantische Suche“
HTML
XML
Quelltext
<p>Hermann <b>Hesse</b>
<br>Frankfurter Straße 8
<br>694 Wiesbaden
<br>geb. 3. März 1927</p>
Darstellung
im Browser
Hermann Hesse
Frankfurter Straße 8
69476 Wiesbaden
geb. 3. März 1927
Es wird nur das Format des Textes durch
formatorientierte Tags beschrieben.
Tags
25. Mai 2001
<person id= “p1876“> <autor>
<vorname>Hermann</vorname>
<nachnahme>Hesse</nachname>
/<autor>
<adresse>
<strasse>Frankfurter Straße
8</strasse> <ort> 69476
Wiesbaden> </ort> </adresse>
<geburtstag> <tag>3</tag>
<monat>März</monat>
<jahr>1927</jahr>
</geburtstag> </person>
Abhängig von der jeweiligen Stilsprache.
Es werden auch semantische Tags zur
Beschreibung des Inhalts gesetzt.
Kleyer/Oyen/Reuse
Folie 20
3. Verwandtschaft zu andern Sprachen
3.4. Zusammenhänge zwischen den Sprachen
XML
XHTML
SVG
SGML
VoiceXML
DSSSL
XSL
CSS
HTML
SyncML
WML
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 21
4. Fazit und Ausblick für die Zukunft
• XML wird die Sprache sein, die den Gedanken der Trennung
von Struktur und Inhalt verbreiten und den durch SGML
begonnen Trend fortsetzen wird
• Trend: Bereitstellung von Inhalt, Struktur und Layout wird in
naher Zukunft nicht nur hard- und softwareunabhängig sein,
sondern benutzer- oder benutzergruppenspezifisch
• SGML hat den ersten Grundstein für diese
informationsorientierte Entwicklung gelegt. Die hinter dieser
Sprache liegenden Kerngedanken sind – trotz der Tatsache, dass
die Sprache selbst schon älter ist – aktueller denn je.
25. Mai 2001
Kleyer/Oyen/Reuse
Folie 22

ppt