Informatik III
Christian Schindelhauer
Wintersemester 2006/07
5. Vorlesung
09.11.2006
Albert-Ludwigs-Universität Freiburg
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
[email protected]
1
Äquivalenzklassen
Definition und Beispiel
 Definition
– Für eine Sprache L  * bezeichnen
wir zwei Worte x,y  * als
L-äquivalent, geschrieben als
x L y,
wenn für alle Worte z  * gilt
xzL  yzL .
– Die Menge aller zu x äquivalenten
Worte wird als Äquivalenzklasse von
x bezeichent:
[x] L = { w  * | w L x }
– Die Anzahl der Äquivalenzklassen
wird Index bezeichnet
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 1. Beispiel:
– Betrachte B = {0n1n | n ≥ 0}
– Worte in B:
• {,01,0011,000111,...}
– Äquivalente Worte:
– 1 B 10 B 11 B 100 B 101 B ...
• kein angehängtes Wort kann das
Wort zu einem Wort der Sprache
ergänzen
– 01 B 0011 B ...
• weil nur  angehängt werden darf
damit das Wort in B ist
– 0 B 001 B 00011 B 0000111
• nur durch Anhängen von 1 kann
ein Wort in B erzeugt werden
5. Vorlesung - 2
Äquivalenzklassen:
Beispiel
 1. Beispiel:
– Betrachte B = {0n1n | n ≥ 0}
– Worte in B:
• {,01,0011,000111,...}
–
–
–
–
–
–
–
–
–
Es gibt folgende Äquivalenzklassen:
B = {}
B_ = {0n1m | m>n≥0}  L(*1*0*)
B0 = {0n1n | n≥1}
B1 = {0n+11n | n≥0}
B2 = {0n+21n | n≥0}
B3 = {0n+31n | n≥0}
...
Der Index von B ist unendlich.
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 2. Beispiel:
– A = L(* 0 )
–  = {0,1}
– L(A) = {00,01,000,001,100,101,...}
– Äquivalente Worte:
•  A 1 A
11 A 011 A 111 A 0011 A ...
• 01 A 001 A 101 A 0001 A ...
• 0 A
10 A 010 A 110 A 0010 A ...
• 00 A 000 A 100 A 0000 A ...
– Äquivalenzklasen:
• [00]A,[01]A ,[10]A ,[11]A
– Der Index von A ist 4
5. Vorlesung - 3
Die Äquivalenzklassen beschreiben
das Gedächtnis eines Automaten
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Lemma:
– Falls x L y und x  L, dann gilt y  L
– Falls x L y, dann gilt
xa L ya für alle a  
 Beweis:
– folgt direkt aus der Definition
 Hat ein DFA M den Zustand q mit zwei
verschiedenen Worten x und y erreicht,
dann gilt:
– x L(M) y
 Denn im folgenden wird M sich völlig
identisch verhalten.
 Gibt es zwei Zustände im DFA, ab der für
jedes folgende Teilwort das gleiche
Ergebnis herauskommt, so können sie zu
einem vereinigt werden.
 Idee: der Index beschreibt die Anzahl der
Zustände des minimalen Automaten
Informatik III
5. Vorlesung - 4
Der Satz von Myhill-Nerode
 Theorem (Teil 1)
– Ist der Index einer Sprache A
gleich k, dann gibt es einen DFA
mit k Zuständen der A akzeptiert.
 Beweis
– Konstruiere DFA M= (Q, , , q0, F)
mit
• Q = {[x]A | x  *}
• ([x]A, a) = [xa]A
• q0 = []A
• F = {[w]A | w  A}
– Die Übergangsfunktion ist nach
letztem Lemma wohl definiert
– Nach dem letztem Lemma akzeptiert
M das Wort w gdw. w  A
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 2. Beispiel:
– A = * 0 
– Äquivalenzklasen:
• [00]A,[01]A ,[10]A ,[11]A
5. Vorlesung - 5
Der Satz von Myhill-Nerode
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Theorem (Teil 2)
– Jeder DFA M mit k Zuständen akzeptiert eine Sprache mit
Index ≤ k.
 Betrachte einen Zustand q des DFA
– Definiere: Lq = {w  * | (q0,w) = q}
• wobei (q,wa) := ((q,w),a) für a  
 Behauptung: Lq beinhaltet nur äquivalente Worte bezüglich L = L(M)
– Beweis:
• Für alle x,y  Lq und z  * gilt:
 (q,z) = (q0,xz) = (q0,yz)
• Also x L(M) y
 Wenn jeder der k Zustände nur äquivalente Worte hat, dann kann es
höchstens k Äquivalenzklassen geben
Informatik III
5. Vorlesung - 6
Der minimale endliche
deterministische Automat
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Korollar
– Die Anzahl der Zustände eines minimalen endlichen Automats entspricht
der Anzahl der Äquivalenzklassen der zugehörigen Sprache
 Beweis:
– Es gibt einen DFA mit k=Index Zuständen
– Jeder DFA hat mindestens k Zustände
– Daher ist der durch die Äquivalenzklassen definierte Automat minimal.
 Mit der Kenntniss der Äquivalenzklassen lässt sich ein minimaler DFA
konstruieren
Informatik III
5. Vorlesung - 7
Äquivalenzklassen zum Beweis
der Nichtregularität
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Theorem (Teil 2)
– Jeder DFA M mit k Zuständen akzeptiert eine Sprache mit Index ≤ k.
Ist der Index einer Sprache unendlich, dann kann es keinen endlichen
Automaten geben, der die Sprache akzeptiert.
Aus der Kenntnis unendlicher Äquivalenzklassen lässt sich also die
Nichtregularität beweisen
Informatik III
5. Vorlesung - 8
Beispiel
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
1. Beispiel:
– Betrachte B = {0n1n | n ≥ 0}
– Worte in B:
• {,01,0011,000111,...}
– Es gibt folgende Äquivalenzklassen:
– B = {}
– B_ = {0n1m | m>n≥0}  L(*1*0*)
– B0 = {0n1n | n≥1}
– B1 = {0n+11n | n≥0}
– B2 = {0n+31n | n≥0}
– B3 = {0n+31n | n≥0}
– ...
– Der Index von B ist unendlich.
Also ist B nach dem Satz von Myhill-Nerode nicht regulär.
Informatik III
5. Vorlesung - 9
Überblick: Kontextfreie
Sprachen
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Formale Grammatik
– Einführung, Beispiele
– Formale Definition
– Das Wort-Problem
– Chomsky Normalform
– Cocke-Younger-Kasami-Algorithmus
Kellerautomaten
– Formale Definition
– Beispiele
– Äquivalenz zu kontextfreien Sprachen
Nichtkontextfreie Sprachen
– Pumping-Lemma für kontextfreie Sprachen
Informatik III
5. Vorlesung - 10
Kapitel IV Kontextfreie
Sprachen
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Kontextfreie
Grammatik
Informatik III
5. Vorlesung - 11
Grammatik - Was ist das?
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
5. Vorlesung - 12
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Grammatik - Was ist das?
<SATZ> 
<SUBJEKT> <PRÄDIKAT> <OBJEKT>
<SUBJEKT> 
<OBJEKT> 
<PRÄDIKAT> 
<ARTIKEL> <SUBSTANTIV>
<ARTIKEL> <SUBSTANTIV>
<VERB>
<ARTIKEL>

die
<SUBSTANTIV>
<SUBSTANTIV>
<SUBSTANTIV>
<SUBSTANTIV>




Mutter
Tochter
Professorin
Studentin
<VERB>  langweilt
<VERB>  prüft
<VERB>  belehrt
<VERB>  besucht
<VERB>  beleidigt
<VERB>  tötet
Informatik III
5. Vorlesung - 13
Syntax und Semantik
<SATZ> 
<SUBJEKT> <PRÄDIKAT> <OBJEKT>
<SUBJEKT>  <ARTIKEL> <SUBSTANTIV>
<OBJEKT> 
<ARTIKEL> <SUBSTANTIV>
<PRÄDIKAT> 
<VERB>
<ARTIKEL>
 die
<SUBSTANTIV>
<SUBSTANTIV>
<SUBSTANTIV>
<SUBSTANTIV> 

Mutter

Tochter

Professorin
Studentin
<VERB>  langweilt
<VERB>  prüft
<VERB>  belehrt
<VERB>  besucht
<VERB>  beleidigt
<VERB>  tötet
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Mögliche Ableitungen:
– die Studentin besucht die
Professorin
– die Professorin belehrt die Studentin
– die Professorin langweilt die
Studentin
– die Studentin beleidigt die
Professorin
– die Professorin prüft die Studentin
– die Tochter besucht die Mutter
– die Mutter besucht die Professorin
– die Professorin belehrt die Mutter
– die Mutter tötet die Professorin
5. Vorlesung - 14
Beispiele kontextfreier
Grammatiken
 Kontextfreie Grammatiken sind
“Wortersetzer”
– A  0A1
– AB
– B#
 Ersetzungsregeln bestehen aus
Produktionen
 Variablen, Terminalsymbole
(Terminale)
 Startvariable: A
–A
– 0A1
– 00A11
– 000A111
– 000B111
– 000#111 .... und Schluss
 Das Wort 000#111 ist ein Wort der
Grammatik
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Ableitungsbaum
5. Vorlesung - 15
Formale Definition einer
kontextfreien Grammatik
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Definition
– Eine kontextfreie Grammatik ist ein Vierer-Tupel G=(V,,R,S), wobei
• V ist die endliche Menge der Variablen (Nichtterminale)
•  ist die endliche Menge der Terminale (Terminalsymbole)
 V und  sind disjunkte Mengen
• R ist eine endliche Menge an Ersetzungsregeln (Regeln/Produktionen)
 Jede Regel besteht aus einer Variable und einer Zeichenkette aus Variablen und
Terminalen,
 A  w, mit A  V, w  (V  )*
• S  V ist die Startvariable
 Ableitung
– Falls die Regel A  w in R ist, dann ist uAv  uwv, d.h.
• uAv kann zu uwv in einem Schritt abgeleitet werden
– Wir sagen das u zu v abgeleitet werden kann oder
u * v, wenn es ein k ≥ 0 gibt mit
 u  u1  u2  ...  uk  v
 Sprache der Grammatik G
– L(G) = { w   * | S * v}
 Die kontextfreien Sprachen werden durch kontextfreien Grammatiken erzeugt.
Informatik III
5. Vorlesung - 16
Beispiel einer
kontextfreien Grammatik
 Definition
– Eine kontextfreie Grammatik ist ein
Vierer-Tupel G=(V,,R,S)
• V: Variablen
• : Terminale
V und  sind disjunkt
• R : Ersetzungsregeln
A  w mit A  V, w  (V)*
• S  V : Startvariable
 Ableitung
– Falls A  w in R, dann ist
uAv  uwv
– u * v, wenn es ein k≥0 gibt mit
u  u1  u2  ...  uk  v
 Sprache der Grammatik G
– L(G) = { w   * | S * v}
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
G = ({A,B}, {0,1,#}, R, A}
R = {A  0A1, A  B, B  #}
Alternative Schreibweise:
R = {A  0A1 | B, B  #}
A  0A1
 00A11
 000A111
 000B111
 000#111
Also:
A  000#111
Damit ist das Wort 000#111 in der Sprache
L(G)
L(G) = {#, 0#1, 00#11, 000#111, 0000#1111, ...}
Informatik III
5. Vorlesung - 17
Probleme mit kontextfreien
Grammatiken
Mehrdeutigkeit:
– Beispiel: Grammatik ({S}, {+,x,3},
R, A}
– R = {S  S + S,
S  S x S,
S  3}
– Betrachte das Wort: w = 3+3x3
• S  S+S 
S + SxS  3 + 3x3
• S  SxS 
S+S x S  3+3 x 3
– Die Ableitung ist jeweils
verschieden
• damit ist auch die
Interpretation verschieden
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Epsilon-Regeln
– Beispiel: Grammatik
({S,A,B,C}, {a,b,c}, R, S }
– R = {S  ABC | ,
A  BaB | ,
B   | c,
C  BAbACB |  }
–S
ABC
 ABBAbACB C
ABBAbA BAbACB B
ABBAbA BAbA BAbACB B B
ABBAbA cAbA BAbACB B B
 bcbb
= bcbb
– Zwischenergebnisse können
gigantisch lang werden
• und dann wieder verschwinden
5. Vorlesung - 18
Ist ein Wort in der
Sprache?
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Die Entscheidung, ob ein Wort in einer kontextfreien Grammatik
abgeleitet werden kann ist nicht trivial:
– Mehrdeutige Ableitung
– Riesige Worte, die aufgrund der Epsilon-Regeln wieder verschwinden
 Wenig aussichtsreiche Ansätze:
1. Versuche Terminalsymbole von links nach rechts zu erzeugen
• Führt für viele Sprachen in Sackgassen
2. Probiere alle Ableitungsmöglichkeiten aus
• Grammatik mit Epsilon-Regeln: Unendliche Laufzeit
• Grammatik ohne Epsilon-Regeln: Unglaublich schlechte
(= exponentielle) Laufzeit
 Die Lösungsstrategie:
– Chomsky-Normalform
• Jede Grammatik lässt sich (praktisch) ohne Epsilon-Regeln in einer
einfachen Form darstellen
– Cocke-Younger-Kasami-Algorithms
• Durch dynamische Programmierung lässt sich die Laufzeit reduzieren
Informatik III
5. Vorlesung - 19
Chomsky-Normalform
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
Definition
– Eine kontextfreie Grammatik ist in Chomsky-Normalform, falls jede Regel
die Form
• A  BC oder
• A  a oder
• S   hat
– wobei
• A,B,C,S sind Variablen
• a ist ein Terminal
• B,C sind nicht das Startsymbol,
• S ist das Startsymbol.
Beispiel
• G = ({A,B,C,N,E}, {0,1,#}, R, S}
• R = {S  NC, N 0,S  #,
A  NC, C  AE, E 1, A  #}
Informatik III
5. Vorlesung - 20
Chomsky-Normalform
Definition
–Eine kontextfreie Grammatik ist in
Chomsky-Normalform, falls jede Regel
die Form
• A  BC oder
• A  a oder
• S   hat
–wobei
• A,B,C,S sind Variablen
• a ist ein Terminal
• B,C sind nicht das Startsymbol,
• S ist das Startsymbol.
Informatik III
Albert-Ludwigs-Universität Freiburg
Institut für Informatik
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
 Theorem
– Jede kontextfreie Sprache kann in
Chomsky-Normalform dargestellt
werden.
 Beispiel
– Kontextfreie Grammatik
• G = ({A,B}, {0,1,#}, R, A}
• R = {A  0A1, A  B, B  #}
– Grammatik mit gleicher Sprache in
Chomski-Normalform
• G’= ({A,B,C,N,E}, {0,1,#}, R, S}
• R = {S  NC, N 0,S  #,
A  NC, C  AE, E 1, A  #}
5. Vorlesung - 21
Ende der
5. Vorlesung
Informatik III
Christian Schindelhauer
[email protected]
Albert-Ludwigs-Universität Freiburg
Rechnernetze und Telematik
Prof. Dr. Christian Schindelhauer
22

Informatik III 5. Vorlesung - Rechnernetze und Telematik