Entwicklung eines Systems
zur Diskurstranskription auf
dem Computer
Thomas Schmidt,
SFB ‚Mehrsprachigkeit‘, Hamburg
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
Datentypen: Transkript
MAX (v) :
(nv):
TOM (v) :
(nv):
MIA (v) :
NN
(nv):
Du fällst mir immer ins Wort.
------- gestikuliert --------
((1 sec)) Siehst Du, Du hast es schon wieder getan.
---------- schlägt die Hände vors Gesicht ---------
Stimmt ja wohl gar nicht.
-------- grinst -------Er hat schon recht, Tom.
---------------------------------- Telefon klingelt ------------------------------------
Datentypen: Transkript  Äußerungsdatenbank
MAX (v) :
(nv):
TOM (v) :
(nv):
Du fällst mir immer ins Wort.
------- gestikuliert --------
((1 sec)) Siehst Du, Du hast es schon wieder getan.
---------- schlägt die Hände vors Gesicht ---------
Stimmt ja wohl gar nicht.
-------- grinst --------
MIA (v) :
NN
(nv):
Er hat schon recht, Tom.
---------------------------------- Telefon klingelt ------------------------------------
?
Darstellungstypen: vertikale Darstellung
MAX:
TOM:
MAX:
MIA:
[gestikuliert] Du fällst mir immer <ins Wort>1.
[grinst] <Stimmt ja>1 wohl gar nicht.
[schlägt die Hände vors Gesicht]
((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.
<Er hat schon>2 recht, Tom.
Darstellungstypen: vertikale Darstellung 
Spaltendarstellung
MAX:
TOM:
MAX:
MIA:
[gestikuliert] Du fällst mir immer <ins Wort>1.
[grinst] <Stimmt ja>1 wohl gar nicht.
[schlägt die Hände vors Gesicht]
((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.
<Er hat schon>2 recht, Tom.
?
MAX
Du fällst mir
immer
ins Wort
TOM
MIA
NN
gestikuliert
((1sec)) Siehst schlägt die
Du, Du hast es
Hände vors
schon
Gesicht
wieder getan
Stimmt ja
grinst
wohl gar nicht
Telefon
klingelt
Er hat schon
recht, Tom
Darstellungstypen: Spaltendarstellung 
Partiturdarstellung
MAX (v) :
(nv):
Du fällst mir immer ins Wort.
------- gestikuliert --------
TOM (v) :
(nv):
((1 sec)) Siehst Du, Du hast es schon wieder getan.
---------- schlägt die Hände vors Gesicht ---------
Stimmt ja wohl gar nicht.
-------- grinst --------
MIA (v) :
NN
(nv):
Er hat schon recht, Tom.
---------------------------------- Telefon klingelt ------------------------------------
?
MAX
Du fällst mir
immer
ins Wort
TOM
MIA
NN
gestikuliert
((1sec)) Siehst schlägt die
Du, Du hast es
Hände vors
schon
Gesicht
wieder getan
Stimmt ja
grinst
wohl gar nicht
Telefon
klingelt
Er hat schon
recht, Tom
Darstellungsformate: HTML
Darstellungsformate: HTML --> RTF
?
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
andere Werkzeuge
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
andere Werkzeuge
andere Datenformate
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
andere Werkzeuge
andere Datenformate
andere Betriebssysteme
Grafik
(umg. Partitur)
syncWriter-Daten
(binär)
syncWriter
Segmentliste
?
andere Werkzeuge
andere Datenformate
andere Betriebssysteme
„Single Source, Multiple Targets“
vertikale Eingabe
vertikale Darstellung: RTF
Spalten-Eingabe
Spalten-Darstellung: HTML
Partitur-Eingabe
(XML)Datenformat
Partitur-Darstellung: PDF
...
...
Datenbank
andere Transkriptionsformate
andere Werkzeuge
Bird / Liberman: ANNOTATION GRAPHS
MAX / v / „Du fällst mir immer“
t0
MAX / v / „ins Wort“
t1
TOM / v / „Stimmt ja“
t2
TOM / v / „wohl gar nicht.“
t3
TOM / nv / „grinst.“
MAX / nv / „gestikuliert“
Struktur einer Diskurstranskription:
Zeitachse und Ereignisse
t0 < t1 < t2 < t3 < t4 < t5 < t6
e
Ereignis
e1
e2
e3
e4
e5
e6
e7
e8
e9
e10
e11
e12
Sprecher
Max
Max
Max
Tom
Tom
Tom
Max
Max
Max
Mia
Mia
NN
Start
t0
t1
t0
t1
t2
t1
t3
t4
t3
t4
t5
t1
Ende
t1
t2
t2
t2
t3
t3
t4
t5
t5
t5
t6
t6
Kategorie
verbal
verbal
non-verbal
verbal
verbal
non-verbal
verbal
verbal
non-verbal
verbal
verbal
non-verbal
t(e)
symbolische Beschreibung
Du fällst mir immer
ins Wort.
gestikuliert
Stimmt ja
wohl gar nicht.
grinst
((1 sec)) Siehst Du, Du hast es schon
wieder getan.
Schlägt die Hände vors Gesicht
Er hat schon
recht, Tom.
Telefon klingelt
Ereignis
e1
e2
e3
...
Sprecher
Max
Max
Max
...
Start
t0
t1
t0
...
Ende
t1
t2
t2
...
Kategorie
verbal
verbal
non-verbal
...
symbolische Beschreibung
Du fällst mir immer
ins Wort.
gestikuliert
...
Ereignis
e1
e2
e3
...
MAX (v) :
(nv):
TOM (v) :
(nv):
MIA (v) :
NN
(nv):
Sprecher
Max
Max
Max
...
Start
t0
t1
t0
...
Ende
t1
t2
t2
...
Kategorie
verbal
verbal
non-verbal
...
symbolische Beschreibung
Du fällst mir immer
ins Wort.
gestikuliert
...
Du fällst mir immer ins Wort.
------- gestikuliert --------
((1 sec)) Siehst Du, Du hast es schon wieder getan.
---------- schlägt die Hände vors Gesicht ---------
Stimmt ja wohl gar nicht.
-------- grinst -------Er hat schon recht, Tom.
---------------------------------- Telefon klingelt ------------------------------------
Ereignis
e1
e2
e3
...
Sprecher
Max
Max
Max
...
Start
t0
t1
t0
...
Ende
t1
t2
t2
...
Kategorie
verbal
verbal
non-verbal
...
symbolische Beschreibung
Du fällst mir immer
ins Wort.
gestikuliert
...
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“
– sprachspezifische lateinische Zeichen:
deutsch:
ÄÖÜß
französisch: ç è é ê ë
schwedisch: å æ ø
[...]
– nicht-lateinische Alphabete
kyrillisch:
ЉЋю
griechisch: α β γ θ
IPA
– CJK-Schriftsysteme
– ...
[...]
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“  UNICODE
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“  UNICODE
• Problem: „Softwareabhängigkeit“
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“  UNICODE
• Problem: „Softwareabhängigkeit“ XML
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“  UNICODE
• Problem: „Softwareabhängigkeit“ XML
• Problem: „Plattformabhängigkeit“
Technologien zur Implementierung
• Problem: „Sprachabhängigkeit“  UNICODE
• Problem: „Softwareabhängigkeit“ XML
• Problem: „Plattformabhängigkeit“ JAVA
XMLDatenformat
EingabeSchnittstelle
XMLDatenformat
XMLDatenformat
EingabeSchnittstelle
HTML
RTF
XMLDatenformat
EingabeSchnittstelle
HTML
RTF
XMLDatenformat
EingabeSchnittstelle
HTML
RTF
andere
Anwendungen
XMLDatenformat
EingabeSchnittstelle
HTML
(Partitur-)
Transkriptionseditor
RTF
andere
Anwendungen

syncWriter