TITUS
Thesaurus Indogermanischer
Text- und Sprachmaterialien
Sprachressourcen-Gipfel 2009
IDS Mannheim
16. Mai 2009
Roland Mittmann, Universität Frankfurt
TITUS: Die Anfänge
• 1987: Aufruf zur Mitarbeit an einem
"Thesaurus indogermanischer
Textmaterialien auf Datenträgern",
organisiert von Jost Gippert
• 1994: Umbenennung in "Thesaurus
indogermanischer Sprach- und
Textmaterialien (TITUS)"
• 1994: Umzug von Bamberg nach Frankfurt
TITUS: Die Homepage
• http://titus.uni-frankfurt.de
• derzeit 441 Texte und Textsammlungen
in 63 Sprachen, über 26 Mio. Wörter
• vorwiegend altüberlieferte Texte aus dem
indogermanischen Bereich
• zunehmend auch jüngere Texte sowie
nicht-indogermanische Texte,
vorwiegend aus kaukasischen Sprachen
(großes altgeorgisches Korpus)
Althochdeutsche Texte
Althochdeutsche Texte
Hildebrandslied
Notker
Datenbank
Abfrage 1
Abfrage 1
Abfrage-Web-Formular
Abfrage 2
Abfrage 2
Tagging
Entwicklung eines TITUS-Texts
 Eingabe als reines Textformat
 Strukturierung und Tagging
mittels WordCruncher
 Transfer in HTML (TITUS-Homepage)
 Transfer in XML (für D-SPIN)
 zunächst TEI-P5 (bereits erfolgt)
 dann D-SPIN-Format
Transfer in XML (TEI)
Vielen Dank für Ihre
Aufmerksamkeit!

Titus: datenbank- und internetorientierte Konzepte - D-Spin