Institut für Deutsche Sprache, Mannheim

Wegweiser

Startseite

Aktuelles

Abteilungen, Arbeitsstellen
Sprach- und
Korpustechnologie
DIDA
SERGES
Text-Ton-
Alignment
Datenbank
Gespr. Deutsch
Links

Projekte

Service

Textkorpora des IDS

Veröffentlichungen

Über das IDS

Informationen zur deutschen Sprache

Rechtschreibreform

Kataloge, Suchmaschinen


DIDA

Diskursdatenbank

Ziel des DIDA-Systems ist die Bereitstellung eines Hilfsmittels, das die Verschriftlichung (Transkription) von Sprachaufnahmen und damit den Aufbau von Korpora gesprochener Sprache unterstützt sowie die Verwaltung von transkribierten Diskursen ermöglicht. Es besteht aus mehreren Komponenten, die alle unter einer gemeinsamen Oberfläche integriert sind. Die Komponenten sind

  • (Partitur-) Editor
  • Projektverwaltungssystem (Datenbank)
  • Druckprogramm
  • Exportprogramm
  • Audioeditor

Der Editor erlaubt die Erfassung des Gesprochenen in Partiturschreibweise. Jeder beliebig langen Sprecherzeile können beliebig viele Kommentarzeilen angehängt werden, die wiederum beliebig viele Kommentare bzw. Annotationen enthalten können. Beispiele für solche Annotationen sind u.a. das Verhalten des jeweiligen Gesprächsteilnehmers. Darüber hinaus besteht die Möglichkeit in einer zusätzlichen Zeile Beschreibungen allgemeiner Art, z.B. zur Gesprächssituation, aufzunehmen. Bei Korrekturen bleibt die Synchronität der Daten erhalten. Verschiedene Zeichensätze (Latein, Kyrillisch, IPA, türkische und andere Sonderzeichen) erlauben ein breites Einsatzgebiet.

Mit Hilfe einer ORACLE-Datenbank wurde ein Projektverwaltungssystem realisiert, das Benutzer- und Projektkennungen verwaltet und damit einen selektiven Zugriff auf Transkripte unter Sicherheitsgesichtspunkten ermöglicht. Diese Komponente ist bei der Mehrbenutzerversion von DIDA aktiv.

Das Druckprogramm ermöglicht die Ausgabe von Gesprächen oder Teilen davon in POSTSCRIPT. Das Druckformat ist eine um 90° gedrehte Partiturschreibweise, die eine Endlosausgabe simuliert. Dabei können die Papiergröße (Angabe in DIN), verschiedene Schriftgrößen, harter und weicher Umbruch u.ä. ausgewählt werden.

Im Gegensatz zum Druckprogramm dient der Export zur Weiterverarbeitung eines Diskurs(teil)es mit einem Textverarbeitungssystem. Als Textverarbeitungsformat dient RTF. Auch hier bestehen, ähnlich wie beim Druckprogramm, Optionen zur Steuerung der Ausgabe. Sie ermöglichen die Integration von Transkriptdaten in Text für Bücher und Publikationen.

Parallel zum Partitureditor kann ein Audioeditor geladen werden. Beliebig einstellbare Sprung- und Wiedergabeintervalle erlauben eine flexible Steuerung vom Partitureditor aus. Gegenüber der herkömmlichen Arbeitsweise beim Transkribieren mit Hilfe eines Diktiergeräts wird hier eine schnellere und präzisere Positionierung des Audiomaterials, sowie eine einfachere und genauere Bestimmung von Zeitintervallen ermöglicht. Aufgrund der bisherigen Hardwareausstattung ist diese Arbeitsweise noch nicht überall möglich.

Nach Abschluss der Korrekturarbeiten werden die Transkripte nach SGML konvertiert und durch COSMAS II zu Recherchezwecken erschlossen.

Technische Hinweise: Als Zeichencode wird UNICODE verwendet. Die Programme laufen unter verschiedenen UNIX-Varianten (Solaris, Irix und Linux). Der Partitureditor benötigt X/Window. Die Software wurde nach dem Client-Server-Modell erstellt, d.h. dass sich z. B. Editor und Datenbank auf verschiedenen Rechnern befinden. Als Kommunikationsprotokoll dient TCP/IP.

Zur Zusammensetzung der Gesprächskorpora und den Notationskonventionen.

Eine genauere Beschreibung der Notationskonventionen findet sich in den IDS-Transkriptionsrichtlinien für die Eingabe von DIDA (als PDF-Datei).

[IDS-Logo] Institut für Deutsche Sprache, Mannheim
Dr. Rudolf Schmidt <rudolf.schmidt@ids-mannheim.de>
Abteilung Pragmatik
Letzte Änderung: 28. März 2000