Institut für Deutsche Sprache, Mannheim

Wegweiser

Startseite

Aktuelles

Abteilungen, Arbeitsstellen
Sprach- und
Korpustechnologie
DIDA
SERGES
Text-Ton-
Alignment
Datenbank
Gespr. Deutsch
Links

Projekte

Service

Textkorpora des IDS

Veröffentlichungen

Über das IDS

Informationen zur deutschen Sprache

Rechtschreibreform

Kataloge, Suchmaschinen


"Alignment": Maschinelle Text-Ton-Synchronisation

Details

Der IDS-Aligner läuft unter den Betriebssystemen

  • Solaris
  • Linux
  • Irix.

Er besteht aus den Komponenten

  • grafische Oberfläche (Tcl/Tk)
  • Steuerungsmechanismen (Tcl/sh)
  • Aussprachewörterbuch (Deutsch und Englisch)
  • Regelbasierter Phonetisierer
    • Multilinguale Regeln (z.Z. Deutsch, Englisch, Französisch, Spanisch und Italienisch)
    • mit der Möglichkeit Aussprachevarianten zu erzeugen
  • Modelle für Phoneme (als Hidden Markov Modelle, sog. HMM)
  • Spezifische Spracherkennungsmodule (HTK)
  • Diverse Hilfsprogramme zur Handhabung unterschiedlicher Ein- und Ausgabeformate.

Besonderheiten:

  • Die Länge der Audiodateien spielt bei der Bearbeitung keine Rolle, solange Haupt- und Festplattenspeicher keinen Engpass aufweisen (so wurden Audiodateien von 2h40m Länge aligniert, ohne sie zerschneiden zu müssen).
  • Insbesondere der Phonetisierer ermöglicht nicht nur eine sehr flexible Handhabung des Materials, sondern versetzt den Aligner in die Lage auch Transkripte zu verarbeiten, die nicht standardsprachlich transkribiert worden sind.
  • Hinweis: selbst standardsprachliche Transliterationen von Dialektaufnahmen wurden zufriedenstellend synchronisiert.

Das Antwortverhalten des Programms, das im wesentlichen von

  • dem verwendeten Rechner und
  • der akustischen Qualität des zu untersuchenden Materials

abhängt, reicht von 2/3-facher Realtime auf einer Enterprise 3500 bei sehr guter Tonqualität mit präziser Transkription (d.h. 1 Stunde Tonaufnahme wird in ca. 40 Minuten aligniert) bis zu ca. 18-facher Realtime auf einer Sun Ultra 1 (143MHz) bei sehr mäßiger Tonqualität.

Bei einer neueren Version der Aligners sind die Komponenten der Oberfläche und der Bearbeitungsmodule streng voneinander getrennt, so dass der Einbau von bestimmten Funktionskomponenten in andere Programme wie etwa DIDA leichter realisierbar ist.

Zurück zur Alignment-Übersicht.

[IDS-Logo] Institut für Deutsche Sprache, Mannheim
Dr. Rudolf Schmidt<rudolf.schmidt@ids-mannheim.de>
Abteilung Pragmatik
Letzte Änderung: 7. Juni 2000