Wegweiser
Startseite
Aktuelles
Abteilungen, Arbeitsstellen
Sprach- und
Korpustechnologie
 DIDA
 SERGES
 Text-Ton-
  Alignment
 Datenbank
  Gespr. Deutsch
 Links
Projekte
Service
Textkorpora des IDS
Veröffentlichungen
Über das IDS
Informationen zur deutschen Sprache
Rechtschreibreform
Kataloge, Suchmaschinen
|
"Alignment": Maschinelle Text-Ton-Synchronisation
Details
Der IDS-Aligner läuft unter den Betriebssystemen
Er besteht aus den Komponenten
- grafische Oberfläche (Tcl/Tk)
- Steuerungsmechanismen (Tcl/sh)
- Aussprachewörterbuch (Deutsch und Englisch)
- Regelbasierter Phonetisierer
- Multilinguale Regeln (z.Z. Deutsch, Englisch, Französisch, Spanisch und Italienisch)
- mit der Möglichkeit Aussprachevarianten zu erzeugen
- Modelle für Phoneme (als Hidden Markov Modelle, sog. HMM)
- Spezifische Spracherkennungsmodule (HTK)
- Diverse Hilfsprogramme zur Handhabung unterschiedlicher Ein- und Ausgabeformate.
Besonderheiten:
- Die Länge der Audiodateien spielt bei der Bearbeitung keine Rolle, solange Haupt- und Festplattenspeicher keinen Engpass aufweisen (so wurden Audiodateien von 2h40m Länge aligniert, ohne sie zerschneiden zu müssen).
- Insbesondere der Phonetisierer ermöglicht nicht nur eine sehr flexible Handhabung des Materials, sondern versetzt den Aligner in die Lage auch Transkripte zu verarbeiten, die nicht standardsprachlich transkribiert worden sind.
- Hinweis: selbst standardsprachliche Transliterationen von Dialektaufnahmen wurden zufriedenstellend synchronisiert.
Das Antwortverhalten des Programms, das im wesentlichen von
- dem verwendeten Rechner und
- der akustischen Qualität des zu untersuchenden Materials
abhängt, reicht von 2/3-facher Realtime auf einer Enterprise 3500 bei sehr guter Tonqualität mit präziser Transkription (d.h. 1 Stunde Tonaufnahme wird in ca. 40 Minuten aligniert) bis zu ca. 18-facher Realtime auf einer Sun Ultra 1 (143MHz) bei sehr mäßiger Tonqualität.
Bei einer neueren Version der Aligners sind die Komponenten der Oberfläche und der Bearbeitungsmodule streng voneinander getrennt, so dass der Einbau von bestimmten Funktionskomponenten in andere Programme wie etwa DIDA leichter realisierbar ist.
Zurück zur Alignment-Übersicht.
Letzte Änderung: 7. Juni 2000
|