Institut für Deutsche Sprache, Mannheim | ||||||||||
Wegweiser Abteilungen, Arbeitsstellen |
Maschinelle Segmentierung von Korpora gesprochener Sprache des IDS(Alignment-Projekt)Zusammenfassung: Ziel dieses Projektes ist ein automatisches Alignment von Daten gesprochener Sprache des Instituts für Deutsche Sprache (IDS) sowie die Weiterentwicklung der am IDS und am Institut für Maschinelle Sprachverarbeitung (IMS) an der Universität Stuttgart dazu vorhandenen Werkzeuge (Aligner). Unter Alignment ist die Synchronisation von Sprachsignal und zugehörigem Text zu verstehen. Die akustischen Schwingungen des Sprachsignals werden zeitsynchron den entsprechenden Wörtern einer zuvor erstellten Transliteration zugeordnet. Für das IDS bietet diese Repräsentation die einfachste und schnellste Möglichkeit, die direkte Abbildung von Text auf Sprachsignale in die dort entwickelte Datenbank COSMAS II zu integrieren. Die Bereitstellung so immenser maschinenlesbarer Daten stellt eine wesentliche Voraussetzung für die Weiterentwicklung der Sprachtechnologien wie Sprachsynthese und Spracherkennung am IMS dar. Beschreibung des Projekts: Das IDS verfügt über große Mengen an gesprochenem Deutsch aus den verschiedensten dialektalen Bereichen und Aufnahmesituationen (Aufnahmen aus Fernsehen, Radio und "Feldforschung"). Diese Aufnahmen liegen in unterschiedlichster Form und in unterschiedlicher Audioqualität vor. Ein großer Teil der Aufnahmen ist transkribiert, und die Menge der maschinenlesbaren Transkriptionstexte wächst fortlaufend. Durch die Erstellung dieser maschinenlesbaren Transkriptionstexte ist es nun möglich, mittels des Aligners die Abbildung (Annotation) von Transkription auf die Sprachsignale automatisch durchzuführen. Dabei handelt es sich um eine Abbildung auf Wortebene, die es ermöglicht, mit einfachen Methoden der Textrecherche Ausschnitte aus einem beliebigen Sprachsignal zu erhalten. Ziel des weiteren Korpusaufbaus ist die Aufnahme von Text, digitalisiertem Ton und den Annotationen in die am IDS installierte Datenbank COSMAS II. Aus Sicht des IDS kommt dem Alignment von natürlichsprachigen Gesprächskorpora eine strategische Bedeutung zu. Damit werden in neuartiger Weise automatische Recherchen und Auswertungen des Sprachkorpus möglich, die einem großen Spektrum von Untersuchungsinteressen dienen können. So können umfangreiche sprachwissenschaftliche Studien über die interne Struktur der deutschen Sprache einschließlich der Dialekte durchgeführt werden, für die bislang kein ausreichendes Sprachmaterial maschinell zugreifbar war. Für das IMS stellt die Menge der am IDS automatisch alignierten und manuell überprüften Daten einen Fundus zum Training des dortigen Spracherkenners und Aligners dar. In diesem Zusammenhang werden am IMS neue Modelle (HMM) für sprachliche Phänomene entwickelt, die bei der Entwicklung des Aligners nicht vorhanden waren und folglich bei der Verarbeitung der Daten des IDS Schwierigkeiten bereiten. Der so verbesserte Aligner wird im IDS installiert und dort weiter betreut und angewendet. Eine ausführliche Beschreibung des Projektes findet sich hier.
|