Wegweiser
Startseite
Aktuelles
Abteilungen, Arbeitsstellen
ZDV
 COSMAS II
 MECOLB
Projekte
Service
Textkorpora des IDS
Veröffentlichungen
Über das IDS
Informationen zur deutschen Sprache
Rechtschreibreform
Kataloge, Suchmaschinen
|
COSMAS II
COSMAS II wurde im EU-Projekt MECOLB initiiert und im
Projekt SERGES weiterentwickelt.
Zum Leistungsumfang von COSMAS, das zur Zeit in COSMAS II integriert wird, gesellen sich unter anderem folgende neue Eigenschaften:
- Textannotationen (kodiert z.B. als TEI/SGML).
Annotationen können unterschiedliche Ebenen betreffen, wie z.B. die Texttypographie, die Dokumentstruktur oder strukturierte linguistische Informationen,
- Multi-Lingualität (die 12 in ISO 8859-1 dargestellten westeuropäischen Sprachen),
- Client/Server-Architektur,
- graphische Benutzeroberfläche (unter WINDOWS 95/NT).
Eine Stärke der graphischen Oberfläche von COSMAS II besteht in der Art, wie Suchanfragen graphisch formuliert werden können.
COSMAS II wurde im Projekt SERGES um die Integration von gesprochenem Material in digitalisierter Form weiterentwickelt:
- Es ermöglicht die Zuordnung von digitalisierten gesprochenen Äußerungen zu deren Audio-Dateien, so dass Treffer abgespielt werden können.
- Bei Recherchen berücksichtigt es die Besonderheiten verschrifteter gesprochener Sprache (Simultanpassagen, d.h. Gleichzeitigkeit von Äußerungen, Fragmentierung von Wörtern, nicht-lexikalisierte Äußerungen, Pausen usw.) und stellt einen sprecherbezogenen Wortabstandsoperator zur Verfügung.
COSMAS II ging 1999 in den Testbetrieb, bei dem er einigen Benutzern im Hause für
die Recherche in einer Transkriptdatenbank zur Verfügung steht. Verwaltet werden ca. 180 Diskurstranskripte, die automatisch aus DIDA importiert wurden. Einige Transkripte sind mit ihrer Audio-Datei synchronisiert (aligniert).
Gegenwärtig wird COSMAS II auf den Einsatz in drei verschiedenen Bereichen vorbereitet:
- Als Nachfolgesystem von COSMAS.
- Als Recherchesystem für die Transkripte des Spracharchivs. Die Vorbereitung erfolgen im Rahmen des Projekts Datenbank "gesprochenes Deutsch".
- Als Recherchesystem für die strukturierten Diskurstranskripte der Abteilung Pragmatik, wo es die im Alignment-Projekt erzeugten Daten aufnehmen wird.
Die Aktivitäten um COSMAS II waren von 1995-1998 in einer Academic Development Group (ADG) eingebettet, die am Ende des Projektes MECOLB gebildet wurde.
![[IDS-Logo]](../../icons/logos/ids.gif) |
Institut für Deutsche Sprache, Mannheim
|
Franck Bodmer <bodmer@ids-mannheim.de>
Arbeitsstelle Zentrale DV-Dienste |
Letzte Änderung: 15. November 1999
|