Institut für Deutsche Sprache, Mannheim

Wegweiser

Startseite

Aktuelles

Abteilungen, Arbeitsstellen
ZDV
COSMAS II
MECOLB

Projekte

Service

Textkorpora des IDS

Veröffentlichungen

Über das IDS

Informationen zur deutschen Sprache

Rechtschreibreform

Kataloge, Suchmaschinen


COSMAS II

COSMAS II wurde im EU-Projekt MECOLB initiiert und im Projekt SERGES weiterentwickelt.

Zum Leistungsumfang von COSMAS, das zur Zeit in COSMAS II integriert wird, gesellen sich unter anderem folgende neue Eigenschaften:

  • Textannotationen (kodiert z.B. als TEI/SGML).
    Annotationen können unterschiedliche Ebenen betreffen, wie z.B. die Texttypographie, die Dokumentstruktur oder strukturierte linguistische Informationen,
  • Multi-Lingualität (die 12 in ISO 8859-1 dargestellten westeuropäischen Sprachen),
  • Client/Server-Architektur,
  • graphische Benutzeroberfläche (unter WINDOWS 95/NT).
    Eine Stärke der graphischen Oberfläche von COSMAS II besteht in der Art, wie Suchanfragen graphisch formuliert werden können.

COSMAS II wurde im Projekt SERGES um die Integration von gesprochenem Material in digitalisierter Form weiterentwickelt:

  • Es ermöglicht die Zuordnung von digitalisierten gesprochenen Äußerungen zu deren Audio-Dateien, so dass Treffer abgespielt werden können.
  • Bei Recherchen berücksichtigt es die Besonderheiten verschrifteter gesprochener Sprache (Simultanpassagen, d.h. Gleichzeitigkeit von Äußerungen, Fragmentierung von Wörtern, nicht-lexikalisierte Äußerungen, Pausen usw.) und stellt einen sprecherbezogenen Wortabstandsoperator zur Verfügung.

COSMAS II ging 1999 in den Testbetrieb, bei dem er einigen Benutzern im Hause für die Recherche in einer Transkriptdatenbank zur Verfügung steht. Verwaltet werden ca. 180 Diskurstranskripte, die automatisch aus DIDA importiert wurden. Einige Transkripte sind mit ihrer Audio-Datei synchronisiert (aligniert).

Gegenwärtig wird COSMAS II auf den Einsatz in drei verschiedenen Bereichen vorbereitet:

  • Als Nachfolgesystem von COSMAS.
  • Als Recherchesystem für die Transkripte des Spracharchivs. Die Vorbereitung erfolgen im Rahmen des Projekts Datenbank "gesprochenes Deutsch".
  • Als Recherchesystem für die strukturierten Diskurstranskripte der Abteilung Pragmatik, wo es die im Alignment-Projekt erzeugten Daten aufnehmen wird.

Die Aktivitäten um COSMAS II waren von 1995-1998 in einer Academic Development Group (ADG) eingebettet, die am Ende des Projektes MECOLB gebildet wurde.

[IDS-Logo] Institut für Deutsche Sprache, Mannheim
Franck Bodmer <bodmer@ids-mannheim.de>
Arbeitsstelle Zentrale DV-Dienste
Letzte Änderung: 15. November 1999