COSMAS I - Alle Leistungsmerkmale
Institut für Deutsche Sprache, Mannheim 

Leistungsmerkmale von COSMAS I

Virtuelle Korpuskomposition¹

Recherchebasis für COSMAS I können die vordefinierten bzw. frei nach individuellen Belangen¹ zusammengestellte Texte aus den vordefinierten Korpora der geschriebenen oder der gesprochenen Sprache sein. Die Recherchebasis kann jederzeit neu bestimmt werden. Statistische Angaben zum jeweils aktivierten Korpus in Bezug auf die Anzahl z.B. der Wörter und der Sätze sowie auf ihre durchschnittliche Länge etc. sind abrufbar.


Suchanfragen

Neben der Suche nach einfachen Wortformen bietet COSMAS I eine Vielzahl von Möglichkeiten für Kombinationssuchen und Suchen mit Suchmustern entsprechend seiner Suchanfragesyntax. Einheiten, die in einer Suchanfrage verwendet werden können, sind:

 

Suchobjekte in der Suchanfrage sind für COSMAS I:

Siehe Beispiel-Suchanfragen.

 


Lemmatisierungsprogramm

Das Lemmatisierungsprogramm "Flexionsanalyse und Kompositazerlegung" (Cyril Belica: WP2 - Lemmatizer. Final Report. MLAP93-21 MECOLB, Deliverable D5. Luxembourg, July 1994) als Komponente von COSMAS I ermöglicht, dass Flexionsformen, zusätzlich Komposita und/oder sonstige Wortbildungsformen bei der Suche berücksichtigt werden. Zu diesem Zweck ist der Grundformenoperator & (Et-Zeichen) zusammen mit einer interessierenden Grundform in die Suchanfrage einzubringen. Im Zusammenhang mit COSMAS I sind Grundformen

Bei dem folgenden Beispiel waren die Lemmatisierungsoptionen "Komposita" und "sonstige Wortbildungsformen" ebenfalls aktiviert.

Suchanfrage: &Beispiel

Das Suchergebnis in einem bestimmten Korpus beinhaltet unter anderem (mit der absoluten Häufigkeit des Vorkommens):

	Alltagsbeispiel			   (1)
	Anwendungsbeispiele		   (4)
	Beispiel			(7755)
	Beispiele			 (970)
	beispielgebend			  (15)
	beispielhaft			 (124)
	beispielhaftem			   (1)
	Beispielhaftigkeit                 (1)
	beispielsweise			(3039)
	Butter-Margarine-Beispiel	   (1)
	Codierungsbeispiele		   (1)
	Projektbeispiele		   (1)
	US-Beispiel			   (1)
	Zahlenbeispiels			   (1)
	Zwischenbeispiel		   (1)


Weitere Beispiel-Suchanfragen:

        anscheinend und scheinbar
        anscheinend oder scheinbar
        Gegenwart /w4 Zukunft
        finden /w1 Sie
        finden /+w1 Sie
        finden /-w1 Sie
        willkommen /w0 "!"
        weil /-w1 ","
	Krieg /w10:5 Frieden
	die /+w1:1 die
	Ephraim %+w1 Lessing
	sowohl %+s0 als
	sowohl %+w5:1 als
        Mond*
        *mond
        Me*er
        Sonnen?t*
        &Spiel
        &spielen
        &schön
        &-heit
        &zer-
        (Tag /+w2 $offenen) /+w1 Tür
        (Landschaft oder Gegend) /s0 &schauen
        (Willkommen /+w1 "und") /+w1 Abschied
        ((schöne oder große) /+w3 Augen) /s0 &machen
        &Geist /w5 &Zeit
        des /+w1 *mus
        *ge*n oder *ge*t oder be*en oder be*t oder zer*en oder zer*t
        &sprechen oder &reden oder &diskutieren

        &offen oder &ehrlich oder &sachlich     (= z.B. frühere Suche Nr. 13)
        <13> /w5 (&Gespräch oder &Rede oder &Diskussion)¹

        (&werden oder &sein) /s0 <PartII.imp>   (<PartII.imp> ist eine
                                                 importierte Datei, die
                                                 Perfektpartizipien enthält)¹


Morphosyntaktische Annotationen

In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:

Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,

z.B.: Tisch#ANA#NOU#com#sg#m#dat#.

Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.

Zur einfachen Formulierung von Annotationssuchbegriffen steht in der WWW-Version von COSMAS I ein interaktiver CosmasAnnotationsAssistent zur Verfügung. In einem Java-fähigen Browser wird an dieser Stelle eine Demonstration des AnnotationsAssistenten gestartet. In Ihrem Browser ist Java leider nicht aktiviert.

Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:

	#ANA#AUX#pl#*#1#*    	- sucht nach Hilfs-/Modalverben in
			    	  der 1. Person Plural, z.B.:
			    	  wir müssen, können / konnten / könnten, 
				  hatten / hätten usw.

	#ANA#VRB*fut*           - sucht nach Verbformen im Futur I und II,
				  z.B.: ..., später werde ich dir
				  alles erzählen. /
				  ... wird die Umstellung am 14. April
				  abgeschlossen sein ...

	#ANA#ADJ*sup*gen*    	- sucht nach allen Adjektiven im Superlativ 
				  und dazu im Genitiv, z.B.: einer der 
				  beliebtesten deutschen Filmstars

	wertvollen /+w1 #ANA#NOU*pl*acc*

			    	- sucht nach der Wortform wertvollen,
				  gefolgt von Substantiven im Akkusativ Plural,
			    	  z.B.: für seine wertvollen Informationen

	zu /w0 #ANA#AUX*	- sucht nach Infinitiven mit zu, z.B.:
				  ... die Chance zu nutzen. /
				  ... Schulden beglichen zu haben ... 

	#ANA#ADV*pref* /w0 auf	

				- sucht nach dem abgetrennten Verbpräfix auf, 
				  z.B.: wies ... auf  [aufweisen] /
			    	        rufen ... auf [aufrufen]

	&nehmen /+s0 #ANA#ADV*pref*

			    	- sucht nach Verbformen von nehmen
			    	  und nachgestellten abgetrennten Verbpräfixen
				  innerhalb eines Satzes,
			    	  z.B.: nahmen ... ein [einnehmen] /
			    		nimm ... hoch  [hochnehmen]

	für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)

				- sucht nach der Präposition für und - im
				  Abstand von ein bis zwei Wörtern ihr 
				  nachgestellt - nach Numeralia, gefolgt von
				  Substantiven im Akkusativ Plural,
				  z.B.: für mindestens zwei Tage /
					für 50 Pfennige

Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).


Ergebnispräsentation

Nach einer abgeschlossenen Suche stehen dem Nutzer drei Stufen der Ergebnispräsentation zur Verfügung:

Darüber hinaus sind Gesamtwortformenlisten¹, Grundformenlisten¹ sowie - während eines Suchlaufs - temporäre Wortformenlisten mit Häufigkeitsangaben abrufbar, ebenso die Angebotsliste mit morphosyntaktischen Annotationen.

Manuelle Auswahl oder Zufallsauswahl von Treffern in Bezug auf KWIC-Zeilen und Textbelege ist möglich. Verschiedene Ergebnispräsentationen und beliebig sortierte Ergebnismengen können ausgedruckt bzw. zur weiteren Bearbeitung auf separate Rechner geladen werden.


Sortiermöglichkeiten

Neben der quellenweisen Sortierung, die unmittelbar nach einer abgeschlossenen Suche in Form der Quellenstatistik ausgegeben wird, kann COSMAS I die Ergebnismenge außerdem wie folgt sortieren:


Die Menüs auf einen Blick
(Darstellung bezogen auf die COSMAS-I-Vollversion)
Version R.2.6-0

(Das öffentlich zugängliche Korpusangebot in der Vollversion ist genau das gleiche wie in der WWW-Version.)

Fenster

  • Suchanfrage
  • Wortformenliste¹
  • Grundformenliste¹
  • morphosyntaktische Annotationen²
  • Zwischenergebnisse
  • Ergebnisse
  • Frühere Suchen¹

 

Verknüpfungen

  • UND
  • ODER
  • NICHT
  • Wortabstand
  • Satzabstand
  • Absatzabstand
  • Zeilenabstand

 

Korpus

  • Vordefiniert
  • Laden¹
  • Sichern¹
  • Dokumente anwählen¹
  • Dokumente abwählen¹
  • Gruppe anwählen¹
  • Gruppe abwählen¹
  • Alles abwählen¹
  • Suchergebnis >> Korpus¹
  • Suchergebnis >- Korpus¹
  • Zufallsauswahl 50% (dokumentbezogen)¹
  • Korpusstatistik²

Optionen

  • Einstellen
    - Anzeigeoptionen
    - Häufigkeiten (absolut / relativ¹)
    - Zufallsauswahl (trefferbezogen)²
    - Lemmatisierung
    - Suchmodalitäten
  • Zeichensätze²
    - Tastatur/Bildschirm
    - Import-/Exportdaten

Export

  • Definitionen
    - Typ
    - Ziel
  • Aktueller Text
  • Gesamt
  • Markiert
  • Wortliste

Ergebnisse

  • Textstatistik
  • Belege alphabetisch
  • Definitionen
  • Wörter alphabetisch (1)
  • Wörter alphabetisch (2)
  • Frequenz sortieren
  • Frequenzsortierung widerrufen
  • Chronologisch sortieren²
  • Kollokationsanalyse²
  • Analyseparameter²

Import¹

  • Suchanfrage
  • Wortliste
  • Importdatei löschen
  • Importdatei zeigen

 

Ende

  • Ende
  • Tasten¹
  • Version

¹ Funktion nur in der COSMAS-I-Vollversion

² neu im Vergleich zur Version R.1.3-1, die dem COSMAS-Benutzerhandbuch entspricht


Bildschirmansichten

Suchanfrage: offen /s0 &sprechen

Abb. 1: Ausgabe der COSMAS-I-Vollversion nur für alphanumerische Bildschirme

(Das öffentlich zugängliche Korpusangebot in der Vollversion ist genau das gleiche wie in der WWW-Version.)

Einzelbeleg
Menü Optionen / Menüpunkt Einstellen / KWIC-Typ: Satz
Menü Ergebnisse / Menüpunkt Belege alphabetisch

KWIC-Übersicht (im Hintergrund)

Abb. 2: Ausgabe der COSMAS-I-Version im WWW

Fenster oben: Menü und Statuszeile
Fenster links unten: Hilfestellung zur Bedienung von COSMAS I
Fenster rechts unten: KWIC-Übersicht

Die dort angezeigte Sitzung ist nicht aktiv! Alle Bildschirmeingaben sind daher wirkungslos!

 


¹ Funktion nur in der COSMAS-I-Vollversion
(Das öffentlich zugängliche Korpusangebot in der Vollversion ist genau das gleiche wie in der WWW-Version.)

 

Leitseite zu COSMAS I: http://www.ids-mannheim.de/kt/

[IDS-Logo] Institut für deutsche Sprache, Mannheim
Abteilung Lexik: Arbeitsgruppe für Korpustechnologie
Letzte Änderung: 14. August 2000