Institut für Deutsche Sprache, Mannheim |
Recherchebasis für COSMAS I können die vordefinierten bzw. frei nach individuellen Belangen¹ zusammengestellte Texte aus den vordefinierten Korpora der geschriebenen oder der gesprochenen Sprache sein. Die Recherchebasis kann jederzeit neu bestimmt werden. Statistische Angaben zum jeweils aktivierten Korpus in Bezug auf die Anzahl z.B. der Wörter und der Sätze sowie auf ihre durchschnittliche Länge etc. sind abrufbar.
Neben der Suche nach einfachen Wortformen bietet COSMAS I eine Vielzahl von Möglichkeiten für Kombinationssuchen und Suchen mit Suchmustern entsprechend seiner Suchanfragesyntax. Einheiten, die in einer Suchanfrage verwendet werden können, sind:
Suchobjekte in der Suchanfrage sind für COSMAS I:
Siehe Beispiel-Suchanfragen.
Das Lemmatisierungsprogramm "Flexionsanalyse und Kompositazerlegung" (Cyril Belica: WP2 - Lemmatizer. Final Report. MLAP93-21 MECOLB, Deliverable D5. Luxembourg, July 1994) als Komponente von COSMAS I ermöglicht, dass Flexionsformen, zusätzlich Komposita und/oder sonstige Wortbildungsformen bei der Suche berücksichtigt werden. Zu diesem Zweck ist der Grundformenoperator & (Et-Zeichen) zusammen mit einer interessierenden Grundform in die Suchanfrage einzubringen. Im Zusammenhang mit COSMAS I sind Grundformen
Bei dem folgenden Beispiel waren die Lemmatisierungsoptionen "Komposita" und "sonstige Wortbildungsformen" ebenfalls aktiviert.
Suchanfrage: &Beispiel
Das Suchergebnis in einem bestimmten Korpus beinhaltet unter anderem (mit der absoluten Häufigkeit des Vorkommens):
Alltagsbeispiel (1) Anwendungsbeispiele (4) Beispiel (7755) Beispiele (970) beispielgebend (15) beispielhaft (124) beispielhaftem (1) Beispielhaftigkeit (1) beispielsweise (3039) Butter-Margarine-Beispiel (1) Codierungsbeispiele (1) Projektbeispiele (1) US-Beispiel (1) Zahlenbeispiels (1) Zwischenbeispiel (1)
Weitere Beispiel-Suchanfragen:
anscheinend und scheinbar anscheinend oder scheinbar Gegenwart /w4 Zukunft finden /w1 Sie finden /+w1 Sie finden /-w1 Sie willkommen /w0 "!" weil /-w1 "," Krieg /w10:5 Frieden die /+w1:1 die Ephraim %+w1 Lessing sowohl %+s0 als sowohl %+w5:1 als Mond* *mond Me*er Sonnen?t* &Spiel &spielen &schön &-heit &zer- (Tag /+w2 $offenen) /+w1 Tür (Landschaft oder Gegend) /s0 &schauen (Willkommen /+w1 "und") /+w1 Abschied ((schöne oder große) /+w3 Augen) /s0 &machen &Geist /w5 &Zeit des /+w1 *mus *ge*n oder *ge*t oder be*en oder be*t oder zer*en oder zer*t &sprechen oder &reden oder &diskutieren &offen oder &ehrlich oder &sachlich (= z.B. frühere Suche Nr. 13) <13> /w5 (&Gespräch oder &Rede oder &Diskussion)¹ (&werden oder &sein) /s0 <PartII.imp> (<PartII.imp> ist eine importierte Datei, die Perfektpartizipien enthält)¹
In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:
Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,
z.B.: Tisch#ANA#NOU#com#sg#m#dat#
.
Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.
Zur einfachen Formulierung von Annotationssuchbegriffen steht in der
WWW-Version von COSMAS I
ein interaktiver CosmasAnnotationsAssistent zur Verfügung.
Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:
#ANA#AUX#pl#*#1#* - sucht nach Hilfs-/Modalverben in der 1. Person Plural, z.B.: wir müssen, können / konnten / könnten, hatten / hätten usw. #ANA#VRB*fut* - sucht nach Verbformen im Futur I und II, z.B.: ..., später werde ich dir alles erzählen. / ... wird die Umstellung am 14. April abgeschlossen sein ... #ANA#ADJ*sup*gen* - sucht nach allen Adjektiven im Superlativ und dazu im Genitiv, z.B.: einer der beliebtesten deutschen Filmstars wertvollen /+w1 #ANA#NOU*pl*acc* - sucht nach der Wortform wertvollen, gefolgt von Substantiven im Akkusativ Plural, z.B.: für seine wertvollen Informationen zu /w0 #ANA#AUX* - sucht nach Infinitiven mit zu, z.B.: ... die Chance zu nutzen. / ... Schulden beglichen zu haben ... #ANA#ADV*pref* /w0 auf - sucht nach dem abgetrennten Verbpräfix auf, z.B.: wies ... auf [aufweisen] / rufen ... auf [aufrufen] &nehmen /+s0 #ANA#ADV*pref* - sucht nach Verbformen von nehmen und nachgestellten abgetrennten Verbpräfixen innerhalb eines Satzes, z.B.: nahmen ... ein [einnehmen] / nimm ... hoch [hochnehmen] für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*) - sucht nach der Präposition für und - im Abstand von ein bis zwei Wörtern ihr nachgestellt - nach Numeralia, gefolgt von Substantiven im Akkusativ Plural, z.B.: für mindestens zwei Tage / für 50 Pfennige
Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).
Nach einer abgeschlossenen Suche stehen dem Nutzer drei Stufen der Ergebnispräsentation zur Verfügung:
Darüber hinaus sind Gesamtwortformenlisten¹, Grundformenlisten¹ sowie - während eines Suchlaufs - temporäre Wortformenlisten mit Häufigkeitsangaben abrufbar, ebenso die Angebotsliste mit morphosyntaktischen Annotationen.
Manuelle Auswahl oder Zufallsauswahl von Treffern in Bezug auf KWIC-Zeilen und Textbelege ist möglich. Verschiedene Ergebnispräsentationen und beliebig sortierte Ergebnismengen können ausgedruckt bzw. zur weiteren Bearbeitung auf separate Rechner geladen werden.
Neben der quellenweisen Sortierung, die unmittelbar nach einer abgeschlossenen Suche in Form der Quellenstatistik ausgegeben wird, kann COSMAS I die Ergebnismenge außerdem wie folgt sortieren:
(Das öffentlich zugängliche Korpusangebot in der Vollversion ist genau das gleiche wie in der WWW-Version.)
Fenster
Verknüpfungen
Korpus
|
Optionen
Export
Ergebnisse
Import¹
|
Ende
|
¹ Funktion nur in der COSMAS-I-Vollversion
² neu im Vergleich zur Version R.1.3-1, die dem COSMAS-Benutzerhandbuch entspricht
Suchanfrage: offen /s0 &sprechen
(Das öffentlich zugängliche Korpusangebot in der Vollversion ist genau das gleiche wie in der WWW-Version.)
Optionen
/ Menüpunkt Einstellen
/ KWIC-Typ: Satz
Ergebnisse
/ Menüpunkt Belege alphabetisch
Fenster oben: Menü und Statuszeile
Fenster links unten: Hilfestellung zur Bedienung von COSMAS I
Fenster rechts unten: KWIC-Übersicht
Die dort angezeigte Sitzung ist nicht aktiv! Alle Bildschirmeingaben sind daher wirkungslos!
![]() |
Leitseite zu COSMAS I: http://www.ids-mannheim.de/kt/
![]() |
![]() |
Institut für deutsche Sprache, Mannheim |
Abteilung Lexik: Arbeitsgruppe für Korpustechnologie |