Institut für Deutsche Sprache, Mannheim 
Wegweiser
Startseite
Lexik: COSMAS I
Leistungsmerkmale (2) Leistungsmerkmale (3) Leistungsmerkmale (4)

Leistungsmerkmale von COSMAS I (3)

Morphosyntaktische Annotationen

In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:

Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,

z.B.: Tisch#ANA#NOU#com#sg#m#dat#.

Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.

Zur einfachen Formulierung von Annotationssuchbegriffen steht in der WWW-Version von COSMAS I ein interaktiver CosmasAnnotationsAssistent zur Verfügung. In einem Java-fähigen Browser wird an dieser Stelle eine Demonstration des AnnotationsAssistenten gestartet. In Ihrem Browser ist Java leider nicht aktiviert.

Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:

	#ANA#AUX#pl#*#1#*    	- sucht nach Hilfs-/Modalverben in
			    	  der 1. Person Plural, z.B.:
			    	  wir müssen, können / konnten / könnten, 
				  hatten / hätten usw.

	#ANA#VRB*fut*           - sucht nach Verbformen im Futur I und II,
				  z.B.: ..., später werde ich dir
				  alles erzählen. /
				  ... wird die Umstellung am 14. April
				  abgeschlossen sein ...

	#ANA#ADJ*sup*gen*    	- sucht nach allen Adjektiven im Superlativ 
				  und dazu im Genitiv, z.B.: einer der 
				  beliebtesten deutschen Filmstars

	wertvollen /+w1 #ANA#NOU*pl*acc*

			    	- sucht nach der Wortform wertvollen,
				  gefolgt von Substantiven im Akkusativ Plural,
			    	  z.B.: für seine wertvollen Informationen

	zu /w0 #ANA#AUX*	- sucht nach Infinitiven mit zu, z.B.:
				  ... die Chance zu nutzen. /
				  ... Schulden beglichen zu haben ... 

	#ANA#ADV*pref* /w0 auf	

				- sucht nach dem abgetrennten Verbpräfix auf, 
				  z.B.: wies ... auf  [aufweisen] /
			    	        rufen ... auf [aufrufen]

	&nehmen /+s0 #ANA#ADV*pref*

			    	- sucht nach Verbformen von nehmen
			    	  und nachgestellten abgetrennten Verbpräfixen
				  innerhalb eines Satzes,
			    	  z.B.: nahmen ... ein [einnehmen] /
			    		nimm ... hoch  [hochnehmen]

	für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)

				- sucht nach der Präposition für und - im
				  Abstand von ein bis zwei Wörtern ihr 
				  nachgestellt - nach Numeralia, gefolgt von
				  Substantiven im Akkusativ Plural,
				  z.B.: für mindestens zwei Tage /
					für 50 Pfennige

Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).

 
Wegweiser
Startseite
Lexik: COSMAS I
Leistungsmerkmale (2) Leistungsmerkmale (3) Leistungsmerkmale (4)
[IDS-Logo] Institut für Deutsche Sprache, Mannheim
Abteilung Lexik: Arbeitsgruppe für Korpustechnologie
Letzte Änderung: 14. August 2000