Typisierung


Die Typisierung erfolgt ausgehend von den Tokens. Die phonetische und die morphologische Typisierung werden entkoppelt und können jeweils über Verknüpfungstabellen mehreren phonetischen und/oder morphologischen Typen zugeordnet werden. Die Zuordnung ist ein Akt der Interpretation, weswegen in den Verknüpfungstabellen jeweils dokumentiert werden muss, von wem eine Zuordnung vorgenommen wurde. In der Tabelle der morphologischen Typen muss angegeben werden, von wem der jeweilige Typ definiert wurde. Dies können entweder Referenzwörterbücher oder – sofern kein Referenzwörterbuch einen passenden Typus enthält – auch VA selbst sein. Morphologische Typen werden definiert durch die Orthographie, Affixe, Genus, Numerus und Basistyp. Die Einträge in dieser Tabelle sind bezüglich dieser Eigenschaften eindeutig (unique-Index).

morphologischeTypisierung

 

Im gegebenen Beispiel ist dem VALTS der morphologische Typ „Alm“ entnommen. Dieser geht zurück auf einen Beleg, der im VALTS nicht dokumentiert ist. VA verbindet entsprechende Belege nicht mit dem morphologischen Typ „Alm“, sondern mit „Alp“. Der Ursprung des morphologischen Typs wird in Klammern hinter dem Typ angegeben. Ein bereits vorhandener Typ wird kein zweites Mal angelegt, weswegen der angegebene Ursprung sich zufällig durch die Reihenfolge der Datenerfassung ergibt.

Komposittypen (Mehrwortlexien) könnten zusammen mit den „einfachen“ morphologischen Typen in der selben Tabelle gelistet werden. In diesem Fall wäre lediglich eine weitere Verknüpfungstabelle erforderlich, die die Gruppierung der betreffenden Tokens erlaubt.

Ein Gedanke zu „Typisierung

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.