Methodologie

Bislang existiert für die in der Methodologie publizierten Beiträge noch keine Volltextsuche. Eine solche befindet sich in Planung und Entwicklung und wird in einer der nächsten VerbaAlpina-Versionen zur Verfügung stehen. Bis dahin kann behelfsmäßig, nach Aufruf von "Alle Einträge anzeigen", die Volltextsuche der Browser (meist Strg+F) verwendet werden.
Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Öffentlichkeit

s. Publikation.

Tags: Webseite



Onomasiologie

Sachen und Wörter

  Motto: "Wie einem Sein oder Geschehen der Satz, so entspricht einer Sache das Wort; nur ist die Beziehung nicht umkehrbar. Ich kann fragen: wie heißt diese Sache? Ich muß fragen: was bedeutet dieses Wort? Die Sache besteht für sich voll und ganz; das Wort nur in Abhängigkeit von der Sache, sonst ist es leerer Schall." (Schuchardt 1912, 829)

VerbaAlpina ist ganz konsequent in bidirektionaler Logik konzipiert worden: Aus semasiologischer Sicht (vgl. Semantik) können alle erfassten Bezeichnungen so abgefragt werden, dass man erfährt, mit welchen KONZEPTEN sie in den lokalen Dialekten jeweils verknüpft sind; diese Richtung vom Wort zur Sache entspricht grosso modo der Vorgehensweise der allermeisten Wörterbücher. Aus umgekehrter, onomasiologischer Richtung können aber auch alle erfassten KONZEPTE abgefragt werden, so dass sich ergibt, mit welchen Bezeichnungen sie in den jeweiligen lokalen Dialekten belegt werden. Onomasiologische Fragestellungen haben eine lange Tradition in der Sprachwissenschaft, die vor allem mit der Bewegung ‘Wörter und Sachen’ oder – in anderer Priorisierung – ‘Sachen und Wörter’ (vgl. Schuchardt 1912]]) verbunden ist; sie wurde von der Überzeugung getragen, dass

"die vergleichende romanische Sprachgeschichte als Korrelat eine vergleichende romanische Kulturgeschichte erfordert" (Bibl:Schuchardt 1899, 195; später wiederholt in Schuchardt 1912, 829, Anm. 1; Hervorhebung im Original).

Die onomasiologische Tradition steht zu Beginn also im Zeichen der – modern ausgedrückt – Ethnolinguistik. Das wichtigste Publikationsorgan war Wörter und Sachen : Zeitschrift für indogermanische Sprachwissenschaft, Volksforschung und Kulturgeschichte (1909-1944); Herausgeber waren der Indogermanist Rudolf Meringer, der Romanist Wilhelm Meyer-Lübke, der Slawist Jooseppi Julius Mikkola, der Germanist Rudolf Much und der Slawist Matija Murko. Speziell für die Romanistik muss zudem die Zeitschrift Volkstum und Kultur der Romanen (1926-45) genannt werden. Das Ende beider Publikationsorgane in den Jahren 1944/45 deutet bereits an, dass sie sich in den 30er Jahren zunehmend an einem faschistischen Volksbegriff orientierten. Diese Ideologisierung der Onomasiologie lag vielleicht nahe, unvermeidlich war sie jedoch nicht. Es wäre sicherlich falsch, der Ethnographie und damit der Ethnolinguistik einen immanenten Faschismus zu unterstellen; faschistisch ist nicht die Dokumentation und Beschreibung der Alltagskultur als solche, sondern deren Interpretation auf der Grundlage eines geschlossenen, essenzialistischen und womöglich rassistischen Kulturbegriffs.

Ein uneingelöstes Versprechen: onomasiologische Lexikographie

Aber auch über die im engeren Sinn ethnolinguistisch relevanten Bereiche hinaus sind onomasiologische Überlegungen durchaus in die Konzeption wichtiger lexikographischer Referenzwerke eingeflossen, wie sich vor allem am FEW zeigen lässt. Zu einer konsequent onomasiologischen Fundierung ist es dann allerdings doch nicht gekommen (Link); erst als das Wörterbuch bereits weit vorangeschritten war, wurde von Walter von Wartburg in Zusammenarbeit mit Rudolf Hallig ein Begriffssystem als Grundlage für die Lexikographie ausgearbeitet (so der Titel von Hallig/Wartburg 1963). In der wortgeschichtlichen und etymologischen Forschung, die Wartburg besonders am Herzen lag, bestätigt sich im Hinblick auf das Verhältnis von Wort- und Sachgeschichte auch nach über 100 Jahren schnell die Feststellung Hugo Schuchardts: "Die Wortforschung ist gegen die Einwirkungen von der anderen Seite immer noch zu sehr durch die ‘Lautgesetze’ anästhesiert" (Schuchardt 1912).
Weiterhin muss festgestellt werden, dass die Onomasiologie nicht gut zum Mainstream der meist als 'modern' apostrophierten Sprachwissenschaft passte. Angesichts der zunehmenden Dominanz formaler und syntaktisch orientierter Modellierungen, die universale Geltung beanspruchen, rückte sie an die Peripherie des Interesses. Erst in den letzten Jahrzehnten ist sie zu neuen Ehren gekommen. Dazu haben ganz unterschiedliche Entwicklungen beigetragen, wie die sogenannte kognitive Wende, in deren Gefolge gerade nach der Motivation sprachlicher Kategorien gesucht wurde/wird, sowie neuerdings die Digital Humanities, die Optionen eröffnet, sprachliche Kategorien systematisch mit nicht-sprachlichen, d.h. 'sachlichen' Normdaten zu verknüpfen. Vor diesem Hintergrund vollzieht sich ein Klimawandel, der die Rahmenbedingungen der Lexikographie verändert. Davon sind nicht nur neue Arbeiten betroffen, sondern auch für die bereits etablierte und bewährte Lexikographie hat sich ein ganz neuer Horizont eröffnet: Zu den zentralen aktuellen Herausforderungen gehört es ja an erster Stelle, die möglich gewordene Vernetzung der vorliegenden maßgeblichen Lexika ins Werk zu setzen. Ein entsprechendes Verfahren wurde in VerbaAlpina bereits umgesetzt, wie ein Blick in eine beliebige interaktive VerbaAlpina-Karte zeigt: Jeder Beleg ist an der Oberfläche mit unterschiedlichen Referenzlexika verknüpft, deren Siglen durch Anklicken auf die jeweiligen Lexikoneinträge führen (im Beispiel T, T, C, G, F).
Möglich wäre jedoch nicht nur die Vernetzung der Lexika auf der Ebene der Bezeichnungen (= 'Wörter'), wie im vorangehenden Beispiel illustriert, sondern auch auf der Ebene der Konzepte (= 'Sachen') durch geeignete Normdaten; auch dafür sind die Voraussetzungen in VerbaAlpina bereits gegeben, denn – wie das soeben genannte Beispiel ebenfalls zeigt – wurden die Wikidata-IDs integriert (Link "Wikidata" in den Belegfenstern). Eine sachbasierte Verknüpfung von Lexika scheitert einstweilen an der Tatsache, dass sich die Konzepte fast nirgendwo als digitale Objekte ansprechen und identifizieren lassen, da spezifische Normdaten (z.B. die Q-IDs des Wikidata-Projekts oder auch projekteigene IDs) fehlen.

Es erhebt sich nun die Frage, ob es nicht sinnvoll sein könnte, komplementär zu den Wikidata-IDs an Hallig/Wartburg 1963 anzuknüpfen und das dort formulierte ‘Begriffssystem’ zu generalisierbaren Normdaten zu erheben. Dagegen spricht ein ganz grundsätzlicher theoretischer Vorbehalt: Aus semiotischer Sicht nicht überzeugend ist die unklare Abgrenzung zwischen den onomasiologischen Basiskategorien, nämlich den außersprachlichen Konzepten einerseits und den (einzel)sprachlichen Bezeichnungen andererseits. Zwar wird ein Anspruch auf universale Verwendbarkeit formuliert:

"Wir glauben, mit dem Begriffssystem, das wir hier vorlegen, für die Lexikographie eine Grundlage geschaffen zu haben, welche die Darstellung des «Wortschatzes als Gesamtgefüge» ermöglichen könnte, unabhängig davon, welcher Sprache, welcher Mundart oder welcher Epoche dieses Wortgut angehört" (Hallig/Wartburg 1963, XXII).

Aber die 'Begriffe' dieses Systems oder: "Ordnungsschemas" entsprechen gerade nicht den Korrelaten jenseits der Sprache, auf die sich die sprachlichen Zeichen beziehen (den 'Sachen'), sondern es handelt sich ebenfalls um sprachliche, d.h. einzelsprachliche Zeichen (Bezeichnungen bzw. 'Wörter'):

"Dabei ist durchaus nicht an durch logische Operationen gefundene Begriffe gedacht, sondern nur an die durch die Leistung der Sprache bei der Verarbeitung der Welt geschaffenen vorwissenschaftlichen Allgemeinbegriffe, die von jedem erfasst, verstanden, gewußt und benutzt werden, mit anderen Worten an den «Popularbegriff» mit einem festen Kern und oft unscharfen Grenzen" Hallig/Wartburg 1963, XI).

Wissenschaftliche Begriffe werden also kategorisch ausgeschlossen und damit gerade auch die wenigen traditionellen, über die Einzelsprachen hinweg verlässlichen Referenzsysteme wie z.B. die auf Carl von Linné zurückgehende botanische Nomenklatur.

Aus aktueller enzyklopädischer Sicht muss man die Konzeption eines geschlossenen Begriffssystems

"nach dem Grundsatz der Sparsamkeit, jedoch so, daß jeder Seinsbereich, der im Weltbild der Sprache verarbeitet worden ist, auch in unserem Ordnungsschema vertreten sein muß" (Hallig/Wartburg 1963, XI)

als naiv bezeichnen, und es erübrigt sich, alle 'Seinsbereiche' aufzuzählen, die 1952 (bzw. 21963) nicht vorhersehbar waren und heute unseren Alltag prägen und regeln. Der Aufbau enzyklopädischer Orientierungssysteme ist nurmehr in offener und kollaborativer Weise vorstellbar.

VerbaAlpina begegnet der Gefahr, KONZEPTE und Bezeichnungen zu vermischen durch die Fundierung der Onomasiologie in ontologischen, oder wenigstens onotologisch relevanten Normdaten, wie sie vor allem durch Wikidata zur Verfügung gestellt werden.

(auct. Thomas Krefeld)

Tags: Linguistik



Onomasiologische Einteilung

Um die Konzepte in funktionale Kategorien einzuteilen, werden sie in Produkte, Prozesse, Personen, Geräte und Gefäße eingeteilt. Sie können wie folgt charakterisiert werden:

Produkte
Sind im weitesten Sinne Bestandteile des Produkts, d.h. auch Milch kann in diese Gruppe gefasst werden. Desweiteren sind beispielsweise Rahm, Buttermilch sowie Reste wie Molke auch Produkte, aus dem wieder weitere Produkte entstehen.

Prozesse
Über Prozesse werden aus einem wieder andere Produkte (z.B. Molke -> Ziger).

Personen
Meistens sind Personen an Prozessen beteiligt, z.B. der Senner.

Geräte
Die Personen verwenden Geräte, um Produkte in einem Prozess zu verarbeiten. Es wird dazu verwendet, um ein Produkt von dem einen in einen anderen Zustand zu bringen (z.B. die geronnene Milch mithilfe einer Käseharfe zu brechen). Beim Einsatz eines Geräts ist auch immer eine Form von Energie beteiligt, z.B. Muskelkraft oder elektrischer Strom. Die Trennschärfe zum Gefäß ist nicht immer gegeben. Ein Gefäß, das für einen Reifungsprozess vorgesehen ist oder mit dem Flüssigkeit durch Schwerkraft aus einem Produkt, z.B. der Käsemasse entzogen wird, stellt demnach auch ein Gerät dar. Ähnlich ist es mit den verschiedenen Formen von Butterfässern. Sie fassen zwar den Rahm, deren Zweck ist aber nicht die Lagerung, sondern die Verwendung für den Prozess, den Rahm in Butter und Buttermilch zu trennen.

Gefäße
Sind nur für die Lagerung eines Produkts oder für dessen Transport in Verwendung. Das beste Unterscheidungskriterium zum Gerät ist jenes, dass ein Gefäß in der Hinsicht keine Rolle bei einem Prozess spielt, als dass das Produkt dadurch verändert wird.






(auct. Markus Kunzmann)

Tags: Linguistik



Onomasiologischer Rahmen





(auct. Thomas Krefeld)

Tags: Linguistik



Onomastik

Onomastische Befunde, speziell in der Toponomastik, sind für die Einschätzung einer den Sprachwechsel überdauernden siedlungsgeographischen Kontinuität von grundlegender Bedeutung (vgl. Krefeld 2020c, Krefeld 2021i und speziell im Blick auf die Alpen schon Steub 1867 und von Greyerz 1933). Hier sind zwei semantische Typen zu unterscheiden: Auf der einen Seite werden antike Formen aus Substratsprachen übernommen ("[j]ene oft unangenehmen Verräther anderer Zeiten", wie Steub 1867, 142, süffisant sagt). Ihre Freilegung muss die Regelmäßigkeiten der historischen Phonetik beachten und gleichzeitig mit vielfältigen Ausnahmen rechnen, die oft durch volksetymologische Remotivation bedingt sind. Auf der anderen Seite gibt es ‘sprechende‘ Namen, mit denen die Sprecher der Substratsprachen explizit benannt wurden, wie zum Beispiel in den alemannischen und bairischen Namen mit der Basis wal(l)-, walch-, welsch- ‘romanisch‘ (vgl. die klassische Arbeit von Ernst Schwarz 1970 sowie diese Karte). Die Vorgehensweise kann aus zwei entgegengesetzten Perspektiven erfolgen, nämlich ausgehend von antiken Belegen (in Itinerarien, auf Meilensteinen u. a.) nach jüngeren oder aktuellen Entsprechungen suchen oder aber in gegenläufiger Richtung für aktuelle Formen Etyma in Form antiker Belege oder sprachwissenschaftlicher Rekonstruktionen identifizieren.
Die erstgenannte Perspektive ist wegen der überschaubaren Inputdaten zweifellos einfacher, denn sie liefert einen Grundbestand von meist gut lokalisierbaren römischen Namen, der systematisch abgearbeitet werden kann. Weitaus anspruchsvoller und auch erheblich aussagekräftiger ist die Rückperspektive. Hier fehlt es weithin an den Voraussetzungen für eine erfolgreiche großräumige Arbeit; viele Gebiete sind namenkundlich nicht erschlossen, da weder die rezenten dialektalen Varianten noch frühe Belege vorliegen. Immerhin ist mit dem Schweizer Ortsnamenportal ein vielversprechender Anfang gemacht worden.
Neben den Siedlungsnamen ist aber gerade die Dokumentation von Flurnamen (etwa von Bergen und Almen) wichtig, da sie Rückschlüsse auf die kontinuierliche Nutzung des Geländes erlaubt. Dazu das folgende, ganz vorläufige Beispiel: In seiner wichtigen Studie über die frühmittelalterliche Besiedlung des südlichen Oberbayern und der sich anschließenden Tiroler und Salzburger Gebiete schreibt Franz Weindauer 2014 über das Ergebnis einer umfassenden Auswertung der archäologischen Funde: "Der Abgleich mit den Ergebnissen der Ortsnamenkunde und der Patrozinienforschung hat ergeben, dass erneut die bereits in spätrömischer Zeit besiedelten Regionen stichhaltige Hinweise auf romanisches Leben im Frühmittelalter liefern. Dazu zählen in erster Linie das Ammerseegebiet, das Werdenfelser Land, das östliche Chiemseegebiet und der Rupertiwinkel, aber beispielsweise auch die Region um das Mangfallknie, um Rosenheim und um den Starnberger See" (Weindauer 2014, 249). Dabei orientiert sich die Verteilung der archäologischen Fundorte im alpinen Teil seines Untersuchungsgebiets ganz offenkundig an den Passwegen, also etwa an der Brenneroute, die sich in Innsbruck (von Süden aus gesehen) in einen westlichen Zweig (über den Zirlerberg nach Garmisch und ins Alpenvorland) und einen östlichen Zweig (den Inn abwärts) teilt. Schon ein oberflächlicher toponomastischer Blick auf das ausgedehnte Karwendelgebirge, das im Winkel dieser beiden Routen liegt und bis heute keine einzige etwas größere Siedlung kennt, fördert im Abstand von wenigen Kilometern evidente Romanismen oder romanisch vermittelte vorrömische Wörter zu Tage:
* die Fereinalm < lat. veranum, vgl. spa. verano 'Sommer' sowie den Vereinatunnel im Unterengadin;
* die Krapfenkarspitze zur Basis vorrömisch *krapp- 'Fels', vgl. roh. (sursilvan) crap mit sehr zahlreichen Belegen in der Bündner Toponomastik (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorrömisch *blese 'steile Grashalde', vgl. roh. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 sowie die ebenfalls zahlreichen toponomastischen Belege in Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu mit Verlagerung des Akzents auf die erste Silbe; vgl. die schweizerischen Entsprechungen, wie den roh. Ortsnamen glaretsch in Disentis (vgl. Schorta 1964, 164) und den ostschweizerischen alemann. Ortsnamen Glaretsch in Pfäfers (vgl. ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, vgl. die zahlreichen roh. Belege des Typs laret, zur Variante lat. larictum in Schorta 1964, 185;
* den Bergnamen Juifen < lat. iugum 'Joch', wiederum etliche, weitgestreute Parallelen, vgl. die Ortsnamen Juferte im Simmental südlich Bern, mehrere Juf und giuf, giuv in Graubünden (alle im Ortsnamenportal der Schweiz) sowie den Jaufenpass in Südtirol; wenig östlich vom Juifen liegt der Berg Guffert, dessen Name zur genannten Simmentaler Variante gestellt werden muss.
Eine sorgfältige Analyse würde noch erheblich mehr zu Tage fördern. Man beachte beim letzten Beispiel die deutlich nicht mehr lateinische, sondern romanische Lautgestalt (-g- > -v-, -f). Alle diese Übernahmen setzen Kontakt mit einer romanischsprachigen Bevölkerung voraus, die das Gebirge zur Subsistenz nutzte, und wohl auch Akkulturation an ihre Lebensform. In diesem Sinne hat sich schon Gamillscheg 1935, 306 geäußert: "Der alemannische und bajuwarische Bauer, der dem neubesiedelten Boden seine Frucht abringt, stellt die Verbindung mit den unter gleich harten Bedingungen arbeitenden Romanen her. Nichts zeigt deutlicher, daß sich hier keine nationalen Kämpfe abgespielt haben, als die Tatsache, die altromanischen Ortsnamen und die jüngeren deutschen hier ebenso friedlich nebeneinander weiterbestehen wie Ladiner und Deutschtiroler. Das Eindringen der Alemannen und Bajuwaren in den rätisch-norischen Alpenraum hat keine Kulturzerstörung im Gefolge gehabt."

(auct. Thomas Krefeld)

Tags: Linguistik



Ontologie

"What is matter? – Never mind. What is mind? – No matter". Dieses Bonmot, aus der britischen Zeitschrift Punch vom 14. Juli 1855, ironisiert grundlegende Fragen einer Teildisziplin der Philosophie, die als Ontologie bezeichnet wird, nämlich die Fragen nach den Kategorien, in die das Sein (gr. τὸ ὄν 'die Wirklichkeit') eingeteilt werden kann. Der Ausdruck steht also in einer ehrwürdigen philosophischen Tradition. Seit gut 20 Jahren ist er im Zusammenhang mit der Entwicklung des semantic web zu neuem und energischem Leben erweckt worden (vgl. den entsprechenden Wikipedia-Eintrag Ontologie). Mittlerweile werden die Initiativen als 'ontologisch' bezeichnet, die den Ausschnitten der Welt eindeutige digitale Repräsentationen zuweisen, um sie virtuell identifizierbar und verknüpfbar zu machen. Allerdings sind diese beiden Funktionen unterschiedlich gut entwickelt. Während die Identifikation durch den kontinuierlichen Ausbau unterschiedlicher Arten von Normdaten gut voranschreitet, ist die wesentlich anspruchsvollere Verknüpfung der identifizierten Einheiten in der Geolinguistik wie in der Sprachwissenschaft überhaupt allenfalls in Ansätzen zu beobachten.
Wie in Normdaten ausgeführt, unterscheidet VA eigene Identifikatoren für die Datenkategorien (Entitäten) 'Gemeinde' (1), 'Konzept' (2) und 'morpho-lexikalischer Typ' (3). Zwei der drei Kategorien, nämlich die Gemeinden und die Konzepte, wurden mit weithin akzeptierten, projektexternen Identifikatoren verknüpft und sind daher geeignet, unmittelbar einen weiten interoperablen Horizont zu eröffnen.

(1) Gemeinden

Im Fall der Gemeinden wurde der Dienst geonames integriert, der Basisinformationen zu den einzelnen Gemeinden sowie einen Link zu den jeweiligen Wikipedia-Artikeln vermittelt, wie die folgende Karte am Beispiel von Soglio (VA-ID: A60173) zeigt:



(2) Konzepte

Im Fall der Konzepte werden die Identifikatoren von VA mit den entsprechenden Identifikatoren des Wikidata-Projekts (QIDs) verknüpft. Jede Wikidata-ID ist in Gestalt von Tripeln, sogenannten Statements, über 'properties' mit anderen IDs des Wikidata-Projekts verknüpft. So existiert in VA das Konzept MOLKE (VA-ID = C237), das in Wikidata mit der QID Q185009 geführt wird und über die folgenden Statements mit anderen Konzepten verknüpft ist:
Wikidata Statements zum Konzept MOLKE (eng. whey)
item property item
whey Q185009 instance of P:31 chemical substance Q79529
food ingredient Q25403900
part of P527 milk Q8495
has part or parts P527 whey protein Q424430
In formalisierter Gestalt (mittels rdf und OWL) finden diese Tripel und mit ihnen die VA-Konzepte Eingang in das semantic web. Allerdings muss VA darauf verzichten, diese projektexternen Wikidata-Statements systematisch zu kontrollieren und zu vervollständigen.

(3) Morpho-lexikalische Typen

Weniger selbstverständlich ist es auch, die dokumentierten sprachlichen Daten mit Normdaten zu verbinden. Grundsätzlich ist vorgesehen, sie in die lexikographischen Daten des Wikidata-Projekts zu integrieren; dadurch erhalten sie zusätzlich zum VA internen Identifikator eine Wikidata-LID und werden auch projektextern als lexikographisches Objekt, oder: Lexem referenzier- und verknüpfbar. Das Datenmodell der Wikidata-Lexeme enthält auch Informationen über die jeweilige Wortart, sowie Listen der zugehörigen Formen und Bedeutungen. Eine Schwierigkeit besteht jedoch in der Zuweisung angemessener Sprachnamen. Zwar existieren allgemein etablierte Sprachcodes, wie vor allem ISO-639-2, ISO_639-1, ISO_639-5 oder ISO_639-3, die exhaustiv angelegt sind und auch die Dialekte – oder besser gesagt: Sprachen, die herkömmlicherweise als Dialekte gelten, erfasst:

"Whereas ISO 639-1 and ISO 639-2 are intended to focus on the major languages of the world that are most frequently represented in the total body of the world's literature, ISO 639-3:2007 attempts to provide as complete an enumeration of languages as possible, including living, extinct, ancient and constructed languages, whether major or minor, written or unwritten. As a result, ISO 639-3:2007 deals with a very large number of lesser-known languages." (Quelle)

Nun handelt es sich im Fall von VA ausnahmslos um dialektale Daten, die zwar einerseits exakt in den Gemeinden des Untersuchungsgebiets georeferenziert und insofern lokalen Ortsdialekten eindeutig zugeordnet sind, die sich jedoch andererseits einer eindeutigen, trennscharfen Kategorisierung im Sinne ortsübergreifender, regionaler Dialekte ('Piemontesisch', 'Lombardisch' usw.) entziehen. Dergleichen Klassifikationen sind grundsätzlich als mehr oder weniger diskutable Resultate der akademischen Dialektologie anzusehen und finden häufig kein Korrelat im Wissen der Sprecher selbst; selbst die Wissenschaft spricht seit Ascoli 1873 in vielen Gegenden von 'Übergangsgebieten' bzw. auf ita. von anfizone (vgl. Petracco Sicardi/Anzaretti 1989). Vor diesem Hintergrund hat sich VA für einen anderen Weg entschieden, der sich ganz schlüssig aus der Organisation der Sprachdaten, insbesondere aus der Typisierung ergibt. Ein 'morpho-lexikalischer Typ' ist etymologisch und morphologisch, aber nicht phonetisch definiert; er umfasst also eine variable Menge mehr oder weniger verschiedener phonetischer (und graphischer) Varianten. Alle Varianten werden auf der interaktiven Karte von VA dokumentiert. So sind z.B.
ausgewählte Varianten für die Bezeichnungen des Konzeptes WASSER, die auf lat. aqua(m) zurückgehen. Die Varianten lassen sich jedoch in den Suchfiltern der interaktiven Karte nicht einzeln aufrufen, sondern jeder Typ, d.h. jede Gruppe von zusammengehörigen Varianten, wird im Filter durch eine einzige Variante repräsentiert; diese repräsentativen Varianten, sozusagen die Nennformen oder Leitformen der morpho-lexikalischen Typen, entsprechen – wenn möglich – den 'großen' Standardsprachen Französisch und Italienisch. Im genannten Beispiel sind dies fra. eau und ita. acqua 'Wasser'; diese Leitformen sind mit Referenzwörterbüchern verlinkt. Falls weder das Standardfranzösische noch das Standarditalienische dergleichen Leitformen liefern, übernimmt eine andere Variante diese Funktion, die – wenn möglich – ebenfalls mit einem großen Referenzwörterbuch verlinkt wird (z.B. mit dem DRG, dem GPSR, dem VSI u.a.). Nur im seltenen Fall, wo auch dies nicht möglich ist, wählt VA eine Leitform, die nicht über ein Referenzwörterbuch lexikographisch abgesichert ist. Die Leitformen werden mit einem Sprachcode verknüpft, der sich sehr oft explizit aus dem Titel des Referenzwörterbuchs ergibt, wie z.B. im Fall des Trésor de la langue française (TLFi), wo ausdrücklich die französische Sprache als Inhalt des Thesaurus (fra. trésor) genannt wird.

Alle lokalen Varianten können der jeweiligen Leitform dann mittels einer geeigneten Property, wie z.B. alternative form (P8530) zugeordnet und über die Property located in the administrative territorial entity (P131) georeferenziert werden.
Die Leitform entspricht in der Wikidata-Welt einem Lexem, während alle lokalen Varianten diesem dann als Formen zugeordnet werden können. Die Formen werden mit der Property variety of form (P7481) lokalisiert und mit der Qualifier-Property subject sense (P6072) einer oder mehreren Bedeutungen des Lexems zugeordnet, sodass die grundlegende Information vollständig abgebildet wird. Dabei stellt variety of form eher eine Notlösung dar, da diese eigentlich zur Zuordnung eines regionalen Dialektnamens (z.B. 'Bairisch') gedacht ist (vgl. hier) und nicht zur exakten, georeferenzierten Lokalisierung. Eine geographische Zuordnung einer Form wird zwar in der Konzeption des Lexemdatenmodells unter dem Namen used in region genannt, zum aktuellen Zeitpunkt ist eine solche Property allerdings nicht vorhanden. Die bestehende Property located in the administrative territorial entity (P131) kann nur für Wikidata Items und nicht für Lexeme verwendet werden.
Unabhängig von spezifischen Sprach- oder Dialektnamen liefert Glottolog 4.5 außerdem Kodierungen für rein geographisch bestimmte Dialekträume, die by default den alpinen Dialektformen zugeordnet werden:
Zwischen morpho-lexikalischen Typen können zwei unterschiedliche historische Relationen bestehen: Vererbung aus älteren auf jüngere Sprachstufen innerhalb einer Sprachfamilie (z.B. Latein → Romanisch) und Entlehnung zwischen den drei Sprachfamilien (Romanisch ↔ Germanisch, Romanisch ↔ Slawisch, Germanisch ↔ Slawisch).
Diese beiden Relationen werden ebenfalls über Wikidata properties ontologisiert. Dafür steht die Property derived from lexeme (P5191) zur Verfügung, deren Typ durch mode of derivation (P5886) entweder mit inheritance (Q56611986) oder linguistic borrowing (Q31094516) genauer spezifiziert werden kann.

(auct. Thomas Krefeld | Florian Zacherl)

Tags: Linguistik Informationstechnologie