Methodologie
Alle Einträge anzeigen
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Abkürzungen
Gleichzeitig wurden in den Texten alle Sprachkürzel an die ISO-Normen 639-3 (Einzelsprachen) und 639-5 (Sprachfamilien) angepasst und diese folglich in das Abkürzungsverzeichnis aufgenommen.
Bibliographische Abkürzungen
Mehrbändige Referenzwerke erhalten eine Sigle (z.B. AIS). Andere, in der Bibliographie vollständig aufgenommene Titel werden mit dem Autornamen und dem Jahr der Erscheinung abgekürzt zitiert (z.B. Baer 2000). Zwei Namen werden mit Schrägstrich getrennt (z.B. Jaberg/Jud 1929), ab drei Namen wird "et al." verwendet.


(auct. Beatrice Colcuc | Thomas Krefeld | Stephan Lücke)
Tags: Webseite
Aktualisierung der Daten für die Visualisierung
Sprachliche Kerndaten:
CALL zling();
Daten der sprachbezogenen Peripherie:
CALL zgeo();
(auct. Florian Zacherl)
Tags: Informationstechnologie
Alpenkonvention
Die Alpenkonvention ist einer der offiziellen Kooperationspartner von VerbaAlpina. Aus methodischer Sicht besitzt die Alpenkonvention für VerbaAlpina insofern eine besondere Bedeutung, als die von der Alpenkonvention vorgenommene geographische und auf administrativen Grenzen basierende Definition des Alpenraums ("Perimeter der Alpenkonvention") von VerbaAlpina übernommen und als Untersuchungsraum festgelegt wurde. Diese technisch-bürokratische Abgrenzung ist aus methodischer Sicht unumgänglich, auch wenn man angesichts fließender Übergänge der sprachlichen und kulturellen Realität auf diese Weise in vielfacher Hinsicht nicht wirklich gerecht wird. Als Beispiel sei hier das in der Schweiz gelegene Emmental genannt, das sich knapp außerhalb der Grenzen der Alpenkonvention befindet und daher nicht von VerbaAlpina berücksichtigt wird, obwohl es mit seiner Milchwirtschaft den entsprechenden Wirtschaftsformen des Alpenraums sehr ähnlich ist. Auf der anderen Seite reicht das Gebiet der Alpenkonvention gerade im bayerischen Alpenvorland weit in die Ebene und damit in Regionen hinaus, die weit weniger mit den Verhältnissen im gebirgigen Bereich der eigentlichen Alpen vergleichbar sind als etwa das Emmental.
(auct. Stephan Lücke)
Alpenwörter
Der Ausdruck VerbaAlpina schließt ganz bewusst an diese Kategorie an, die sich als sehr hilfreich für eine Untersuchung der Mehrsprachigkeit erweist. Denn sie erlaubt es, diejenigen lexikalischen Einheiten zu identifizieren, die den alpinen Kulturraum sprachlich charakterisieren und die unterschiedliche Entlehnungsprozesse voraussetzen, ohne dabei jedoch einzelne Sprachen besonders zu fokussieren. Um das Konzept der verba alpina (oder: Alpenwörter) jedoch zu operationalisieren, muss es im Rahmen des Projekts präzisiert werden: Als 'alpin' werden einerseits diejenigen lexikalischen Typen bezeichnet, die eindeutige Entsprechungen in mehr als einer der drei traditionellen Sprachfamilien des Alpenraums haben und andererseits diejenigen, die zwar nur im Romanischen belegt sind, aber die sich nicht auf das Lateinische, sondern auf regionale, vorlateinische Substrate zurückführen lassen. Es ergeben sich nun sieben hybride Gruppen:
Mögliche Entsprechungen eines Alpenworts | ||||
Vorlateinisch | Romanisch | Germanisch | Slavisch | |
x | x | x | x | ‘alpin’ im engeren Sinn |
x | x | x | ‘alpin’ im weiteren Sinn | |
x | x | x | ||
x | x | |||
x | x | |||
x | x | |||
x | x |
(auct. Thomas Krefeld)
Tags: Linguistik
Analoge Sprachgeographie

Dergleichen Inkonsistenzen müssen bei der digitalen Datenaufnahme unbedingt beseitigt werden; oberstes Gebot ist hier die scharfe Trennung der genannten inhaltlichen Dimension, sozusagen die systematische Dekonstruktion der gebotenen Information.

Im Zuge einer solchen Dekonstruktion ergibt die oben als Beispiel genannte Karte folgende Datensätze:
AIS 1192a, Stimulus LA CASCINA DI MONTAGNA; SENNHÜTTE
weitere Stimuli (= onomasiologisch eindeutige KONZEPTE): 8 (MILCHKELLER, KÄSEKELLER, LA CANTINA DA LATTE, MAIENSÄSSE, ALMSTALL, SCHLAFRAUM IN DER SENNHÜTTE, ANDERE ÖKONOMIEGEBÄUDE, DIE ALP WECHSELN)
mögliche untergeordnete KONZEPTE: 120
sprachliche Einzelbelege: 1032
Erhebungsorte: 134
Im Anschluss können dann alle Informationen in konsistenten Kategorien und quasi beliebiger Kombination aus der Datenbank abgerufen und visualisiert werden.
(auct. Thomas Krefeld)
Tags: Linguistik
API
(auct. Stephan Lücke)
Tags: Informationstechnologie
Autorenschaft
Die Software wird im Wesentlichen von Florian Zacherl, David Englmeier (seit 1.10.2016) und Filip Hristov (seit 1.10.2016) entwickelt.
(auct. Thomas Krefeld | Susanne Oberholzer | Florian Zacherl)
Tags: Webseite
Autorensignaturen
- Einfache Siglen, z.b. SO = 'in Arbeit'
- Siglen in runden Klammern, z.B. (SO) = 'fertig'
- Siglen in geschweiften Klammern, z.B. {SO} = 'Veränderungen vorgenommen'
Analog für mehrere Autoren. Übersetzer werden wie weitere Autoren behandelt: SO/SL, ebenfalls mit den o.g. Klammerregeln. Aus den Signaturen geht hervor, wer Erstautor (= auct.) und wer Übersetzer (= trad.) ist. Jeder Übersetzer sollte unbedingt auch unklare Stellen im Original nach Rücksprache mit dem Originalautor verbessern.
Die genannten Auszeichnungskonventionen gelten nur für VA_XXX; in abgeschlossenen Versionen werden alle Signaturen auf (nn) bzw. (nn | nn) gesetzt.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Webseite
Belegorte
Die Namen kleinerer Weiler haben jedoch oft keine Lokalzusätze. Hier wird die Gemeinde, der der Belegort angehört, in Klammern dahinter gesetzt, z.B. St. Magdalena (Gries), St. Magdalena (Villnöss).
(auct. Mona Neumeier)
Tags: Linguistik
Betacode
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):

Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel der Punkt unterhalb des e im Wort tega durch ein Fragezeichen wiedergegeben: te? . Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Beta-Kodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Linguistik Informationstechnologie
Bezeichnung

(auct. Stephan Lücke)
Tags: Linguistik
Bilder
Fotos sind jedoch nicht nur Bilder, sondern Abbilder der Wirklichkeit, denn es handelt sich grundsätzlich um Dokumente, die ihren Sitz in Raum und Zeit haben. Sie sind technisch gesprochen chrono- und georeferenzierbar, da sie einen Ausschnitt der Welt zu einem bestimmten Zeitpunkt überliefern, wobei Motiv- und Perspektivwahl des Fotografen als Teil dieser Wirklichkeit betrachtet werden müssen. Die nachträgliche Veränderung von Fotografien etwa aus ästhetischen Gründen ist deshalb ausgesprochen problematisch, weil sie Fotos – Abbilder – von der fotografierten, abgebildeten Wirklichkeit entkoppeln und zu Bildern machen; semiotisch gesprochen zerstört oder erodiert sie die Referenz des Fotos. Denn in diesem Fall erfolgt eine im nachhinein kaum auflösbare Vermischung unterschiedlicher Realitäten – nämlich jener, die der ursprünglichen Entstehung des Fotos zu Grunde lag, und jener, die sich in der nachträglichen Manipulation versteckt, da sie gerade nicht offensichtlich, oder: manifest ist. VerbaAlpina verzichtet daher ganz überwiegend auf jede Veränderung einmal in den Datenbestand übernommener Fotos. Zu den ganz wenigen Ausnahmen gehören die Titelbilder des VerbaAlpina-Portals (VA_WEB), bei denen ästhetische Attraktivität von VerbaAlpina höher bewertet wird als die Funktion der Dokumentation. Im Methodologie-Beitrag Versionierung werden in der Galerie der VA-Titelbilder gegebenenfalls die Originalbilder neben die modifizierten Titelbildversionen gesetzt.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Außersprachlicher Kontext
Chronoreferenzierung
Ein besonderes Beispiel liefert der ASLEF, bei welchem die Chronoreferenzierung besonders deutlich zum Ausdruck kommt, da neben den selbsterhobenen Daten für dieselben Ortschaften auch Belege der Sprachatlanten ALI und AIS aufgenommen wurden. In diesem Sinne entsteht eine diachrone Perspektive, da die vom AIS erhobenen Sprachdaten aus den Jahren 1921-1922 und die Daten des ALI aus den Jahren 1925-1943 neben die Daten vom ASLEF selbst aus den Jahren 1974 bis 1986 gestellt werden. Auf den Karten vom ASLEF wird dies durch diverse Symbole zu Kenntnis gebracht:

Das „P“ bezieht sich dabei auf die vom ALI erhobenen Daten, während das „S“ symbolisch für die vermerkten Daten des AIS steht. Diese beiden Buchstaben referieren auf die Exploratoren der Sprachatlanten. So steht "P" für Ugo Pellis, den Explorator des Sprachatlanten ALI. "S" bezieht sich hingegen auf den Explorator vom AIS, Paul Scheuermeier.
Diese Buchstaben sind auf den ASLEF-Karten vermerkt, wenn keine eigenen Belege vorliegen. Es wird also darauf hingewiesen, dass an diesen Ortschaften die Belege nur vom AIS bzw. ALI übernommen wurden. Wurden jedoch zusätzlich auch vom ASLEF Daten erhoben, die zudem mit denen der anderen beiden Sprachatlanten übereinstimmen, stehen die Buchstaben dem jeweiligen Sprachatlas entsprechend in einem Rechteck (AIS) bzw. in einem Kreis (ALI) hinter den auf den Karten des ASLEF verzeichneten Belegen. Bei denjenigen Belegen, bei welchen vom ASLEF divergierende Daten gegenüber den Daten eines der anderen beiden Sprachatlanten erhoben worden sind, wird dies durch ein Rechteck ohne "S" (AIS) bzw. einen Kreis ohne "P" (ALI), die bei den vom ASLEF erhobenen Belegen stehen, vermerkt.
Eine Berücksichtigung dieser Abkürzungen ist bei der Transkription für VerbaAlpina allerdings nicht vonnöten, da die damit verbundene Chronoreferenzierung, automatisch in den digitalen Karten von VerbaAlpina zu tragen kommt, wenn Belege aller Sprachatlanten eingespeist werden und alle Belege ein- und derselben Ortschaft einen Hinweis auf ihre Quelle geben. Dadurch entsteht eine diachrone Perspektive, die in bestimmten Fällen den Vergleich von diversen Belegen aus den jeweils unterschiedlichen Erhebungsjahren der Sprachatlanten zulässt. Folglich kann hier von einer Chronoreferenzierung, die in den Karten von VerbaAlpina zum Vorschein kommt, gesprochen werden.
(auct. Katharina Knapp | Thomas Krefeld | Stephan Lücke)
Tags: Webseite
Codepage
Nachfolgend ein Auszug aus der für die Konvertierung des AIS-Transkriptionssystems in IPA grundlegenden Codepage. Insgesamt umfasst diese Codepage rund 4500 Zeilen/Zuordnungen:

Die Kolumne `BETA` enthält die im AIS verwendeten Zeichen in nach dem Prinzip des Betacodes transkribierter Form, die Kolumne `IPA` das jeweils entsprechende IPA-Zeichen und die Kolumne `HEX` den oder die Zahlenwerte der Unicodetabelle, die dem jeweiligen IPA-Zeichen entsprechen.
Eine vollständige Übersicht über die Codepages für alle Quellen von VerbaAlpina findet sich hier.
(auct. Stephan Lücke)
Tags: Linguistik Informationstechnologie
Crowdsourcing
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008).
Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.
In VerbaAlpina geht es konkret darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen. Sehr interessiert ist VerbaAlpina darüber hinaus an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wer immer also Kenntnisse eines im Alpenraum gesprochenen Dialekts hat, ist eingeladen, spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina einzutragen. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z. B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich am Projekt in dieser Weise beteiligen. – Außerdem sind Bilder von alpentypischen Objekten, aber auch von Almen, Hütten, Flora, Fauna, Bergen und Landschaftsformen mitsamt ihren Bezeichnungen willkommen. Sie können in der Mediathek gespeichert werden.
Parallel zur gezielten Mitarbeit bei VerbaAlpina erhält jeder Nutzer die Möglichkeit, sich in unserem System eine eigene Forschungsumgebung einzurichten, die für die Sammlung von hauptsächlich Sprachdaten, jedoch durchaus auch von anderen Daten verwendet werden kann. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Er hat die Möglichkeit, diese Daten gleichsam ausschließlich für die persönliche Verwendung unter Verschluss zu halten oder aber den Zugriff anderen Nutzern freizugeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Nur wenn möglichst viel Daten der Allgemeinheit zur Verfügung gestellt werden, kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.
VerbaAlpina dokumentiert die Vitalität des Crowdsourcing-Tools auf einer speziellen Übersichtsseite. Die Erfahrungen des nunmehr seit über zwei Jahren währenden Einsatzes des Crowdsourcing-Tools von VerbaAlpina haben gezeigt, dass der erfolgreiche Einsatz eines solchen Werkzeugs generell und ganz entscheidend von flankierenden Publicity-Maßnahmen abhängt. Die Aktivitäten der Crowd steigen jedesmal an, wenn das VA-Crowdsourcing in der Öffentlichkeit thematisiert worden ist.
Neben dem Crowdsourcing-Tool zur Sammlung von Dialektbezeichnungen für ausgewählte Konzepte hat VerbaAlpina ein weiteres Crowdsourcing-Instrument entwickelt. In diesem Fall geht es um die Beteiligung der Crowd an der Transkription von Sprachatlanten. Konkret werden Freiwilligen Ausschnitte von AIS-Karten präsentiert, die dann nach den Transkriptionsregeln von VerbaAlpina manuell erfasst werden sollen. VerbaAlpina hat bei der Realisierung des Tools auf ein Framework zurückgegriffen, das von dem Crowdsourcing-Portal Zooniverse zur freien Verfügung gestellt wird. Die ursprüngliche Idee war gewesen, da es sich um eine Art Baukastensystem handelt, den Entwicklungsaufwand vergleichsweise gering zu halten – eine Hoffnung, die sich allerdings nicht bestätigt hat; die Arbeiten haben sich als durchaus aufwendig herausgestellt. Seit dem ersten Halbjahr des Jahres 2020 ist das Tool verfügbar, eine Bewerbung hat allerdings noch nicht stattgefunden, so dass bislang (Juni 2020) erst wenige Testtranskriptionen über das Tool eingehoben werden konnten. Immerhin ist die volle Funktionalität gewährleistet. Das Tool läuft auf den Servern des Zooniverse-Projekts und ist unter der Adresse https://www.zooniverse.org/projects/filip-hr/verbaalpina erreichbar (Verlinkung im Menüpunkt "Mitmachen"). Die eingetragenen Transkriptionen können in eine csv-Datei exportiert werden, die dann wiederum in die Datenbank von VerbaAlpina importiert wird. Die entsprechende Prozedur wird demnächst en Detail dokumentiert.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Funktionsbereiche
Datenbank-Dokumentation
Die VA-MySQL-Datenbank ist sehr komplex. Sie besteht derzeit (Mai 2020) aus 156 Tabellen mit insgesamt 1,6 GB Daten. Eine detaillierte Beschreibung des Inhalts und der Funktion jeder einzelner dieser Tabellen ist im VA-Modul VA_WEB abgelegt (Link). Für weitere Details sei auf den Eintrag Technologie verwiesen.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Datenformat
Datenmodellierung
Von der Datenmodellierung sind zu unterscheiden die Datenstrukturierung und das Datenformat. Mit Datenstrukturierung ist die konkrete Anwendung des theoretischen Datenmodells auf einen Datenbestand gemeint, als deren Ergebnis eine strukturierte Repräsentation der Daten etwa in Gestalt einer oder mehrerer Tabellen vorliegt. Ein strukturierter Datenbestand kann wiederum in unterschiedlichen Datenformaten abgebildet werden (z.B. in Tabellenform = relationales Datenformat, XML-Format usw.), wobei häufig eine Transformation von einem in ein anderes Format möglich ist.
s. auch Relationales Datenmodell
(auct. Stephan Lücke)
Tags: Informationstechnologie
Datenstrukturierung
Datenzugriffsschicht
(auct. Stephan Lücke)
Tags: Informationstechnologie
Digital Humanities
(1) Digital hat eine Reihe komplexer Implikate:
- Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
- Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
- Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
- Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.
(auct. Thomas Krefeld)
Tags: Informationstechnologie
Digital Object
Für die Erzeugung echter Interoperabilität ist es jedoch unerlässlich, die technische Dimension des Konzepts DIGITAL OBJECT um eine inhaltliche zu ergänzen. Diese inhaltliche Dimension muss überdies einem verbindlichen strukturierenden System unterliegen, das in etwa vergleichbar wäre mit den kontrollierten Vokabularen, wie sie z.B. von den Bibliotheken zur inhaltlichen Erschließung von analogen und digitalen Beständen eingesetzt werden. Konkret wäre klar zu umreißen, welche Entitäten den Status eines Digital Object erhalten können, wie die logische innere Struktur dieser Objekte auszusehen hat und welches Benennungsschema angewendet werden soll. Wesentliche Voraussetzung für den nutzbringenden Einsatz eines entsprechenden Konzepts wäre sicherlich eine möglichst feine Granulierung von Datenbeständen. Erst dann ist eine effektive Vernetzung im Sinne echter Interoperabilität gewährleistet, wodurch sich die entsprechenden Maßnahmen als eine tragende Säule bei der Umsetzung der FAIR-Kriterien erweisen.
Die Entwicklung und Durchsetzung eines entsprechenden Systems bzw. darauf aufbauender Verfahren kann nicht von Einzelprojekten geleistet werden. Vielmehr sind hier wissenschaftspolitische Weichenstellungen unerlässlich, die z.B. der Rat für Informationsinfrastrukturen (RfII) vornehmen könnte. Auch die derzeit (2020) entstehenden NFDI-Konsortien könnten auf die Entwicklung und Etablierung entsprechender Konventionen hinwirken.
VerbaAlpina definiert versuchsweise die im Projekt gesammelten morpholexikalischen Typen und Konzepte zusammen mit den jeweils verbundenen Metadaten als digitale Objekte. Zu diesem Zweck werden die entsprechenden Daten typ- bzw. konzeptweise in einzelnen, über URLs und in der Folge auch DOIs erreichbaren, Text-Dateien abgelegt. Diese Dateien werden außerdem von der UB der LMU übernommen. Dabei werden die Daten zusätzlich in schematisierten Metadatenformaten (DataCite für die generischen Metadaten, CIDOC-CRM für die inhaltliche Tiefenerschließung) erfasst, was schließlich zur Auffindbarkeit der digitalen Objekte auch über die Bibliothekskataloge führt.
Literatur: Hui 2012; Hui 2016; Thomas Krefeld (2018): Linguistische Theorien im Rahmen der digital humanities. Korpus im Text. Version 1 (27.08.2018, 21:33). url: https://www.kit.gwi.uni-muenchen.de/?p=28010&v=1.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Digital Object Identifier (DOI)
Voraussetzung für das zuverlässige Funktionieren des Konzepts der DOI ist neben dem verantwortungsbewussten Handeln des Domainbetreibers auch die Verlässlichkeit der mit der Pflege der entsprechenden Zuordnungstabellen beauftragten Institution, also der zuständigen DOI-Registrierungsagentur. Diese sollte eine möglichst unbegrenzte Existenzperspektive besitzen, so wie dies etwa bei den Universitäts-, Staats- und Nationalbibliotheken gegeben ist. In jedem Fall sollte der Domainbetreiber allfällige Änderungen der Adresse eines digitalen Objekts an die Registrierungsagentur melden, damit diese die entsprechenden Einträge im DOI-Register anpassen kann. Umgekehrt sind auch regelmäßige Überprüfungen von Seiten der DOI-Registrierungsagentur(en) vorstellbar, in etwa vergleichbar mit den traditionellen "Revisionen" in Bibliotheken.
Der DOI von VerbaAlpina lautet doi:10.5282/verba-alpina. Die Zahl vor dem Schrägstrich (10.5282) wird als Präfix, die sich anschließende Zeichenfolge als Suffix bezeichnet. Das Präfix ist der zuständigen DOI-Registrierungsagentur – in diesem Fall der Universitätsbibliothek der LMU – zugeordnet. Damit ein Zitat beispielsweise in einem wissenschaftlichen Aufsatz direkt auf das Portal von VerbaAlpina führt, muss dem DOI die URL der DOI-Stiftung vorangestellt werden: http://dx.doi.org/10.5282/verba-alpina.
Nahezu demselben Zweck wie der DOI dient der sogenannte Uniform Resource Name (URN), und auch die Funktionsweise ist in etwa die gleiche. Anders als beim DOI ist beim URN jedoch die Registrierung mehrerer URLs für eine Ressource möglich. Dies kann etwa dann von Interesse sein, wenn Ressourcen im Sinne der Ausfallsicherheit oder Nachhaltigkeit auf verschiedenen Servern mit entsprechend unterschiedlichen URLs abgelegt werden. Anders als beim DOI wird das URN-Register nicht von einer einzigen Institution, sondern dezentral von verschiedenen nationalen Organisationen betrieben. Das Auffinden einer Webressource kann nur über den Registrierungsserver ("Resolver") der Institution erfolgen, bei der der URN registriert worden war. Für Deutschland übernimmt diese Aufgabe die Deutsche Nationalbibliothek (DNB). Die URN von VerbaAlpina lautet urn:nbn:de:bvb:19-verba-alpina-8. Das Portal von VerbaAlpina ist unter Einbindung des DNB-Resolvers unter der URL http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8 erreichbar.
Grundsätzlich ist es möglich, DOIs und URNs auch für Teilressourcen einer Domain (z.B. einzelne Webseiten oder Mediendateien) registrieren zu lassen. Alternativ können Teilressourcen einer Domain auch über die Einbindung der URL-Parameter in den DOI angesprochen werden. Dafür muss eine spezielle Syntax verwendet werden, die durch das folgende Beispiel illustriert wird: Der auf die URL des Eintrags Forschungsdatenmanagement verweisende DOI sieht folgendermaßen aus:
http://dx.doi.org/10.5282/verba-alpina?urlappend=/%3fpage_id=493%26db=xxx%26letter=F#112
Das Beispiel zeigt, dass das Fragezeichen sowie die sog. "Ampersands" (&) durch den jeweiligen Hexadezimalwert des Zeichens in der Unicode-Tabelle (? = 3f, & = 26) ersetzt werden müssen.
Literatur: Dreyer 2012
(auct. Stephan Lücke | Julian Schulz [ITG])
Tags: Informationstechnologie
Digitalisierung

Dabei kommt quasi ausschließlich das relationale Datenmodell zum Einsatz, bei dem das Datenmaterial grundsätzlich in Tabellengestalt organisiert wird. Die Tabellen bestehen aus Zeilen (= Datensätze, Tupel) und Spalten (= Attribute, Felder, Eigenschaften), wobei jede Tabelle in jede Richtung um zusätzliche Zeilen und Spalten erweitert werden kann. Zwischen den Tabellen bestehen logische Zusammenhänge, die sinnvolle Verknüpfungen und entsprechende synoptische Darstellungen (sog. "Joins") von zwei und mehr Tabellen erlauben. Für die Verwaltung der Tabellen setzt VerbaAlpina derzeit das Datenbankmanagementsystem MySQL ein, die Tabellen sind jedoch nicht an dieses System gebunden, sondern können jederzeit z.B. in Textgestalt mit eindeutig zu definierenden Trennzeichen für Feld- und Datensatzgrenzen (sog. Separatoren) zusammen mit den Spaltennamen und der Dokumentation der logischen Zusammenhänge (Entity-Relationship-Modell) exportiert werden. Die derzeit vielfach verwendete XML-Struktur wird im operativen Bereich von VerbaAlpina nicht eingesetzt. Im Rahmen des Schnittstellenkonzepts ist XML jedoch als Exportformat verankert.
Neben der logischen Strukturierung der Daten spielt im Zusammenhang mit dem Stichwort "Digitalisierung" die Kodierung der Schriftzeichen die zweite zentrale Rolle. Gerade im Hinblick auf die Langzeitarchivierung des Datenmaterials ist der richtige Umgang mit dieser Thematik von großer Bedeutung. Soweit möglich, orientiert VerbaAlpina sich dabei an der Kodierungstabelle und den Vorgaben des Unicode-Konsortiums. Im Fall der Digitalisierung von Schriftzeichen, die bislang noch nicht in die Unicodetabelle aufgenommen sind, erfolgt die digitale Datenerfassung eines Einzelzeichens vorzugsweise durch Serialisierung in Gestalt einer Abfolge von Zeichen aus dem Unicode-Bereich x21 bis x7E (innerhalb des ASCII-Bereichs). Die entsprechenden Zuordnungen werden in speziellen Tabellen dokumentiert, wodurch eine spätere Konvertierung in dann möglicherweise vorhandene Unicodewerte stets möglich ist.
(auct. Stephan Lücke)
Tags: Linguistik Informationstechnologie
Dokumentation
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).
Perspektive
Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Hinblick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.Dabei wird ausschließlich bottom upverfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als Ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.
Kartographie
Den Zugang zur Dokumentation vermittelt vor allem ein interaktive Karte. Bislang werden zur Visualisierung nur Punktsymbolkarten mit interaktiven Symbolen eingesetzt. Komplementär wird eine interaktive Flächensymbolisierung auf Basis der Gemeindeflächen vorbereitet, um eine bessere Visualisierung quantitativer Verhältnisse zu erzielen. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern.Linguistische Datenaufbereitung
Bei Aktivierung ('Klick') eines Punktsymbols öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten; das folgende Beispiel zeigt die Bezeichnung des Konzepts BUTTER in Ramosch (Unterengadin): Vgl. Karte Konzept BUTTERDie Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Demnächst kommen – wenn möglich – Verweise auf Referenzwörterbücher hinzu.
Filter
Mehrere Filter erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen. Der oben gezeigte Kartenausschnitt stammt aus der Karte, die bei Auswahl des 'Konzepts' BUTTER erscheint:
Filter zu Steuerung der interaktiven Karte
Gruppieren und Sortieren
Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) führt zu 1448 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:
Die Sortierfunktion der interaktiven Karte: Konzepte
Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen oder Basistypen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:

Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen.
Polysemie des morpho-lexikalischen Typs malga: Vgl. Karte morpho-lexikalischen Typs malga
Quellen
Bislang wurden einige georeferenzierbare Wörterbücher, vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:- Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.).
- Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD-II und den ALTR praktiziert.
- Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; dies gilt bislang vor allem für SAO-Daten.

Das von VA entwickelte Transkriptionstool
Multidimensionalität
Für ein umfassendes Verständnis der historischen Prozesse ist es unbedingt wünschenswert, die sprachliche Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die- Orte mit lateinischen Inschriften in der Provinz Noricum
;
- Orte mit lateinischen Inschriften aus Raetien
;
- aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae
.
- Basistyp lat. casearia in der Bedeutung 'Hütte'
in Nord-, Süd- und besonders prägnant in Osttirol;
- den Basistyp vorrömisch baita in der Bedeutung 'Haus'
in Slowenien südlich von Ljubljana;
- den Basistyp lat. cellarium in der Bedeutung 'Hütte'
in Oberösterreich.
Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.
(auct. Thomas Krefeld)
Tags: Funktionsbereiche
Entity Relationship
In einer relationalen Datenbank werden Entitäten idealerweise in jeweils eigenen Tabellen gespeichert, wobei jede Tabellenspalte die Werte jeweils eines spezifischen Merkmals aufnimmt. Die Tabellenzeilen enthalten die individuellen, durch ihre Merkmalswerte von einander unterschiedenen Mitglieder der Datenklasse (Entität). In den allermeisten Fällen – und so auch bei VerbaAlpina – stellt eine relationale Datenbank eine Sammlung verschiedener Entitäten (und somit Tabellen) dar, zwischen denen logische Beziehungen bestehen. So wäre etwa die Entität "Informant", die durch die Merkmale "Alter", "Geschlecht", "Geburtsort" und "Wohnort" definiert ist, mit der Entität "Orte" in der Weise logisch verbunden, dass die Werte der Merkmale "Geburtsort" und "Wohnort" Entsprechungen in der Entität "Orte" besitzen. Beziehungen zwischen Mitgliedern dieser beiden Entitäten ergeben sich aus Übereinstimmungen der Werte eines oder mehrerer, ihrem Wesen nach kongruenter, Merkmale der jeweiligen Entitäten. Im gegebenen Fall könnte sich theoretisch eine Zuordnung aus identischen Werten der Merkmale "Geburtsort" und "Ortsname" ergeben, wodurch mittelbar einem Informanten die Geokoordinaten seines Geburtsortes zugeordnet werden könnten. Es ist leicht zu erkennen, dass in diesem Beispiel Probleme aufgrund von Homonymen auftreten könnten. Um dergleichen zu vermeiden, ist es üblich, Ganzzahlen als Identifikatoren (kurz: "ID") zu verwenden, die die Mitglieder einer Entität eindeutig bezeichnen.
Das skizzierte System der Entitäten und ihrer logischen Zusammenhänge wird als Entity Relationship bezeichnet. Der in einer relationalen Datenbank gesammelte Datenbestand ist ohne eine Erläuterung dieser dort bestehenden Abhängigkeiten nur schwer versteh- und nutzbar. Üblicherweise erfolgt die Abbildung der Entity Relationship in Gestalt eines graphischen Schemas.
Die Entity Relationship unterliegt während der zyklischen Entwicklungsphasen von VerbaAlpina (s. Versionierung) ständigen Anpassungen und somit Veränderungen. Jeder archivierten Version von VerbaAlpina wird das Entity Relationship Modell der jeweils zugrundeliegenden Datenbankversion in Form eines ER-Diagramms beigegeben, das mit dem Programm yEd erzeugt und als GraphML abgespeichert wird. Die mit automatischen Tools erzeugten Diagramme werden wegen des damit verbundenen erheblichen Arbeitsaufwands nicht nachträglich graphisch aufbereitet. Aus diesem Grund und wegen der hohen Komplexität der abgebildeten Strukturen sind sie daher in aller Regel für Außenstehende nicht auf Anhieb zu verstehen. Sie enthalten jedoch alle für das Verständnis der Struktur von VA_DB nötigen Informationen und stellen somit eine wichtige Voraussetzung für die Nutzung der Datenbank auch nach dem Ende der Projektförderung dar. Folgende Graphik basiert auf den Entitäten und Verknüpfungen der Datenbank VA_XXX in ihrem aktuellen Zustand (30.11.2017), bildet diese jedoch nicht vollständig ab und ist nur als illustrierendes Beispiel zu verstehen:

(auct. Stephan Lücke)
Tags: Informationstechnologie
Ergänzende Daten
Ökologische und geophysikalische Daten sind immer dann relevant, wenn sie einen klaren Bezug zur Siedlungsgeschichte haben. Das ist zum Beispiel evident im Hinblick auf die Vegetationszonen, die bestimmte Nutzungen gestatten oder verlangen (z. B. die Almwirtschaft setzt Höhenlagen über der Baumgrenze voraus (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_DE).
(auct. Thomas Krefeld)
Tags: Außersprachlicher Kontext
Erklärungssprache
(auct. Thomas Krefeld)
Tags: Webseite
Ethnolinguistik
In der romanistischen, aber vor allem italianistischen Forschungstradition war die Dialektologie von Beginn an, d.h. in Italien mindestens seit Giuseppe Pitré, immer sehr eng mit den Sozialwissenschaften, genauer gesagt mit der Soziologie und der Ethnologie verbunden. In dieser Perspektive lässt sich die gesamte Geolinguistik sogar als Teildisziplin einer übergeordneten 'Ethnowissenschaft' verstehen. Dieser Ausdruck, der hier als Übersetzung von ita. etnoscienza (aus eng. ethnoscience) gesetzt wird, hat allerdings weder in Italien, noch in Deutschland etablieren können. In dem sehr scharfsinnigen und informativen Manuale di etnoscienza von Giorgio Raimondo Cardona (Cardona 1995) heißt es:
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 f.; Hervorhebung durch fette Schrift: TK)
Die so skizzierte etnoscienza wird in der US-amerikanischen Tradition auch als cultural anthropology (deu. Kulturanthropologie) bezeichnet. Speziell im deutschsprachigen Raum wurde darüber hinaus zwischen Volkskunde für die Erforschung einheimischer Kultur(en) und Völkerkunde für die Erforschung fremder, insbesondere nichteuropäischer Kulturen unterschieden. In der Gegenwart wird stattdessen meist allgemein von Ethnologie mit dem besonderen Teilgebiet der Europäischen Ethnologie (im Sinne der Volkskunde) gesprochen. Die Bezeichnung Ethnolinguistik (vgl. Krefeld 2021) ist daher auch nicht eindeutig, da sie oft auf die sprachwissenschaftliche Untersuchung nichteuropäischer Kulturen eingeschränkt wird (vgl. Senft 2003), obwohl sie die europäischen nicht ausschließen sollte; die kategorische Trennung erweist sich im Hinblick auf die massenhaften und weiträumigen Migrationsströme ohnehin in rapide zunehmendem Maße als sinnlos.
Eine Unschärfe im zitierten Passus von Cardona bleibt zu klären; sie betrifft das 'Präfixoid' ethno-, das einerseits als Synonym des en. folk und andererseits mit Bezug auf etnia verwendet wird. Mit folk (in folk-taxonomy usw.) wird auf die alltags- oder lebensweltlichen Wissensbestände und Konventionen der Laien bzw. Nicht-Wissenschaftler verwiesen und genau in diesem Sinne sollte auch Ethnie (bzw. ethno-) auf alltagsweltliche Kulturgemeinschaften bezogen werden, ohne jedoch idealisierte Vorstellungen von Homogenität, Archaizität, sozialer Abgeschlossenheit usw. zu implizieren. Die Unterscheidung Cardonas (a vs. b) verweist weiterhin auf zwei komplementäre Forschungsperspektiven in den Kultur- und Sozialwissenschaften.
Zusammenfassend darf man dialektologische Forschungen im Sinn von Cardona (auch im Nachhinein) als 'ethnolinguistisch' bezeichnen, wenn sie ihre sprachlichen Daten im engen Zusammenhang mit der Alltagskultur der Sprecher erheben und analysieren.
In der romanistischen Tradition wurde diese Ausrichtung durch den prototypischen Sprach- und Sachatlas Italiens und der Südschweiz (AIS) etabliert; sie markiert zweifellos den größten Unterschied und Fortschritt zum ALF, wie Karl Jaberg nicht ohne Emphase festhält. Der im Hinblick auf das Selbstverständnis des AIS und die Wissenschaftsgeschichte aufschlussreiche Passus verdient durchaus herausgehoben zu werden:
Jaberg weist explizit und vollkommen zu Recht darauf hin, dass der Saussuresche Strukturalismus gerade in diesem Punkt junggrammatische Vorstellungen beibehält; aus der Sicht der zeitgenössischen Geolinguistik wird der Versuch, die Sprache als isolierbares 'Modul' zu betrachten, also keineswegs als ein neues Paradigma, sondern geradezu als traditionalistisch wahrgenommen:
Richtungweisend für die ethnolinguistisch orientierte Tradition der italienischen Dialektologie ist die in teilnehmender Beobachtung entstandene Untersuchung von Hugo Plomteux 1980 über die Cultura contadina in Liguria. Ethnolinguistisch sehr gut, im regionalen Vergleich vielleicht am besten erschlossen ist Sizilien. Zu nennen sind vor allem: Fanciullo 1983 und mehrere wichtige Arbeiten, die im Rahmen des Atlante linguistico della Sicilia entstanden sind (vgl. ausführlich Sottile 2019); die folgenden Titel geben Auskunft über die jeweils untersuchten kulturellen Techniken und Traditionen: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 und Castiglione 1999.
(auct. Thomas Krefeld)
Tags: Linguistik Außersprachlicher Kontext
Ethnolinguistisches Ähnlichkeitsprofil
- Zunächst sind die Alpenwörter von besonderem Interesse; ihre Gesamtheit bildet sozusagen einen fiktiven Idealtyp, dem die einzelnen Ortsdialekte mehr oder weniger nahe kommen. Dem entspricht die Kartierung einer gradueller Ähnlichkeit, die durch die Darstellung des champ gradient de la gasconité im ALG 6 inspiriert wurde.
- Sodann wird nach dem Vorbild des ASD die relative Ähnlichkeit aller Aufnahmeorte untereinander kartiert, indem die gemeinsamen Basistypen eines beliebigen Aufnahmeortes und diejenigen eines beliebigen anderen Ortes als Bezugspunkt festgestellt und angezeigt werden.
(auct. Thomas Krefeld)
Tags: Linguistik Außersprachlicher Kontext
Etymologie
- die Ermittlung der Herkunftssprache der lexematischen Basis;
- die Begründung der Zusammengehörigkeit aller unter dem Basistyp vereinigten Typen; dafür sind die Regularitäten der historischen Phonetik und die semantische Plausibilität der zugrundeliegenden Konzeptrelationen entscheidend;
- die Rekonstruktion der Entlehnungswege, falls der Basistyp in mehreren Sprachgebieten verbreitet ist; sobald die Sprache des Etymons einerseits und des Informanten andererseits nicht übereinstimmen, wird automatisch Sprachkontakt festgestellt.
(auct. Thomas Krefeld)
Tags: Linguistik
FAIR-Prinzipien

Vorbemerkung:
Seit ihrem Aufkommen vor wenigen Jahren werden die FAIR-Kriterien im wissenschaftlichen Umfeld intensiv diskutiert, denn die in diesem Akronym zusammengefassten Begriffe sind zwar intuitiv eingängig, allerdings nicht trennscharf, weil in funktionaler Hinsicht untereinander verschränkt. Auch innerhalb von VerbaAlpina hat die eingehende Auseinandersetzung mit FAIR bisweilen dazu geführt, dass nicht alle von den einzelnen VerbaAlpina-Mitgliedern zu diesem Thema verfassten Texte inhaltlich vollkommen kongruent ausgefallen sind. Unabhängig von diesen individuell divergenten Interpretationen definiert VerbaAlpina jedoch die Kriterien, die von FORCE11 formuliert worden sind (https://www.force11.org/group/fairgroup/fairprinciples), als Maßstab der FAIR-Compliance. Deren Einhaltung ist aus methodischer Sicht durchdacht. Im Hinblick auf die praktische Umsetzung besteht aktuell noch insofern eine Einschränkung, als die Anreicherung mit generischen Metadaten (gemäß dem Metadatenschema von DataCite) derzeit noch nicht geleistet ist. Diese erfolgt jedoch im Zuge der Übertragung der VA-Daten in das Open-Data-Repositorium der LMU, an deren Operationalisierung momentan gearbeitet wird.
--
Im Jahr 2016 veröffentlichte eine große Anzahl von Wissenschaftlern aus einer ganzen Reihe von Ländern im Wissenschaftsmagazin Nature einen Artikel, in dem es darum ging, Richtlinien für den Umgang mit Forschungsdaten zu formulieren (Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016). 🔗). Letztlich gehen die in dieser Publikation vorgetragenen Ideen auf einen Workshop zurück, der im Januar 2014 am Lorentz Center an der Universität Leiden in den Niederlanden stattgefunden hatte. Der Titel des Workshops hatte gelautet: Jointly designing a data FAIRPORT
Zwischenzeitlich haben sich diese Ideen, die im Akronym FAIR fokussiert sind, als ein Orientierungspunkt in der aktuellen Debatte über den richtigen Umgang mit Forschungsdaten etabliert (dies wurde u.a. auf dem Netzwerktreffen des GeRDI-Projekts im Oktober 2018 deutlich; vgl. auch die FAIRGROUP der FORCE11-Community).
Das Akronoym FAIR steht für die folgenden zentralen, sich z.T. wechselseitig bedingenden, Postulate, an denen sich der Umgang mit Forschungsdaten orientieren sollte (🔗):
- F — Findable
- A — Accessible
- I — Interoperable
- R — Reusable
Diese Schlagwörter bedingen implizit eine ganze Reihe von Konsequenzen für den Umgang mit digitalen Forschungsdaten.
Damit Daten auffindbar sind, sollte es mindestens ein zentrales Portal geben, über das Suchanfragen gestartet werden können. Es bietet sich an, den Nachweis der Forschungsdaten – gemeint sind im Wesentlichen ihr Inhalt sowie ihr Bewahrungsort – in die seit langem etablierten Bibliothekskataloge zu inkorporieren. Zu vermeiden wären alle Konzepte, die einen Suchvorgang an unterschiedlichen Stellen verlangen würden.
Um gefunden werden können, müssen Daten selbstverständlich auch physisch existent sein. Hierbei geht es weniger um die Frage der technischen Realisierung, die z.B. durch die flächendeckend bestehenden Rechenzentren geleistet werden kann, sondern vielmehr um die Frage nach der institutionellen Zuständigkeit. Auch unter diesem Aspekt bieten sich wiederum die Bibliotheken an, die aufgrund ihrer Geschichte, ihrer genuinen Aufgabe als Wissensbewahrer sowie ihrer langfristigen Bestandsperspektive eigentlich als konkurrenzlose Kandidaten für diese Aufgabe angesehen werden können. Sie sollten die Verantwortung für die nachhaltige Bewahrung der digitalen Daten übernehmen. In welcher Form dies schließlich geschieht, ob die Bibliotheken eigene Repositorien aufbauen und verwalten oder auf Rechenzentren als Dienstleister zurückgreifen, ist von nachrangiger Bedeutung und kann von Fall zu Fall unterschiedlich gehandhabt werden.
Große Bedeutung besitzt die Konzeption und Vergabe von Metadaten, über die die eigentlichen Forschungsdaten auffindbar gemacht werden müssen. Unverzichtbar erscheint die Verwendung mindestens eines verbindlichen, hierarchisch aufgebauten Metadatenschemas, das unter Einbindung ebenfalls verbindlicher kontrollierter Vokabulare eine inhaltliche Kategorisierung der abgelegten Forschungsdaten erlaubt. VerbaAlpina hat sich vorläufig für das weit verbreitete und auch von der UB der LMU gewählte Datacite – Schema entschieden. Der Einsatz mehrerer konkurrierender Metadatenschemata wäre möglich, jedoch nur sinnvoll, wenn sie jeweils konsequent für alle erfassten Forschungsdaten angelegt werden. Untergeordnete fachspezifische Metadatenschemata können eine sinnvolle Ergänzung der übergeordneten Metadatenschemata darstellen.
Mit "accessible" ist vor allem die nicht durch rechtliche Schranken wie etwa das Urheberrecht eingeschränkte Zugänglichkeit von Daten gemeint. Dieser Punkt ist am wenigsten von den Denjenigen zu beeinflussen, die Daten sammeln oder produzieren. Neben dem Urheberrecht ist bei Datensammlungen häufig der Schutz von Persönlichkeitsrechten zu beachten. Die Forderung nach Zugänglichkeit zielt demnach vor allem darauf ab, dass sämtliche Daten, die keiner rechtlichen Beschränkung unterliegen, von den Produzenten dieser Daten nicht eigens mit rechtlichen Zugangsbeschränkungen belegt werden. Konkret bedeutet das in erster Linie den Verzicht auf das Copyright und die Anwendung eines Lizenzmodells, das konform ist mit den Bedingungen des Open Access. Weit verbreitet im wissenschaftlichen Umfeld ist die Verwendung der Creativecommons-Lizenzen (CC), von denen allerdings nicht alle die Kriterien für Open Access erfüllen. Insbesondere verstößt das Verbot kommerzieller Nutzung, das Teil einer CC-Lizenz sein kann, gegen das Konzept von Open Access. Der Grund besteht darin, dass nahezu jede Verwendung von Daten unter Umständen als "kommerzielle Nutzung" angesehen werden kann und eine klare Grenzziehung diesbezüglich aus juristischer Sicht so gut wie unmöglich ist (s. auch dazu den Methodologie-Beitrag "Lizenzierung").
Ebenso wie auch die Auffindbarkeit von Daten besitzt die Interoperabilität zwei, nämlich eine technische und eine theoretisch-organisatorische, Seiten. Um Datenbestände fruchtbringend miteinander zu verknüpfen und sich aufeinander beziehen zu lassen, bedarf es in vielen Fällen zunächst einer logischen Freingranulierung der Daten, die sich überdies an, zumeist fachspezifischen, Regeln orientiert. Eine ganz zentrale Rolle spielen in diesem Zusammenhang die sog. Normdaten, bei denen es sich um definierte und, im Idealfall standardisierte, Konzeptkategorien handelt, deren einzelne Instanzen (digitale Objekte) bezogen auf eine klar definierte Art und Anzahl von Eigenschaften "distinct", also singulär sind. Die Belegung der einzelnen Objekte einer Konzeptkategorie mit numerischen oder alphanumerischen Identifikatoren ("ID"s), erlaubt die unzweideutige Referenzierung von Objekten. Die Granulierung von Datenbeständen entlang den Grenzen von Kategorien und deren einzelnen Instanzen/Objekten in Verbindung mit der Verwendung der spezifischen Identifikatoren erlaubt sodann die Verknüpfung von getrennten Datenbeständen mit kongruenten Inhalten. Echter Mehrwert entsteht allerdings erst dann, wenn es auch technisch möglich ist, auf einzelne Objekte direkt zu referenzieren und so mit nur einem Klick von einem Datenbestand zu einem Objekt eines anderen Datenbestands zu gelangen. Dies erscheint nur dann möglich, wenn tatsächlich jedem einzelnen Datenobjekt ("Granum") eine eigene URL zugewiesen wird. Im Sinne der Nachhaltigkeit muss schließlich jeder einzelnen URL auch noch eine DOI zugewiesen werden.
Die Wiederverwendbarkeit von Datenbeständen ergibt sich schließlich aus der sorgfältigen Beachtung und Umsetzung der drei vorangegangenen Postulate. Die Technologie von VerbaAlpina wurde u.a. nachgenutzt vom Projekt APPI der Universität Lille. Eine entsprechende Dokumentation ist unter dem folgenden Link zu finden: https://github.com/anr-appi/verba-picardia-doc/wiki/Documentation-du-syst%C3%A8me-Verba.
VerbaAlpina ist bemüht, sämtliche datenbezogenen Verfahren und Regelungen an den FAIR-Prinzipien auszurichten. Thomas Krefeld sieht darin grundsätzlich die Basis einer DH-Forschungsethik (Thomas Krefeld [2018]: Linguistische Theorien im Rahmen der digital humanities. Korpus im Text. Version 2 (05.11.2018, 11:35). Absatz 4. url: http://www.kit.gwi.uni-muenchen.de/?p=28010&v=2#p:4.). Der Auffindbarkeit der Daten dient die Kooperation mit der UB der LMU sowie dem DFG-Projekt GeRDI, die derzeit im Rahmen des Projekts e-humanities – interdisziplinär erfolgt. Vor allem der zentrale Datenbestand im Modul VA_DB wird im Zuge dessen versionsweise mit Metadaten versehen und in mehrerlei Gestalt an die UB der LMU übergeben, wo er in jedem Fall im Open-Data-Repositorium abgelegt wird. Wenigstens die Metadaten werden anschließend zusätzlich in den Index inkorporiert, der aktuell im Rahmen des Projekts GeRDI aufgebaut wird. Ziel ist es, die von VerbaAlpina gesammelten und aufbereiteten Daten zentral über den Bibliothekskatalog der UB und darüberhinaus auch über das noch in Entwicklung befindliche Suchportal des GeRDI-Projekts auffindbar zu machen. Sämtliche von VerbaAlpina verwalteten Daten werden, soweit möglich, unter eine Open-Access-konforme Creativecommons-Lizenz gestellt (bis Version 18/1 CC BY SA 3.0 de, ab 18/2 CC BY SA 4.0). Die Interoperabilität wird u.a. durch eine feine Granulierung des Datenbestands erreicht, die sich auch am Konzept der Normdaten orientiert, indem bereits bestehende Normdaten mit dem Datenmaterial von VerbaAlpina verbunden werden. Dies ist z.B. möglich mit geographischen Daten, etwa den politischen Gemeinden, die das zentrale geographische Bezugssystem von VerbaAlpina darstellen. Für die für VerbaAlpina zentralen Datenkategorien "morpholexikalischer Typ" und "Konzept" existieren wenigstens teilweise bislang noch keine Normdaten, auf die die VerbaAlpina-Daten bezogen werden könnten. In diesen Fällen ist VerbaAlpina bemüht, in Kooperation mit prädestinierten Institutionen wie etwa der Deutschen Nationalbibliothek (DNB) entsprechende Normdaten bzw. Normdatenkategorien einzurichten. Zur Bedienung der technischen Erfordernisse für eine effiziente Interoperabilität wird das zentrale lexikalische Datenmaterial datensatzweise in einer Vielzahl kleiner Dateien abgelegt, die schließlich über individuelle DOIs auf Open Data LMU angesprungen werden können. Jeder einzelnen Datei wird außerdem eine Metadaten-Datei im Datacite-Format beigegeben. Die Gesamtheit der Metadaten ermöglicht schließlich das gezielte Auffinden einzelner Dateien über den Bibliothekskatalog.
Im Rahmen des vom Bayerischen Wissenschaftsministerium geförderten Projekts "eHumanities – interdisziplinär" werden die von VerbaAlpina gesammelten Kerndaten (Einzelbelege, morpholexikalische Typen, Konzepte, Georeferenz) exemplarisch auf das sog. CIDOC CRM Schema abgebildet. Bei CIDOC CRM handelt es sich um eine (informatische) Ontologie, die spätestens seit Anfang der 1990er Jahre entwickelt wurde und deren Wurzeln im Umfeld der Museumswelt liegen. Die Entwicklung des Conceptual Reference Model (CRM) geht zurück auf eine Arbeitsgruppe des Comité International pour la Documentation (CIDOC), das seinerseits eine Gliederung des International Council of Museums (ICOM) darstellt. Die dahinter stehende Absicht ist gewesen, Daten unabhängig von variablen Kategoriebezeichnungen auffindbar zu machen. So kann anstelle von "Autor" auch "author", "Verfasser", "auteur" zur Bezeichnung der Kategorie des Verfassers eines Textes verwendet werden. CIDOC CRM sieht für die Bezeichnung des Autors eines Textes das Kürzel E39 vor, so dass die entsprechende Information vollkommen unabhängig von individuellen Bezeichnungen aufgefunden werden kann. Die ICOM/CRM Special Interest Group entwickelt das CRM kontinuierlich weiter. Die jeweils aktuelle Version des Standards (es handelt sich sogar um eine ISO Norm: ISO 21127:2014, was zusätzlich für die Verwendung spricht) kann auf der Seite http://cidoc-crm.org/versions-of-the-cidoc-crm heruntergeladen werden. Derzeit (Juni 2020) umfasst der Standard insgesamt 99 Entitäten, die um insgesamt 197 "Eigenschaften" ("Properties") ergänzt werden. Letztere dienen hauptsächlich der Beschreibung der Beziehungen zwischen verschiedenen Entitäten des Models (Beispiele: P1: "is identified by", P15: "was influenced by" etc.). Das nachfolgende, von Julian Schulz generierte und vorläufige, Diagramm zeigt den Versuch der Zuordnung der VerbaAlpina-Entitäten zu den CRM-Kategorien (E- und P-Nummern) (PDF-Version: https://www.verba-alpina.gwi.uni-muenchen.de/wp-content/uploads/cidoc-verbaalpina.pdf):

Mittelfristiges Ziel ist, den Kerndatenbestand von VerbaAlpina feingranuliert mit den standardisierten Metadaten des CIDOC CRM versehen in das Forschungsdatenrepositorium der UB der LMU zu übertragen. Dort soll dann ein mit der Ruby-on-Rails-Engine Blacklight realisiertes und auf einem Apache Solr-Index aufsetzendes Suchportal den Zugriff auf die Daten ermöglichen.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Forschungsdatenmanagement
Das Thema "Forschungsdatenmanagement" (FDM) wird derzeit (2018) in Deutschland sowohl auf Bundes- wie auch auf Länderebene stark gefördert, und es ist bereits mit einer Reihe einschlägiger Unternehmungen begonnen worden. Die entsprechenden Aktivitäten sind vor dem Hintergrund der Bestrebungen zur Errichtung einer European Open Science Cloud (EOSC) auf EU-Ebene zu sehen. Für Deutschland sind auf überregionaler, bundesweiter Ebene in diesem Zusammenhang etwa die vom "Rat für Informationsinfrastrukturen" (RfII) ausgesprochene Empfehlung zur Einrichtung einer "Nationalen Forschungsdateninfrastruktur" (NFDI), die sich daran orientierende NFDI-Arbeitsgruppe der Akademienunion (mit Schwerpunkt auf den Geisteswissenschaften) oder auch das seit 2016 von der DFG geförderte und interdisziplinär ausgerichtete Projekt "Generic Research Data Infrastructure" (GeRDI) zu nennen. Die Projekte HeFDI ("Hessische Forschungsdateninfrastrukturen") in Hessen und das vom bayerischen Wissenschaftsministerium geförderte Projekt "eHumanities – interdisziplinär" seien an dieser Stelle stellvertretend für FDM-Initiativen auf Landesebene genannt.
Aus der Perspektive der Geisteswissenschaften ist die vermeintlich klare Trennung zwischen Forschungs- und Interpretationsdaten bzw. -texten, so wie sie im Bereich der Naturwissenschaften vereinzelt vielleicht möglich sein mag, ausgesprochen problematisch bzw. fragwürdig. VerbaAlpina jedenfalls unternimmt keine entsprechende Unterscheidung, sondern betrachtet sämtliche vom Projekt gesammelten und erzeugten Daten als ein untrennbar verwobenes Ganzes, dessen Einzelteile in vielfältiger Weise aufeinander bezogen sind. Im Sinne des "Forschungsdatenmanagements" deklariert VerbaAlpina demnach die Gesamtheit seiner auf die Module VA_DB, VA_WEB und VA_MT verteilten digitalen Daten (also Sprachdaten, Kommentare, Glossareinträge, Computercode, Mediendaten etc.) als Forschungsdatum, das getreu den FAIR-Prinzipien und orientiert an den einschlägigen Empfehlungen des RfII (RfII 2016, Anhang A, S. A-13) bewahrt werden muss. VerbaAlpina ist mit dem Status eines Pilotprojekts eingebunden in die bereits erwähnten Projekte GeRDI und "eHumanities – interdisziplinär".
Ein wesentlicher Aspekt des Forschungsdatenmanagements ist die Gewährleistung von Interoperabilität in dem Sinn, dass persistente projekt- bzw. datenbestandsübergreifende Verknüpfungen zwischen Teilmengen der jeweiligen Datenbestände möglich sind. Eine wichtige Rolle spielen dabei die sog. DOIs, "Digital Object Identifier". Diese stellen die technische Voraussetzung für die dauerhafte, URL-unabhängige Adressierbarkeit "digitaler Objekte" dar und sind für alle elektronischen Inhalte erzeugbar, die über eine URL erreichbar sind. Im Umfeld des Bibliothekswesens wurden DOIs zunächst zur persistenten Identifizierung von elektronischen Buchpublikationen (z.B. https://doi.org/10.5282/ubm/epub.25627) oder auch ganzen Websites (z.B. http://dx.doi.org.emedien.ub.uni-muenchen.de/10.5282/asica) verwendet. Abweichend von dieser Praxis verlangt das Erfordernis der Interoperabilität zwischen getrennt erarbeiteten und verwalteten Datenbeständen eine wesentlich feinere Granulierung. VA erzeugt zu diesem Zweck eine Reihe von im Internet über URLs erreichbaren Dateien, die das gesammelte Sprachmaterial gruppiert nach morpholexikalischen Typen, Konzepten, Herkunftsgemeinden und Einzelbelegen enthalten. Die Dateien sind mit den jeweils von VA vergebenen IDs der jeweiligen Datenkategorie benannt. Dateien der Kategorie "Gemeinde" tragen am Anfang des Dateinamens ein "A", "C" markiert Konzepte und "L" morpholexikalische Typen. Die jeweils nachfolgende Nummer ist die von VA vergebene ID (vgl. Identifikatoren). Der Zugriff auf diese Daten ist über die API möglich. Die Zuweisung der DOIs erfolgt zunächst im Rahmen des Projekts "eHumanities – interdisziplinär" durch die UB der LMU, die überdies die Daten in ihren eigenen Datenbestand übernimmt und dort durch noch zu entwickelnde Verfahren und unter Anwendung eines geeigneten Metadatenschemas zusätzlich in der Tiefe inhaltlich erschließt. Ziel ist neben der Bereitstellung der Forschungsdaten im Repositorium die Integration und Auffindbarkeit der feingranulierten VA-Daten in den Bibliothekskatalogen. Aus dem Bestand der UB der LMU werden die VA-Daten außerdem in den Index des DFG-Projekts GeRDI übernommen und damit einer Nachnutzung in interdisziplinären Kontexten zugeführt.
s. auch Normdaten
(auct. Sonja Kümmet [UB der LMU] | Stephan Lücke | Julian Schulz [ITG] | Florian Zacherl)
Tags: Informationstechnologie
Forschungslabor
- Generic Research Data Infrastructure (GeRDI),
- eHumanities – interdisziplinär und dem daraus entstandenen, nützlichen Best Practice Guide (vgl. Kümmet u.a. 2020, Link),
- die Online-Version des LEI,
- die Online-Version des Atlas Pan-Picard Informatisé (APPI),
- eine in Vorbereitung befindliche Online-Version des ALD-I / ALD-II, oder aber in neue Projekte mündete, so bei:
- LexiCon,
- ALS online.
(auct. Thomas Krefeld)
Tags: Linguistik Informationstechnologie Webseite
Forschungsumgebung
(1) Dokumentation und sprachgeschichtliche Analyse des dialektalen Wortschatzes, der nach Maßgabe des onomasiologischen Rahmens als charakteristisch eingeschätzt wird;
(2) Kooperation mit Projektpartner zum gegenseitigen Datenaustausch und zur Datenanalyse;
(3) Publikation des Datenbestandes, analytischer Texte und unterschiedlicher, projektbezogener Materialien, die sich teils an die fachliche, teils an die breite Öffentlichkeit richten.
Die Funktionen (1) bis (3) wurden mit der ersten Version 15/1 bereits aktiviert ; ergänzt wurden sie mit Version 17/1 um:
(4) Datenerhebung durch Crowdsourcing.
Alle aktiven Funktionen werden kontinuierlich ausgebaut. In der Vorbereitung befindet sich schließlich: (5) die Einrichtung eines Forschungslabors.
(auct. Thomas Krefeld)
Tags: Funktionsbereiche
Fotos
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Außersprachlicher Kontext
Gemeinsame Normdatei (GND)
Allgemeines zur GND
Die bibliothekarische Inhaltserschließung basiert im Grunde auf 2 Säulen:- Mittels Klassifikationen lässt sich eine (grobe) inhaltliche Einordnung vornehmen (DDC) und z.B. auch die Aufstellung von Literatur in Freihandbeständen organisieren (RVK).
- Durch die Vergabe von Schlagwörtern bzw. Schlagwortketten (nicht mehr en vogue) lässt sich der Inhalt eines Werkes detaillierter beschreiben (GND).
Zur Erschließungs- bzw. Vergabepraxis
- Formalerschließer, d.h. Bibliothekare, die die formalen Metadaten einer Ressource erfassen, wie z.B. Autor, Titel, Erscheinungsjahr, usw., sind dazu angehalten, zumindest die mit der Ressource in Verbindung stehenden Personen (z.B. Autor, Herausgeber, gefeierte Person usw.) mit einem Eintrag in der GND zu verknüpfen. Auf diese Weise wird die Person eindeutig identifiziert. Ist eine Person noch nicht in der GND hinterlegt, wird eine neue Personen-Entität angelegt. Hierzu wird ein vorgegebenes Set an identifizierenden Informationen (z.B. Lebensdaten, Beruf, zugeordnete Einrichtung usw.) erfasst, das, wenn möglich, der vorliegenden Ressource entnommen wird. Eine einschlägige Informationsquellen ist aber z.B. auch der auf einer Institutsseite veröffentlichte Lebenslauf der Person.
- Sacherschließer sind Bibliothekare, die den Inhalt einer Ressource erschließen. Hierbei stützen sie sich auf den Titel der Ressource, aber nicht ausschließlich. Nicht selten haben Ressourcen recht kunstvoll gestaltete Überschriften, die keinerlei Rückschluss auf den eigentlichen Inhalt zulassen. Sacherschließer gehen daher normalerweise so vor, dass sie sich anhand der Überschrift, des Klappentexts, des Inhaltsverzeichnisses, des Vorworts, der Einleitung, des Schlusses usw. einen Überblick über den Inhalt verschaffen. Anschließend fassen sie diesen in einer Handvoll Schlagwörtern zusammen. Für die Recherche nach geeigneten Schlagwörtern eignet sich z.B. die OGND.
Zur GND im Kontext von Normalisierung und Datenaustausch
Bibliotheken haben schon recht früh damit begonnen, ihre Erschließungsdaten untereinander auszutauschen. Hierzu braucht es ein einheitliches (Austausch-)Format (MARC) und ein Vokabular (GND), das Bezeichnungen vereinheitlicht und gleichzeitig das Problem von Synonymen, Homonymen usw. behebt.Seit einigen Jahren werden Daten nicht mehr nur zwischen Bibliotheken ausgetauscht, sondern auch zwischen verschiedenen Kultur- und Wissenseinrichtungen. Im Zuge dessen wird die GND, als eine Quelle von Normdaten, auch verstärkt von Archiven, Museen usw. eingesetzt; sie ist so für die digital humanities grundsätzlich relevant geworden. (Vgl. hierzu das GND4C-Projekt: https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/GND4C/gnd4c.html)
Die Verwendung von Normdaten, speziell der GND, ermöglicht es Datenaggregatoren wie der Deutschen Digitalen Bibliothek, oder bavarikon, Objekte aus verschiedenen Sparten miteinander zu verknüpfen und damit ihre Auffindbarkeit zu verbessern.
Welchen Vorteil die GND in diesem Kontext bietet, lässt sich an einem (fingierten) Beispiel veranschaulichen:
In bavarikon gibt es z.B. ein Porträt von Martin Luther und gleichzeitig eine Münze mit dem Konterfei Martin Luthers. Beide Objekte haben Martin Luther als „Thema“; Sie können jedoch nur dann (auf einfachem Wege) vom System miteinander in Beziehung gesetzt werden, wenn in beiden Fällen im Feld dc:subject nicht nur ein String eingetragen ist, sondern ein eindeutiger Identifikator, wie z.B. die GND-ID (118575449). Werden statt eines Identifikators Strings verwendet, ist es gut möglich, dass diese voneinander abweichen, d.h. in diesen Fällen wäre zwar die gleiche Person gemeint, ihre Bezeichner würden sich jedoch unterscheiden. Dass dies gar nicht so unwahrscheinlich ist, verdeutlicht ein Blick auf die Spalte „Andere Namen“ des GND-Datensatzes:
http://d-nb.info/gnd/118575449. Einem Menschen fällt es nicht schwer, die (leicht) voneinander abweichenden Strings zusammenzuführen, für eine Maschine ist dies dagegen ein größeres Hindernis.
Zur GND im Kontext von Linked Data
Obwohl die GND mittlerweile auch vermehrt außerhalb von Bibliotheken eingesetzt wird, ist das Format der GND-Datensätze, MARC, stark domänenspezifisch und wird außerhalb der Bibliothekswelt nicht verwendet. Die GND Ontologie stellt einen Versuch dar, diese Lücke zu schließen, um die GND auch für die Verwendung im Semantic Web einsatzfähig zu machen, denn:„The need for name disambiguation and entries having an authoritative character is an issue that concerns a lot more communities than the library world. In a growing information society the unique identification and linking of persons, places and other authorities becomes more and more important. The GND Ontology aims to transfer the made experience from libraries to the web community by providing a vocabulary for the description of conferences or events, corporate bodies, places or geographic names, differentiated persons, undifferentiated persons (name of undifferentiated persons), subject headings, and works.“
Eine Ontologie besteht aus den folgenden Komponenten:
- Konzepte/Klassen fassen real existierende Instanzen mit gemeinsamen Eigenschaften zusammen; z.B. „Schlagwort“;
- Instanzen/Begriffe, welche die eigentlichen Objekte darstellen, z.B. Butter, identifiziert durch die globale URI http://d-nb.info/gnd/4009236-7;
- Relationen verbinden Konzepte und Instanzen miteinander; z.B. wird Butter über folgendes Konstrukt als ein Objekt der Klasse SubjectHeadingSensoStricto“ (einer Unterklasse der Klasse Schlagwort) ausgewiesen:<rdf:Description rdf:about="http://d-nb.info/gnd/4009236-7"><rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeadingSensoStricto"/ß> (vgl. http://d-nb.info/gnd/4009236-7/about/rdf).
Ein Vorteil von Linked Data ist, dass die codierte Information sprachunabhängig ist. Im obigen Beispiel wird das durch den Begriff Butter repräsentierte Objekt, oder anders ausgedrückt, das real world object BUTTER, durch Properties (Eigenschaften) näher beschrieben. Der String Butter taucht zwar in der RDF-Datei auch auf, aber nur als ein Property der Ressource Butter:
<gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Butter</gndo:preferredNameForTheSubjectHeading> In einem Anwendungsfall, in dem man zusätzlich zum deutschen Begriff Butter die italienische Entsprechung bräuchte, könnte man hierfür einfach ein weiteres Triple (RDF basiert auf Triplen) bilden, z.B. bestehend aus der Ressource http://d-nb.info/gnd/4009236-7 als Subjekt, rdfs:label xml:lang=“it“ als Prädikat und dem Literal (String) burro.
Angenommen die Biblioteca nazionale Firenze würde mit ihrem Nuovo Soggetario Thesaurus ähnlich verfahren wie die DNB mit der GND, könnte man die Ressource Butter in der GND mit der Ressource burro im Nuovo Soggetario Thesaurus z.B. über die Property owl:sameAs in Verbindung setzen, um auszudrücken, dass in beiden Fällen das gleiche real world object BUTTER beschrieben wird.
Mit dem Property <skos:broadMatch rdf:resource="http://zbw.eu/stw/descriptor/14957-0"/> wird z.B. die GND-Ressource Butter mit der ZBW-Ressource Streichfett in Beziehung gesetzt.
(auct. Sonja Kümmet [UB der LMU])
Tags: Informationstechnologie Außersprachlicher Kontext
Georeferenzierung
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts. Die Ermittlung der Geoinformationen zu den jeweiligen Erhebungspunkten erfolgte mittels eines Online Tools. Bedingt durch nicht eindeutige Benennung der Ortschaften, sowie nicht Erkenbarkeit der Namen, war eine manuelle Korrektur der Angaben nötig. Leider ist die Ermittlung der Geokoordinaten seit einiger Zeitaus rechtlichen Gründen nicht mehr möglich.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Linguistik Informationstechnologie Außersprachlicher Kontext
Gruppieren und Sortieren
Eine Sortierung nach Basistypen zeigt die sprachgrenzüberschreitenden Verbreitungsareale, hier den romanischen Typen butyru(m) im deutschen Sprachgebiet und den deutschen Typ Schmalz im romanischen: Vgl. Karte.
Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt (vgl. morpho-lexikalischer Typ malga).
Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen: Vgl. Karte Polysemie des morpho-lexikalischen Typs.
(auct. Thomas Krefeld)
Tags: Webseite
Identifikatoren
Identifikatoren werden nicht neu vergeben. In den seltenen Fällen, in denen bestehende IDs entfernt werden (z.B. bei Duplikaten), stehen die freigewordenen Nummern nicht mehr zur Verfügung. Die Entfernung von IDs wirkt sich nur auf die jeweils aktuelle Arbeitsversion und alle folgenden Versionen aus. Ältere VA-Versionen sind davon unberührt, die Datensätze der getilgten IDs dort nach wie vor verfügbar.
Für die Präfixe der IDs gibt es folgende Möglichkeiten:
Präfix | Kategorie |
---|---|
C | Konzepte |
L | Morpho-lexikalische Typen |
B | Basistypen |
A | Geographische Einheiten (z. B. Gemeinden) |
S | Tokens |
G | Tokengruppen (vgl. Mehrwortlexie) |
E | Ergänzende Daten |
Die Daten der beiden letztgenannten Kategorien unterscheiden sich strukturell nicht, da beide einen einzelnen Sprachbeleg beschreiben. Der Grund für die unterschiedlichen Präfixe ist allein dem Umstand geschuldet, dass sie in unterschiedlichen Datenbank-Tabellen geführt werden.
Im Kontext der API werden die Identifkatoren leicht abweichend verwendet: Die IDs von Tokens sowie Tokengruppen bezeichen auch dort den jeweiligen Sprachbeleg, die IDs von Konzepten, morpho-lexikalischen Typen und Gemeinden dagegen einen Datensatz, der aus allen Sprachbelegen besteht, die diesem Objekt zugeordnet sind. Die Abfrage des Konzepts C1 gibt also nicht einen Datensatz zurück, der das Konzept C1 beschreibt, sondern alle Sprachbelege, die die entsprechende Bedeutung haben.
(auct. Florian Zacherl)
Tags: Informationstechnologie Webseite
Induktive Kulturraumforschung
Das Grundprinzip besteht darin, ausschließlich mit georeferenzierbaren Daten zu operieren und – abgesehen von der Zugehörigkeit der Orte zur Alpenkonvention – keinerlei großräumige Kategorien vorzugeben. Zur kulturräumlichen Profilierung des Alpenraums können die ergänzenden Daten beitragen, die aktuelle oder historische Informationen über die soziale Organisation der Einwohner und/oder über deren infrastrukturelle Erschließung und Bewirtschaftung des Raums liefern. Im Hinblick auf die historische Rekonstruktion des alpinen Kulturraums ist es erstrebenswert, die Gebiete archäologischer Persistenz mit den Arealen sprachlicher Relikte abzugleichen und quantitativ in Gestalt einer kombinierter Sach- und Sprachschichtenkartographie zu visualisieren; vgl. dazu aus archäologischer Sicht allgemein Häuber/Schütz 2004a sowie den modellhaften Kölner Stadtschichtenatlas (vgl. Häuber/Schütz/Spiegel 1999 und Häuber u.a. 2004).
(auct. Thomas Krefeld)
Tags: Linguistik
Informant
(auct. Thomas Krefeld)
Tags: Webseite
Inputdaten
(auct. Thomas Krefeld)
Tags: Linguistik
Interlinguale Geolinguistik
Es sind, genauer gesagt, drei Sprachfamilien, die den neuzeitlichen Alpenraum in Gestalt unterschiedlich großer und vor allem unterschiedlich stark differenzierter Dialektkontinua prägen; die Verbreitungszonen der drei Sprachfamilien lassen sich übrigens nicht auf spezifische Staaten abbilden vgl. aktuelle Sprachgebiete. Das Germanische ist durch alemannische und bairische Varietäten vertreten, die der plurizentrischen deutschen Sprache zugerechnet werden; allerdings ist der gemeinsame Bezug auf die schweizerische, deutsche und österreichische Standardvarietät, der die Zugehörigkeit zu ein und derselben Sprachgemeinschaft überhaupt erst stiftet, bei manchen walserischen und altbairischen (zimbrischen) Sprachinseln auf der Alpensüdseite eigentlich nicht mehr gegeben.
Im Unterschied zum germanischsprachigen Teilgebiet kann man die Varietäten des romanischen Kontinuums mehreren Sprachen zuordnen; neben dem Französischen und Italienischen handelt es sich dabei nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien um Okzitanisch, Frankoprovenzalisch, Rätoromanisch (im Sinne von Bündnerromanisch), Dolomitenladinisch und Friaulisch.
Das Slawische ist durch slowenische Dialekte vertreten, die außer in Slowenien auch in etlichen italienischen und österreichischen Gemeinden gesprochen werden. Zu den Zielen von VerbaAlpina gehört es jedoch nicht, die Dialekte des Alpenraums möglichst vollständig zu beschreiben, die lokalen oder regionalen Dialektgrenzen herauszuarbeiten und den Raum so gewissermaßen als Mosaik von Varietäten darzustellen. Vielmehr sollen durch die großräumige Anlage gerade die (vor allem lexikalischen) Merkmale hervortreten, die über die einzelnen Dialekt- und Sprachgrenzen hinweg verbreitet sind und so die ethnolinguistischen Gemeinsamkeiten hervortreten lassen.

Da Dialekte in sich vollständige sprachliche Systeme bilden, darf man im Hinblick auf die gemeinsame Untersuchung der drei 'genetisch' verschiedenen Kontinua sagen, dass der Sprachkontakt hier in Gestalt einer interlingualen Geolinguistik untersucht wird (vgl. ausführlicher Krefeld 2018d).
(auct. Thomas Krefeld)
Tags: Linguistik
Interoperabilität
Eine Liste sämtlicher in einer VA-DB-Version vorhandenen Nummern ist jederzeit über die API von VerbaAlpina abrufbar. Die auf diese Weise gefundenen Nummern können u.a. in die folgenden URL-Schemata eingesetzt werden, die jeweils auf unterschiedliche Funktionsbereiche von VerbaAlpina führen:
Interaktive Online-Karte (nur morpholexikalische Typen und Konzepte):
https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=133&db=[VERSIONSNUMMER]&single=[VA-ID]
Lexicon Alpinum (nur morpholexikalische Typen und Konzepte):
https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=2374&db=[VERSIONSNUMMER]#[VA-ID]
API (morpholexikalische Typen, Konzepte und Gemeinden):
https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getName&id=[VA-ID]&version=[VERSIONSNUMMER]
Die gelisteten Ressourcen können auch unter Verwendung der DOI des VerbaAlpina-Portals angesprochen werden. Dazu muss der Domainname "www.verba-alpina.gwi.uni-muenchen.de" jeweils durch "doi.org/10.5282/verba-alpina" ersetzt und die URL-Parameter (hinter .../? ...) mit dem Parameter "urlappend=" eingeleitet sowie Gleichheitszeichen (=), Ampersand (&) und Hash (#) durch die jeweiligen Hexadezimalwerte der Unicode-Tabelle in der Schreibweise %3D, %26 und %23 ersetzt werden:
https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D2374%26db%3D[VERSIONSNUMMER]%23[VA-ID] (für Einträge im Lexikon Alpinum)
Beispiele:
ALMHÜTTE (Eintrag zum Konzept ALMHÜTTE (WIRTSCHAFTSGEBÄUDE AUF DER ALM) im Lexicon Alpinum)
babeurre (m.) (roa.) (Darstellung der Verbreitung des morpholexikalischen Typs L1435, “babeurre (m.) (roa.)“, auf der interaktiven Online-Karte von VA)
ALMHÜTTE (Darstellung der Verbreitung von Bezeichnungen für das Konzept C612, ALMHÜTTE, auf der interaktiven Online-Karte von VA)
https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getRecord&id=L1435&version=182&format=xml&empty=0 (Abruf der Metadaten des morpholexikalischen Typs L1435, “babeurre (m.) (roa.)“, über die API im XML-Format)
https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D133%26db%3D191%26single%3DL1435 (DOI-Link auf die Darstellung der Verbreitung des morpholexikalischen Typs “babeurre (m.) (roa.)“ auf der interaktiven Online-Karte von VA [s.o.])
Nicht nur der Kerndatenbestand von VerbaAlpina ist feingranular über individuelle, stabile URLs adressierbar. Auch für von registrierten Nutzern angelegte Datensynopsen auf der interaktiven Online-Karte können stabile, dauerhaft verfügbare Zitierlinks abgerufen werden, die anschließend in externe Online-Dokumente eingesetzt werden können und bei Aufruf exakt die vom Nutzer erzeugte Kartenansicht anzeigen (Beispiel: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=172&tk=2352 [synoptische Karte mit Visualisierung der Verbreitung der Basistypen butyru(m) und Schmalz).
(auct. Stephan Lücke)
Tags: Informationstechnologie
Kartographie
Das heuristisches Potential der Kartographie ist beachtlich; daher wird dem Nutzer von VerbaAlpina die Option angeboten, unterschiedliche Datenklassen aus einer Kategorie (z. B. mehrere Basistypen) oder aus den unterschiedlichen Kategorien (z. B. außersprachliche und sprachliche Daten) auf synoptischen Karten zu kombinieren und zu kumulieren.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist.

Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.
(auct. Thomas Krefeld)
Tags: Linguistik Webseite Außersprachlicher Kontext
Kontinuität
(auct. Thomas Krefeld)
Tags: Linguistik
Konzept
- Traditionelle Alltagswelt,
- Natürliche Umwelt,
- Moderne Alltagswelt,
die jedoch für die Organisation der Daten nur eine sehr allgemeine Bedeutung haben. Auf der Ebene der Datenbank sind vielmehr solche Ordnungsprinzipien relevant, die es erlauben Relationen zwischen den einzelnen Konzepten festzulegen. Zunächst lassen sich alltagsweltliche Kategorien durch Konzepte sehr unterschiedlichen Abstraktions-, bzw. Spezifikationsgrads erfassen, so dass sich taxonomische Hierarchien ergeben. Zwischen Konzepten, die auf unterschiedlichen hierarchischen Ebenen liegen, bestehen strenge
(1) Inklusionsrelationen
in der Weise, dass jede Definition eines Unterbegriffs die Definition ihres Oberbegriffs enthält und spezifiziert. Dazu das Beispiel einer konzeptuellen Kategorie:
- Oberbegriff: GEBÄUDE
- Unterbegriff der 1. Ebene: SENNHÜTTE, STALL, KÄSEKELLER usw.
- Unterbegriff der 2. Ebene: SENNHÜTTE AUS STEIN, SENNHÜTTE AUS HOLZ, SENNHÜTTE AUS HOLZ MIT UNTERBAU AUS STEIN usw.
Während jede Sennhütte usw. auch ein Gebäude ist, gilt das Umgekehrte selbstverständlich nicht. Das jeweils inkludierte Konzept ist abstrakter und insofern bei Darstellung in Gestalt von Baumgraphen auch übergeordnet.
Zwischen den hierarchisch gleichgeordneten Konzepten auf ein- und derselben Ebene bestehen dagegen stets:
(2) Exklusionsrelationen
Eine Sennhütte ist weder ein Stall, noch ein Käsekeller.
Ganz anders ist dagegen die Hierarchie, die sich ergibt, wenn komplementäre Konzepte einen komplexen Funktionszusammenhang bilden, der ebenfalls als Konzept gefasst werden muss. Hier spricht man von
(3) Teil-Ganzes-Relationen.
So gehören zum umfassenden Konzept ALM (als Ganzes) unterschiedliche Sektionen, das GELÄNDE, das VIEH, die GEBÄUDE, das PERSONAL und die TÄTIGKEITEN, insbesondere die MILCHVERARBEITUNG (Teile). Teil-Ganzes-Relationen sind einerseits hierarchisch (wie die Inklusionsrelationen), aber andererseits beruhen sie gerade nicht auf definitorischer Inklusion, sondern auf Exklusion. Baumgraphen sind für ihre Darstellung nicht geeignet.
Man vergleiche exemplarisch das Schema zur begrifflichen Sektionierung des Feldes ALMWESEN.

Im Bereich der Sektionen lassen sich wiederum Ganze und deren konstitutive Teile erkennen. So gehören zur PRODUKTION VON KÄSE (Ganzes) diverse TÄTIGKEITEN, PROZESSE, GERÄTE, GEFÄSSE, PERSONEN und GEBÄUDE (Teile).

(auct. Thomas Krefeld)
Tags: Linguistik
Konzeptbeschreibung
(auct. Giorgia Grimaldi | Thomas Krefeld)
Tags: Informationstechnologie
Kooperation
- Datenpartner verfügen selbst über – zumeist hauptsächlich sprachliches – Datenmaterial, das ganz oder teilweise in den Datenbestand von VerbaAlpina übernommen werden kann
- Forschungsdatenmanagement-Partner betreiben Infrastrukturen, die der dauerhaften Bewahrung und/oder Auffindbarkeit elektronischer Datenbestände dienen
- Kompetenzpartner verfügen über konzeptionelles und technologisches Know-How im Kontext der modernen Datenverarbeitung (z.B. Big Data, Künstliche Intelligenz, etc.)
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Funktionsbereiche
Ladinisch
Sprachgeschichte
Als vorwissenschaftlicher, volkstümlicher Ausdruck bezeichnet ladin(o)/ladinisch im Alpenraum die lokalen romanischen Idiome, die in zwei mehr oder weniger klar definierten und geographisch nicht zusammenhängenden Gebieten gesprochen werden: im schweizerischen Engadin einerseits und in den Dörfern San Martin und La Val in den Dolomiten andererseits (vgl. EWD IV, 156 und DRG 10, 272 – 276). Was das erste Gebiet betrifft, so sind heutzutage Glottonyme wie puter 'Oberengadinisch' und vallader 'Unterengadinisch' (als Hyponyme) oder gar rumantsch 'romanisch' (als Hyperonym) für die Bezeichnung der dort gesprochenen und geschriebenen Idiome gebräuchlicher. Zur Bezeichnungsverwendung in den Dolomiten sind an dieser Stelle einige Präzisierungen unumgänglich.Wie die ALD-I-Karte Nr. 3 bezeugt, wird das Glottonym ladinisch zur Benennung der eigenen Sprache nur im Zentrum des Gadertals verwendet (Erhebungspunkte 83, 84 und 85). Im übrigen Gebiet benennen SprecherInnen ihr eigenes Idiom nach dem Dorf oder dem Tal (etwa wie badiot 'aus Badia' bzw. 'abteitalisch' oder fascian 'aus Fassa, fassanisch'). Allerdings wird der Ausdruck ladin heutzutage auch in einem geographisch umfangreicheren Gebiet verwendet, das die vier um das Sella-Massiv gelegenen Täler umfasst (Gadertal, Gröden, Fassatal und Buchenstein) und zudem üblicherweise auch die Mundart von Cortina d'Ampezzo einschließt (3208). Diese volkstümliche Bezeichnung bezieht sich nicht (nur) auf die Sprache, sondern sie betont viel mehr den gemeinsamen kulturellen und historischen Bezug der eben genannten Täler und Ortschaften zur Habsburgermonarchie bis ins Jahr 1919.
Etymologisch betrachtet, stellen ladin und die entsprechenden Glottonyme die direkte Fortsetzung von latinus dar. Obwohl es bis zum Mittelalter üblich war, latinus neben romanus, romanice, vulgaris, als Bezeichnung für die aus dem Vulgärlatein entwickelten romanischen Idiome zu verwenden, betonte der Humanismus die Unterscheidung zwischen dem 'wahren' Latein und den daraus entstandenen lokalen Idiome. Im Zusammenhang mit der Verschriftung der eigenen Mundart entstanden spezifische Benennungen des eigenen Idioms, die oft auf die geographische Lage verweisen (so hat man zum Beispiel italiano aus Italia oder furlan 'friaulisch' aus Forum Iulii). Die Berggebiete, von denen hier die Rede ist, waren an diesem Prozess weniger beteiligt als die urbane Ausstrahlungszentren von Innovationen. Vielleicht könnte in den Dolomiten aufgrund des unmittelbaren Kontakts zu nicht lateinisch-romanischen Gebieten im Vordergrund gestanden haben, sich in der Sprachbezeichnung eher vom Germanischen abzugrenzen, was ladin(o) eindeutig leistet, als zwischen Latein und 'Neulatein', d.h. Romanisch, zu unterscheiden.
Der Erhalt des Glottonyms als Fortsetzung von latinu mag weiterhin durch die im Vergleich zur Italo- bzw. Galloromania verspätete Verschriftungstätigkeit begünstigt worden zu , die in den Dolomitentälern erst ab dem XVII. Jahrhundert bezeugt ist (vgl. Videsott 2020): Dort, wo intensiver schriftlicher Ausbau mehr oder weniger früh im Mittelalter begann, wurde das Bedürfnis verspürt, die spezifische eigene Ausprägung des Romanischen mit Bezug auf den geographischen Raum zu benennen. In der Sprachwissenschaft haben sich die Bezeichnungen überwiegend an den volkstümlichen Sprachnamen orientiert.
Wissenschaftsgeschichte
Von Isaia Graziadio Ascoli wurde der Ausdruck (in der ital. Variante ladino bzw. favella ladina) als Oberbegriff für das Bündnerromanische, das Romanische in den ehemals österreichischen Dolomiten und das Friaulische (vgl. Melchior 2019) vorgeschlagen; er sah in den drei Gebieten isolierte Reste eines ehemals umfassenderen, zusammenhängenden Sprachraums, denn die Dialekte zwischen der Schweizer Grenze und der Etsch sowie diejenigen des Agordino, Cadore und Comelico (3210), die westlich des Friaulischen situiert sind, sah er nicht als ladinisch an; vielmehr sprach er hier von anfizone 'Übergangsgebieten'. In der deutschsprachigen Forschung wurde Ascolis Konzept mit 'Rätoromanisch' wiedergegeben (vgl. Gartner 1883); dieser wissenschaftliche Sprachgebrauch, den man mittlerweile als obsolet bezeichnen muss (vgl. Krefeld 2003a, Liver 2010), darf nicht mit der amtlichen Schweizer Sprachregelung (vgl.Rätoromanisch) verwechselt werden. So wurden im Laufe der Jahre zwar etliche Anläufe unternommen, den Begriff LADINISCH trennscharf zu definieren, aber ein wissenschaftlich allgemein akzeptierter Konsens ist daraus nicht entstanden (vgl. Casalicchio 2020, Goebl 2003, Pellegrini 1991).Dialektologie
Im Hinblick auf die dialektale Ähnlichkeit, (d.h. die Gemeinsamkeit von Varianten) erscheint es im Rahmen von VerbaAlpina nicht gerechtfertigt, den Begriff LADINISCH auf die romanischen Varietäten zu beschränken, die in den Dolomitentälern rund um das Sella-Massiv gesprochen werden (traditionell im Gadertal und Grödnertal in Südtirol, im Fassatal im Trentino sowie in Colle Santa Lucia, Buchenstein und Cortina d'Ampezzo, in der Provinz Belluno). Vielmehr ist es sinnvoll, 'Ladinisch' prototypisch zu verwenden: als Klassifikationsbegriff für die Bezeichnung der romanischen Varietäten, die sich aufgrund ihrer inneren Struktur besonders ähnlich sind und die innerhalb eines geolinguistischen Ausschnitts des romanischen Varietätenkontinuums gesprochen werden,- das grosso modo mit der im Süden und Osten über die Sellaregion deutlich hinausgehenden geographischen Ausdehnung der Dolomiten identifiziert werden kann und
- das die romanischen Varietäten des Agordino, des Cadore und des Comelico in der Provinz Belluno einschließt.
Die lexikographische Ressource, die von VerbaAlpina für die Typisierung der Sprachbelege des Dolomitengebietes verwendet wird, ist die Banca Lessicala Ladina (kurz: BLad), die sich an Lemmata aus sellaladinischen Varietäten orientiert, denn sie gilt als digitales Sammelwerk, das alle vorhandenen Wörterbücher der o.g. Talvarietäten zusammenführt. Die Verwendung dieses Werkzeugs steht durchaus nicht im Widerspruch zur oben skizzierten geolinguistischen Definition des Ladinischen, mit der VerbaAlpina arbeitet. Vielmehr erweist sich in der Nützlichkeit dieser Ressource im weiteren geolinguistischen Rahmen gerade die Existenz eines großräumigen Kontinuums lokaler romanischer Varietäten. Es versteht sich weiterhin von selbst, dass aus der geolinguistischen Bestandsaufnahme lokaler Ähnlichkeiten und Unterschiede keinesfalls auf die Zugehörigkeit der erfassten Idiome zu einer gemeinsamen 'Sprache' im Sinne von Ascoli 1873 oder Gartner 1883 geschlossen werden darf, denn eine Sprache impliziert im gegenwärtigen Verständnis – im Unterschied zum Dialekt – einen soziologischen Status, der sich in ihrer Institutionalisierung in Verwaltung und Bildung zeigt und der aus deskriptiv ermittelten, systemischen Merkmalen nicht abgeleitet werden kann (vgl. Sprachen und Sprachfamilien im Alpenraum).
Sprachsoziologie
Die Schrifttradition der ladinischen Varietäten ist – wie oben schon erwähnt wurde – jüngeren Datums als die der anderen romanischen Sprachen. Der erste Versuch einer ladinischen Varietät eine graphisch normierte Form zu geben, geht ursprünglich auf Ujep Insam (Versuch zu einer Grammatik der Grödner Mundart – Per na Gramatica döl Lading de Gerdöna; 1806, Videsott 2013) zurück, gefolgt durch Nikolaus Bacher (Micurà de Rü) mit seinem Versuch einer deütsch-ladinischen Sprachlehre (1833; Craffonara 1995). In der zweiten Nachkriegszeit erwiesen sich die gestärkten Identitätsgefühle und die Notwendigkeit, das Schulsystem mit didaktischen Instrumenten für den Unterricht in der Lokalsprache auszustatten (1948 wurde die paritätische Schule in Südtirol eingeführt) als grundlegende Faktoren einer intensiveren graphischen und sprachlichen Normierungstätigkeit (vgl. Rasom 2020 und Iannàccaro/Dell'Aquila 2020). Der Wunsch nach einer gemeinsamen Schriftsprache für die ladinischen Täler zeigte sich immer stärker, so dass die Kommission für die Sprachplanung der Union Generela di Ladins dla Dolomites 1987 die ersten Vorschläge für eine gemeinsame graphische Darstellung der einzelnen Phoneme vorstellte. Diese Vorschläge stellen die Basis des Ladin Standard (auch Ladin Dolomitan) dar, das vom SPELL (Servisc de Planificazion y Elaborazion dl Lingaz Ladin) auf der Grundlage der Arbeiten des Schweizer Sprachwissenschaftlers Heinrich Schmid in den Neunziger Jahren erarbeitet worden ist (GLS 2001; Schmid 1998); Schmid hatte bereits das Rumantsch Grischun konzipiert (vgl. Schmid 1982). In den Dolomiten existieren derzeit insgesamt fünf normierte Talschaftsidiome und eine gemeinsame Schriftsprache. Diese hier nur kurz skizzierte Geschichte der Normierung bezieht sich nur auf die sellaladinischen Varietäten (für eine genauere Chronologie s. Kattenbusch 1994 und Rasom 2020).Für die Varianten des Agordino, des Cadore und des Comelico wurde vom Istituto Ladin de la Dolomites in Borca di Cadore, das die Interessen der Ladiner der Provinz Belluno ("Neo"-Ladiner in der Terminologie von Goebl 1997 und Rührlinger 2005) vertritt, das Handbuch Scrivere in Ladino veröffentlicht (Istituto 2010). In diesem Gebiet fehlen aktuell Projekte zur Standardisierung der Varietäten.
(auct. Beatrice Colcuc | Thomas Krefeld)
Tags: Linguistik
Langzeitarchivierung
Im einzelnen werden die folgenden Aspekte berücksichtigt:
1. Welche Institution(en) wird(/werden) mit der Bewahrung der Daten bzw. der betreffenden Datenträger betraut?
2. Dokumentation der Datenstrukturierung sowie der logischen Zusammenhänge zwischen Daten und Datenkategorien (Entity Relationship)
3. Dokumentation der verwendeten Zeichenkodierung(en)
Mehrere Kopien der Projektdaten sollen bei mehreren verschiedenen Institutionen archiviert werden. Derzeit sind dafür die IT-Gruppe Geisteswissenschaften der Ludwig-Maximilians-Universität München (ITG) mit deren Anbindung an die Archivierungsserver des Leibniz-Rechenzentrums sowie das BAS Clarin Repository vorgesehen. Es ist geplant, zusätzliche Sicherungskopien bei weiteren geeigneten Institutionen zu deponieren. Die Archivierung findet im Rhythmus der Versionierungen statt. Archiviert werden jeweils die Datenbank mit sämtlichen Projektdaten (Modul VA_DB zusammen mit dem Entity-Relationship-Modell) sowie das Web-Framework (VA_WEB), das für die Präsentation der Daten im Internet (inklusive der jeweiligen Funktionalität) zuständig ist, so dass, zumindest theoretisch, ein "Wiedererwecken" jeder einzelnen Version in entsprechenden emulierten Betriebssystem- bzw. Softwareumgebungen möglich ist. Archiviert wird ferner die Medienbibliothek, die hauptsächlich Photos, Filme, Text- und Tondokumente enthält (Modul VA_MT).
In unregelmäßigen Abständen wird die VerbaAlpina-Webseite (VA_WEB) auch im Internetarchiv https://archive.org abgelegt. Unter der Adresse https://web.archive.org/web/*/http://verba-alpina.gwi.uni-muenchen.de/ lassen sich ältere Versionen von VA_WEB abrufen. Die älteste dort erfasste Version stammt vom 10. November 2014. Die Archivierungen erfolgen teils automatisch durch den "Wayback"-Crawler von archive.org, teils aktiv durch VerbaAlpina, seit 2018 regelmäßig im Zuge der halbjährlichen Versionswechsel.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Lizenzierung
VerbaAlpina fühlt sich daher verpflichtet, sämtliche von VerbaAlpina selbst erarbeiteten Inhalte in Übereinstimmung mit den sog. FAIR-Prinzipien und dem damit verbundenen Open Access Gedanken zur Nutzung durch Dritte frei zur Verfügung zu stellen, und steht damit in einer Reihe von Initiativen und Institutionen, die sich derzeit für die Verbreitung und Durchsetzung dieses Ideals einsetzen (vgl. z.B. das Open Science Center der LMU). Hinsichtlich der Inhalte von VerbaAlpina besteht eine Einschränkung nur insofern, als Daten, die VerbaAlpina von Seiten Dritter übernommen hat und die restriktiveren Nutzungsbedingungen wie etwa dem Copyright unterliegen, auch von VerbaAlpina nur unter den entsprechenden Bedingungen weitergegeben werden. So können speziell einzelne Mediendateien im VA-Modul VA_MT, die VA aus externen Datenquellen bekommen oder erworben hat, dem Copyright unterliegen. Betroffene Objekte werden im Modul VA_MT individuell mit entsprechenden Merkmalen versehen. VerbaAlpina ist stets bemüht, die für einzelne Inhalte bestehenden Nutzungsbedingungen jeweils anzugeben, sofern diese nicht im Rahmen einer Open-Access-Lizenz genutzt werden dürfen. Sollten VerbaAlpina in diesem Zusammenhang Irrtümer unterlaufen – und dies gilt besonders für Urheberrechtsverletzungen – wird darum gebeten, VerbaAlpina unverzüglich darauf hinzuweisen. Entsprechende Inhalte werden von VerbaAlpina umgehend entfernt.
Sämtliche aus rechtlicher Perspektive im Sinne von Open Access uneingeschränkt nutzbaren Daten und Inhalte werden von VerbaAlpina unter eine Creative-Commons-Lizenz (CC) gestellt, die lediglich die Nennung des Urhebers sowie die Weitergabe unter den selben Bedingungen verlangt. Dies wird in der Nomenklatur von CC durch die Kürzel "BY" und "SA" ("share alike") zum Ausdruck gebracht. VerbaAlpina verzichtet bewusst auf das Verbot der kommerziellen Nutzung (CC-Kürzel "NC" – "non-commercial"), da dies sogar eine Weiterverwendung zu wissenschaftlichen Zwecken unmöglich machen kann (s. dazu den Vortrag "Offene Lizenzen – ein Werkstattbericht zu den rechtlichen Herausforderungen im Jahr 2015 " [etwa ab Minute 13] von Thomas Hartmann). Insofern ist die NC-Klausel nicht kompatibel mit dem Open-Access-Gedanken (s. https://open-access.net/informationen-zu-open-access/rechtsfragen/lizenzen/, Abschnitt "Das Creative Commons-Modell", konsultiert am 09.10.2018).
Während die CC-Lizenzen der Version 3.0 auch an das deutsche Rechtssystem angepasst worden waren, wird seit der derzeit (2018) jüngsten Version 4.0 darauf verzichtet. Die daraus folgenden Konsequenzen sind für VerbaAlpina schwer einzuschätzen. Das von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen betriebene Portal https://open-access.net/ meint dazu: "Derzeit noch unklar ist, wie es sich auswirkt, wenn die Standardlizenz in einer ausländischen Sprache zur Verfügung gestellt wird, die der Lizenznehmer nicht oder nicht sicher beherrscht" (https://open-access.net/informationen-zu-open-access/rechtsfragen/lizenzen/, konsultiert am 09.10.2018). VerbaAlpina folgt daher der Praxis der Universitätsbibliothek der LMU und stellt ab der VA-Version 18_2 (Dezember 2018) sämtliche Inhalte, die nicht unter die oben genannten Ausnahmen fallen, unter die CC-Lizenz BY-SA 4.0 (https://creativecommons.org/licenses/by-sa/4.0/). Alle älteren Versionen stehen in analogem Sinn unter der CC-Lizenz BY-SA 3.0 de (http://creativecommons.org/licenses/by-sa/3.0/de/).
Für den von VerbaAlpina entwickelten Softwarecode findet die im Umfeld der Softwareentwicklung übliche MIT-Lizenz Anwendung, die die freie Nachnutzung des Softwarecodes erlaubt.
Das Lizenzierungssystem sowie die Zugriffsrechte der verschiedenen VA-Benutzergruppen werden durch die folgende Graphik dokumentiert:

(auct. Stephan Lücke)
Tags: Informationstechnologie Webseite
Mehrwortlexie
Aus informatischer Perspektive ergibt sich dabei das Problem einer mehrschichtigen Konzeptzuordnung, die im relationalen Datenmodell abgebildet werden muss: Neben der Bedeutung der Mehrwortlexie als ganzer besitzen die Einzelwörter eigene Bedeutungen, die ein Licht auf die Motivation der Bildung der Mehrwortlexie werfen. Um diese Besonderheit zu berücksichtigen, werden in der Datenbank von VerbaAlpina sogenannte Tokengruppen verwendet. Ein Beleg, der aus mehreren Einzelwörtern besteht, wird hierbei in seine Bestandteile aufgespalten und diese werden in der Tabelle `tokens` abgelegt. Jedes dieser Tokens verweist dabei auf ein und denselben Eintrag in der Tabelle `tokengruppen` und speichert zusätzlich seine Position in der Tokengruppe (1., 2. usw. Stelle), so dass die Mehrwortlexie aus den Einzeltokens rekonstruiert werden kann. Ein explizites Speichern der Mehrwortlexie ist somit nicht nötig; in der Tabelle `tokengruppen` werden also (außer der ID der Tokengruppe) nur zusätzliche Informationen abgelegt, die aus den Einzeltokens nicht hervorgehen können, wie beispielsweise das Genus der Tokengruppe.
Eine Zuordnung von Konzepten findet sowohl auf Ebene der Tokens als auch auf Ebene der Tokengruppen statt. Für das obige Beispiel gibt es damit drei Einträge in der Tabelle Tokens, denen jeweils unterschiedliche Konzepte zugeordnet sind:

Die Zuweisung von Konzepten zu den Bestandteilen erfolgt mit Hilfe der Wörterbücher. Für das jeweilige Teilkonzept wird der häufigste Eintrag aus dem Lexikon übernommen. Da die Teilkonzepte nicht abgefragt wurden, ist möglich, dass sie teilweise der Realität nicht entsprechen.
Zusätzlich gibt es einen Eintrag in der Tabelle `Tokengruppen` mit einer eigenen Konzeptzuordnung:

Bei der kartographischen Darstellung an der Oberfläche von VerbaAlpina werden Tokens und Tokengruppen gleichberechtigt behandelt, das heißt, eine Suche nach dem Konzept ALMHÜTTE liefert sowohl Tokengruppen also auch Tokens, die mit diesem Konzept verbunden sind. Einzelwörter, die nur als Bestandteil einer Mehrwortlexie belegt sind, werden dabei entsprechend markiert.
(auct. Stephan Lücke | Florian Zacherl)
Tags: Linguistik
Metadaten
Am besten ist dieses System an einem Beispiel zu demonstrieren. Die gegebenen Primärdaten seien Personen. Jede Person sei durch ihren Namen, Vornamen, Geburtsort, Geburtsdatum sowie ihre Augenfarbe beschrieben. Die zulässigen Werte könnten wie folgt beschrieben werden:
Name: Zeichenkette, bestehend aus Buchstaben
Vorname: Zeichenkette, bestehend aus Buchstaben
Geburtsort: Zeichenkette, bestehend aus Buchstaben
Geburtsdatum: Datum in der Form JJJJ-MM-TT
Augenfarbe: Ein Wert aus der Liste "braun, grün, blau"
Jedes Individuum sollte durch die Summe aller Werte in den verschiedenen Metadatenkategorien eindeutig beschrieben werden. Sobald der Fall auftritt, dass eine Duplizität im Datenbestand auftritt, also zwei Individuen mit vollkommen identischen Werten in allen Metadatenkategorien auftreten, muss das Metadatenschema als unzulänglich betrachtet und modifiziert werden.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Metadatenschema
Grundsätzlich können Metadatenschemata für beliebige Bereiche definiert werden, maximalen Nutzen entfalten sie jedoch erst, wenn sie als weithin akzeptierter Standard etabliert sind. Der Mehrwert besteht dabei hauptsächlich darin, dass sich inhaltlich kompatible Datenbestände eindeutig aufeinander beziehen bzw. mit einander verknüpfen lassen (Interoperabilität). Insofern spielen Metadatenschemata auch eine wichtige Rolle im Hinblick auf die Erfüllung der FAIR-Prinzipien. Die Abbildung eines Metadatenschemas kann in unterschiedlicher Gestalt erfolgen. So ist dies z.B. in Listen, Tabellen- oder XML-Form möglich. Eine graphische Darstellung kann in Form eines sog. Entity-Relationship-Diagramms (ERD) erfolgen. Das damit verbundene Konzept des Entity-Relationship-Modells (ERM) scheint mit "Metadatenschema" bedeutungsidentisch zu sein.
Aus der Perspektive von VerbaAlpina spielen Metadatenschemata zunächst im Hinblick auf die Verwaltung des eigenen Datenbestands eine Rolle, wobei hier ein projektspezifisches, nicht standardisiertes, gleichwohl jedoch dokumentiertes Metadatenschema Anwendung findet. Hauptsächlich für den Export der VA-Daten in externe Datenrepositorien kommen auch etablierte Standard-Metadatenschemata zum Einsatz. So wird z.B. der Kerndatenbestand von VerbaAlpina, d.h. das georeferenzierte und konzeptbezogene morpholexikalische Material aus VA_DB, im Zuge der Übertragung in das Open-Data-Repositorium der Universitätsbibliothek der LMU mit dem vom gleichnamigen Konsortium kuratierten Metadatenschema Datacite beschrieben. Zusätzlich wird der Kerndatenbestand von VerbaAlpina im Metadatenschema CIDOC-CRM abgebildet, das eine inhaltliche Tiefenerschließung des Materials zum Ziel hat. CIDOC-CRM wird üblicherweise als eine "Ontologie" bezeichnet. Die Abbildung der VA-Daten auf die dort definierten Klassen und Eigenschaften und die anschließende formale Repräsentation des Ergebnisses, das sodann die primären VA-Daten und die sekundären CIDOC-CRM-Metadaten synoptisch kombiniert, rechtfertigt dennoch, CIDOC-CRM als "Metadatenschema" zu bezeichnen. Das Beispiel zeigt, wie fließend die Übergänge sein können und wie unscharf der Begriff "Metadatenschema" bisweilen erscheinen kann. Unabhängig von allen terminologischen Fragen sollte es bei der Erschließung von Forschungsdaten im Wesentlichen darum gehen, Metadaten in strukturierter, einer Ontologie folgenden Form in einem verbreiteten Austauschformat (z.B. RDF) zur Verfügung zu stellen.
Die Erschließung der VA-Kerndaten sowohl mit DataCite als auch mit CIDOC-CRM erfolgt im Rahmen des Forschungsprojekts eHumanities – interdisziplinär, das drei Jahre lang (bis 2021) vom Bayerischen Ministerium für Wissenschaft und Kunst gefördert wird und sich mit der Herausforderung des Forschungsdatenmanagements (FDM) befasst. VerbaAlpina besitzt innerhalb von eHumanities – interdisziplinär den Status eines Pilotprojekts.
(auct. Stephan Lücke | Julian Schulz [ITG])
Tags: Informationstechnologie
Mitmachen!
Es geht z. B. darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen.
Sehr interessiert sind wir auch an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wenn Sie Kenntnisse eines im Alpenraum gesprochenen Dialekts haben, dann würden wir uns freuen, wenn Sie spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina eintragen würden. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z.B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich an unserem Projekt in dieser Weise beteiligen. – Sie haben Bilder von alpentypischen Objekten? Etwa Fotos von Almen, Hütten, Flora, Fauna, Bergen und Landschaft? Dann laden Sie diese doch in unsere Mediathek und halten fest, wo das Bild wann entstanden ist, was darauf zu sehen ist und – sofern Ihnen bekannt – geben einen spezifischen Dialektausdruck zur Bezeichnung für das Abgebildete an.
Parallel zur gezielten Mitarbeit bei VerbaAlpina können Sie sich in unserem System eine eigene Forschungsumgebung einrichten, die Sie für die Sammlung von, hauptsächlich, Sprach- jedoch durchaus auch anderen Daten verwenden können. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Sie haben die Möglichkeit, diese Daten gleichsam ausschließlich für Ihre persönliche Verwendung unter Verschluss zu halten, können sie jedoch auch für den Zugriff anderer Nutzer freigeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Wir möchten Sie dazu ermuntern, möglichst viel von Ihren Daten der Allgemeinheit zur Verfügung zu stellen. Nur auf diese Weise kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.
Um VerbaAlpina zu unterstützen und/oder das System für eigene Interessen zu nutzen, ist es nötig, sich auf unserem Portal zu registrieren: https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register
(auct. Stephan Lücke)
Tags: Webseite
Module
Normdaten
Die Möglichkeiten der technischen Vernetzung von Datenbeständen, deren Anfänge in die 1970er Jahre zurückreichen, erforderten alsbald eine Angleichung der bis dato von den einzelnen Bibliotheken individuell geführten Verzeichnisse. Aus diesem Grund haben die Bibliotheken spätestens in den 1980er Jahren – erste Planungen erfolgten bereits Ende der 1970er Jahre – damit begonnen, die individuellen Verzeichnisse einander anzugleichen und gemeinsame Personen- und Schlagwortverzeichnisse anzulegen, um bibliotheksübergreifende Konsistenz zu erreichen. Im Lauf der Zeit entstanden zunächst thematisch getrennte Verzeichnisse: Ein Personenverzeichnis (Personennamendatei, PND), ein Verzeichnis von Körperschaften (Körperschaftsdatei, GKD) sowie ein Schlagwortverzeichnis (Schlagwortnormdatei, SWD). Schließlich setzte sich die Erkenntnis durch, dass die entstandene thematische Trennung nicht zweckmäßig ist, zumal Personen und Körperschaften nicht nur als Autoren bzw. Herausgeber figurieren können, sondern ihrerseits auch Gegenstand von Publikationen sein können, weswegen sie auch bei Verschlagwortungen auf Basis der Schlagwortnormdatei entsprechend berücksichtigt werden müssen. Aus diesem Grund wurden die drei getrennten Normdateien (unter Einbeziehung der Einheitssachtitel-Datei des Deutschen Musikarchivs) von 2009 bis 2012 in einer gemeinsamen Unternehmung der Deutschen Nationalbibliothek und der deutschsprachigen Bibliotheksverbünde zur sog. Gemeinsamen Normdatei (GND) vereinigt. Diese steht nunmehr seit 2012, zwischenzeitlich in einer ganzen Reihe von Formaten (MARC 21 Authority, MARC21-xml und RDFxml), der Öffentlichkeit zur Verfügung und wird zunehmend auch für Verschlagwortungen außerhalb des Bibliothekswesens genutzt. So werden Normdaten u.a. in den an der ITG beheimateten DH-Projekten BMLO (Bayerisches Musiker-Lexikon online) und Kaiserhof registriert und zur zweifelsfreien Identifizierung von Personen verwendet.
Unter der Adresse http://ognd.bsz-bw.de/ (ein Dienst des Bibliotheksservice-Zentrums Baden-Württemberg) steht ein komfortables Suchinstrument zur Recherche in der GND zur Verfügung. Mit der GND vergleichbare Normdateien werden von Institutionen, vorrangig Bibliotheken, weltweit geführt. Seit 2003 existiert das von der DNB und Library of Congress gemeinsam ins Leben gerufene Projekt VIAF (Virtual International Authority File), das sich zum Ziel gesetzt hat, diese Datenbestände in einem System zu vereinen und dort abrufbar zu machen.
Auch wenn das System der Normdaten rein theoretisch die eindeutige Identifizierung von Personen und Konzepten erlaubt, hängt die konkrete Nutzbarkeit von der technischen Implementierung in den elektronischen Bibliothekskatalogen ab. In den Katalogen der DNB und der Bayerischen Staatsbibliothek (BSB) liefert die Suche nach "Homère" auch Treffer, deren bibliographische Erfassung nur die deutsche Schreibweise "Homer" enthält. Andererseits listet im Online-Katalog der BSB ein Klick auf einen mit einem Link unterlegten Autorennamen derzeit (Nov. 2018) noch Titel, die nicht nur von dem entsprechenden Individuum, sondern auch von gleichnamigen Autoren stammen.
Auch wenn der Ursprung des Konzepts der Normdaten offenbar im Umfeld des Bibliothekswesens liegt, hat sich die Verwendung von Normdaten mittlerweile auch in anderen Bereichen etabliert. Als Beispiel können die Projekte Geonames (Entität Geographica), Pleiades (Entität antike Geographica) oder auch Glottolog (Entität Weltsprachen) genannt werden.
Normdaten besitzen große Bedeutung für die u.a. von der FAIR-Initiative geforderte Interoperabilität. Durch die Definition eines Normdatums und die Vergabe eines (alpha)numerischen Identifikators besteht, neben der Einbindung in die inhaltliche Erschließung der Bibliothekskataloge, auch die Möglichkeit der logischen und technischen Verknüpfung von kongruenten Daten in von einander getrennten Datenbeständen.
Aus der Perspektive von VerbaAlpina wäre die Etablierung der Normdatenkategorien "morpholexikalischer Typ" (⇒ Typisierung) und "Konzept" methodologisch konsequent und deshalb sehr wünschenswert. Dies würde erlauben, morpholexikalische Typen und Konzepte mit Identifikatoren zu versehen. Auf diese Weise könnten lexikalische Daten weltweit und, im Falle der Konzepte, unabhängig von der Einzelsprache eindeutig aufeinander bezogen werden. Vereinzelt lassen sich Ansätze in diese Richtung beobachten. So werden beispielsweise in den strukturierten Datenbeständen des Wikidata-Projekts sog. Q-IDs vergeben, die außersprachliche Konzepte eindeutig identifizieren und auf diese Weise eine gemeinsame und identische Referenz für die verschiedenen Artikel in den unterschiedlichen Sprachversionen der Wikipedia zu ein und demselben Thema liefern. Das Konzept ALMHÜTTE ist in Wikidata z.B. mit der Q-ID Q2649726 eindeutig identifiziert. Der entsprechende Eintrag in Wikidata verweist auf zugeordnete Wikipedia-Artikel in derzeit (Oktober 2018) insgesamt sieben verschiedenen Sprachen. Von den aktuell (Oktober 2018) insgesamt 2629 von VerbaAlpina erfassten Konzepten konnten bislang genau 400 eine Q-ID zugeordnet werden. Die Q-IDs werden, soweit vorhanden, im Datenbestand von VerbaAlpina registriert. Eine analoge, systematische Identifizierung morpholexikalischer Typen besteht im Rahmen des Wikipedia- bzw. Wikidata-Projekts bislang anscheinend noch nicht. Erst ansatzweise wurden dort bislang L-IDs für sprachliche Bezeichnungen vergeben; ob damit jedoch präzis definierte Typen gemeint sind, wird nicht klar.
Orientiert am Modell der Normdaten-IDs vergibt VerbaAlpina für die Datenkategorien (Entitäten) "Konzept", "morpholexikalischer Typ" (s. Typisierung) und "Gemeinde" eigene Identifikatoren, die per einfachem Mapping auf andere bereits etablierte Normdatensysteme wie etwa die Q-IDs des Wikidata-Projekts bezogen werden können. VerbaAlpina ist überdies bestrebt, speziell die Datenkategorie "morpholexikalischer Typ" in die Systematik der Gemeinsamen Normdatei (GND) einzubringen. Die entsprechende Perspektive besteht, zumal die GND inhaltlich und strukturell erweitert und an die Bedürfnisse der Wissenschaft sowie allgemein kulturtragenden Einrichtungen und Personen angepasst werden soll. Einem entsprechenden Austausch soll die für Dezember 2018 angesetzte Konferenz GNDCon 2018 dienen. Die Interessen von VerbaAlpina werden dort von Mitgliedern der UB München sowie der ITG vertreten werden.
Die GND unterscheidet derzeit die folgenden Entitäten: Körperschaft (Sigle: b), Konferenz (f), Geographikum (g), Person (nicht individualisiert) (n), Person (individualisiert) (p), Sachbegriff (s) sowie Werk (u) (http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/entitaetenSatztypen.pdf?__blob=publicationFile). Einem DNB-Dokument aus der Kategorie "Arbeitshilfen zur gemeinsamen Normdatei (GND)" ist ferner zu entnehmen, dass für die Kategorie "Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen" der spezifische Entitätencode "slz" als Unterkategorie der Entität "Sachbegriff" vorgesehen ist. Es liegt nahe, die Normdaten von VerbaAlpina mit dieser Kategorie zu verknüpfen.
Literatur:
Capellaro 2003
(auct. Stephan Lücke)
Tags: Informationstechnologie
Notation
(auct. Thomas Krefeld)
Tags: Linguistik Webseite
Öffentlichkeit
Onomasiologische Einteilung
Produkte
Sind im weitesten Sinne Bestandteile des Produkts, d.h. auch Milch kann in diese Gruppe gefasst werden. Desweiteren sind beispielsweise Rahm, Buttermilch sowie Reste wie Molke auch Produkte, aus dem wieder weitere Produkte entstehen.
Prozesse
Über Prozesse werden aus einem wieder andere Produkte (z.B. Molke -> Ziger).
Personen
Meistens sind Personen an Prozessen beteiligt, z.B. der Senner.
Geräte
Die Personen verwenden Geräte, um Produkte in einem Prozess zu verarbeiten. Es wird dazu verwendet, um ein Produkt von dem einen in einen anderen Zustand zu bringen (z.B. die geronnene Milch mithilfe einer Käseharfe zu brechen). Beim Einsatz eines Geräts ist auch immer eine Form von Energie beteiligt, z.B. Muskelkraft oder elektrischer Strom. Die Trennschärfe zum Gefäß ist nicht immer gegeben. Ein Gefäß, das für einen Reifungsprozess vorgesehen ist oder mit dem Flüssigkeit durch Schwerkraft aus einem Produkt, z.B. der Käsemasse entzogen wird, stellt demnach auch ein Gerät dar. Ähnlich ist es mit den verschiedenen Formen von Butterfässern. Sie fassen zwar den Rahm, deren Zweck ist aber nicht die Lagerung, sondern die Verwendung für den Prozess, den Rahm in Butter und Buttermilch zu trennen.
Gefäße
Sind nur für die Lagerung eines Produkts oder für dessen Transport in Verwendung. Das beste Unterscheidungskriterium zum Gerät ist jenes, dass ein Gefäß in der Hinsicht keine Rolle bei einem Prozess spielt, als dass das Produkt dadurch verändert wird.

(auct. Markus Kunzmann)
Tags: Linguistik
Onomasiologischer Rahmen
Onomastik
Die erstgenannte Perspektive ist wegen der überschaubaren Inputdaten zweifellos einfacher, denn sie liefert einen Grundbestand von meist gut lokalisierbaren römischen Namen, der systematisch abgearbeitet werden kann. Weitaus anspruchsvoller und auch erheblich aussagekräftiger ist die Rückperspektive. Hier fehlt es weithin an den Voraussetzungen für eine erfolgreiche großräumige Arbeit; viele Gebiete sind namenkundlich nicht erschlossen, da weder die rezenten dialektalen Varianten noch frühe Belege vorliegen. Immerhin ist mit dem Schweizer Ortsnamenportal ein vielversprechender Anfang gemacht worden.
Neben den Siedlungsnamen ist aber gerade die Dokumentation von Flurnamen (etwa von Berg und Almen) wichtig, da sie Rückschlüsse auf die kontinuierliche Nutzung des Geländes erlaubt. Dazu das folgende, ganz vorläufige Beispiel: In seiner wichtigen Studie über die frühmittelalterliche Besiedlung des südlichen Oberbayern und der sich anschließenden Tiroler und Salzburger Gebiete schreibt Franz Weindauer 2014 über das Ergebnis einer umfassenden Auswertung der archäologischen Funde: "Der Abgleich mit den Ergebnissen der Ortsnamenkunde und der Patrozinienforschung hat ergeben, dass erneut die bereits in spätrömischer Zeit besiedelten Regionen stichhaltige Hinweise auf romanisches Leben im Frühmittelalter liefern. Dazu zählen in erster Linie das Ammerseegebiet, das Werdenfelser Land, das östliche Chiemseegebiet und der Rupertiwinkel, aber beispielsweise auch die Region um das Mangfallknie, um Rosenheim und um den Starnberger See" (Weindauer 2014, 249). Dabei orientiert sich die Verteilung der archäologischen Fundorte im alpinen Teil seines Untersuchungsgebiets ganz offenkundig an den Passwegen, also etwa an der Brenneroute, die sich in Innsbruck (von Süden aus gesehen) in einen westlichen Zweig (über den Zirlerberg nach Garmisch und ins Alpenvorland) und einen östlichen Zweig (den Inn abwärts) teilt. Schon ein oberflächlicher toponomastischer Blick auf das ausgedehnte Karwendelgebirge, das im Winkel dieser beiden Routen liegt und bis heute keine einzige etwas größere Siedlung kennt, fördert im Abstand von wenigen Kilometern evidente Romanismen oder romanisch vermittelte vorrömische Wörter zu Tage:
* die Fereinalm < lat. veranum, vgl. spa. verano 'Sommer' sowie den Vereinatunnel im Unterengadin;
* die Krapfenkarspitze zur Basis vorrömisch *krapp- 'Fels', vgl. roh. (sursilvan) crap mit sehr zahlreichen Belegen in der Bündner Toponomastik (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorrömisch *blese 'steile Grashalde', vgl. roh. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 sowie die ebenfalls zahlreichen toponomastischen Belege in Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu mit Verlagerung des Akzents auf die erste Silbe; vgl. die schweizerischen Entsprechungen, wie den roh. Ortsnamen glaretsch in Disentis (vgl. Schorta 1964, 164) und den ostschweizerischen alemann. Ortsnamen Glaretsch in Pfäfers (vgl. ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, vgl. die zahlreichen roh. Belege des Typs laret, zur Variante lat. larictum in Schorta 1964, 185;
* den Bergnamen Juifen < lat. iugum 'Joch', wiederum etliche, weitgestreute Parallelen, vgl. die Ortsnamen Juferte im Simmental südlich Bern, mehrere Juf und giuf, giuv in Graubünden (alle im Ortsnamenportal der Schweiz) sowie den Jaufenpass in Südtirol; wenig östlich vom Juifen liegt der Berg Guffert, dessen Name zur genannten Simmentaler Variante gestellt werden muss.
Eine sorgfältige Analyse würde noch erheblich mehr zu Tage fördern. Man beachte beim letzten Beispiel die deutlich nicht mehr lateinische, sondern romanische Lautgestalt (-g- > -v-, -f). Alle diese Übernahmen setzen Kontakt mit einer romanischsprachigen Bevölkerung voraus, die das Gebirge zur Subsistenz nutzte, und wohl auch Akkulturation an ihre Lebensform. In diesem Sinne hat sich schon Gamillscheg 1935, 306 geäußert: "Der alemannische und bajuwarische Bauer, der dem neubesiedelten Boden seine Frucht abringt, stellt die Verbindung mit den unter gleich harten Bedingungen arbeitenden Romanen her. Nichts zeigt deutlicher, daß sich hier keine nationalen Kämpfe abgespielt haben, als die Tatsache, die altromanischen Ortsnamen und die jüngeren deutschen hier ebenso friedlich nebeneinander weiterbestehen wie Ladiner und Deutschtiroler. Das Eindringen der Alemannen und Bajuwaren in den rätisch-norischen Alpenraum hat keine Kulturzerstörung im Gefolge gehabt."
(auct. Thomas Krefeld)
Tags: Linguistik
Publikation
In manchen Wissenschaftsdisziplinen (nach unserer Kenntnis trifft dies u. a. auf die Informatik zu) ist in den vergangenen Jahren gar ein Trend zu beobachten, der die mit den Neuen Medien einhergehenden technischen Möglichkeiten ad absurdum führt: Während es nunmehr eigentlich ein Leichtes ist, weltweit bequemen Zugang zu Informationen und Texten zu gewähren, geschieht auch dort das blanke Gegenteil, indem der entsprechende Zugang nur gegen Bezahlung freigegeben wird. Dies ist sogar ein Rückschritt gegenüber der von uns zuvor kritisierten traditionellen Publikation auf Papier. Wir warnen an dieser Stelle nachdrücklich vor derartigen Entwicklungen, die auch im Bereich der Geisteswissenschaften bereits ansatzweise zu beobachten sind.
Aber auch der Begriff der Publikation hat sich substantiell verändert (vgl. Krefeld 2018c, Abschnitt 14). In umfassendem Sinne gehören dazu:
- Theoretisch und methodologisch zentrale Begriffe und Probleme werden in konziser Weise unter dem Reiter Methodologie abgelegt.
- Ausführlichere analytische Untersuchungen von Projektergebnissen oder theoretische bzw. methodologische Diskussionen können unter Projektpublikationen abgelegt werden.
- Kommentare zu den auf der interaktiven Online-Karte visualisierten Daten, wie z.B. zu außersprachlichen Realitäten ('Konzepte') und ihren dialektalen Bezeichnungen ('Morpho-lexikalische Typen', 'Basistypen'), werden in der Kartenlegende durch einen 'i'-Button geöffnet; sie können aber auch dem Reiter LexiconAlpinum aufgerufen werden; Kommentare können sehr leicht durch Projektmitarbeiter oder auch durch Externe eingestellt werden.

Über die Legende zugängliche Kommentarfunktion
(auct. Thomas Krefeld)
Tags: Funktionsbereiche
Quantifizierende Darstellungen
Die interaktive Online-Karte von VerbaAlpina erlaubt neben der qualitativen Kartierung auch die Visualisierung aggregierter Daten im Sinne einer quantifizierenden Abbildung der Daten im Raum. Die Aggregierung orientiert sich dabei stets an geographischen Regionen. Der Nutzer hat dabei die Auswahl zwischen Aggregierung auf Basis der Gemeindeflächen (Kleinraum), der sog. NUTS-3-Regionen (Mittelraum) und schließlich der Verbreitungsregionen der drei großen Sprachfamilien Germanisch-Romanisch-Slavisch (Großraum). Darüber hinaus besteht die Möglichkeit, beliebige Gemeindeflächen als individuelle Regionen zu definieren, die dann wiederum als Bezugsgröße der Aggregierung fungieren. Letztere Option kann verzerrenden Effekten entgegenwirken, die sich in der Perspektive der Aggregierung über die administrativ – und somit aus Sicht der Sprachwissenschaft sachfremd – motivierten Flächen der Gemeindegebiete oder der NUTS-3-Regionen ergeben. Im Einzelfall kann die entsprechende Vorgehensweise natürlich nur heuristisch sein, der Nutzer hat aber die Möglichkeit, einmal entdeckte sinnvolle regionale Kohärenzen abzuspeichern, zu kommentieren, wiederzuverwenden und der Allgemeinheit zur Verfügung zu stellen.
Bezogen auf die gewählten Regionen bzw. Flächen werden sodann sämtliche bis zur Aktivierung der quantifizierenden Darstellung ausgewählten qualitativen Daten aggregiert. Größe und Farbgebung der einzelnen Kartensymbole korrelieren dabei mit der Anzahl der jeweils in einem Symbol gebündelten qualitativen Einzeldaten. Der arithmetisch zugrunde gelegte Maximalwert, bei dessen Erreichen ein Symbol stets die jeweils maximale Größe und Farbgebung erhält, entspricht dabei standardmäßig der höchsten Anzahl an aggregierten Daten, der in einer der ausgewählten Flächen bzw. Regionen auftritt. Wahlweise kann dieser maximale Referenzwert auf die Gesamtanzahl der aggregierten Einzeldaten umgesetzt werden, was zu einer Änderung der Kartendarstellung führt.
Bei aktivierter Quantifizierung können durch Deaktivierung einzelner Listeneinträge in der Kartenlegende die entsprechenden qualitativen Daten aus der Berechnung der Quantitäten herausgenommen oder andere durch zusätzliche Auswahl hinzugenommen werden.
Neben der Quantifizierung vor dem Hintergrund einer georeferenzierten, die realen Grenzverläufe abbildenden Karte erlaubt VerbaAlpina auch die Darstellung quantifizierter Daten auf einer sog. Wabenkarte. Gestalterisches Vorbild ist eine Wikipedia-Grafik, die die Wahlergebnisse der britischen Unterhauswahl von 2015 visualisiert. Im folgenden ist zunächst die punkt-, längen- und winkeltreue Karte (im folgenden als "geographische Karte" bezeichnet) mit den Wahlergebnissen in den einzelnen Wahlkreisen wiedergegeben. Daran anschließend ist die Wabenkarte abgebildet, auf der jeder Wahlkreis durch ein Sechseck jeweils identischer Größe dargestellt ist.
Quelle: https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)
Quelle: https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (abgerufen am 03.11.2016)
Die Gegenüberstellung der beiden Kartentypen zeigt die jeweiligen Vor- und Nachteile. Die Wabenkarte weist geographische Ungenauigkeiten bzw. diesbezüglich sogar Fehlinformationen auf. So erkennt man z.B. im Distrikt Greater London eine isolierte rote Wabe, die von lauter blauen Waben umgeben ist – ein scheinbares Faktum, das jedoch keinen Rückhalt in der geographischen Karte findet. Auf der anderen Seite besitzt die Wabenkarte den Vorteil, die realen Zahlenverhältnisse zwischen den einzelnen Farben besser zu visualisieren, da eine Vielzahl von flächenmäßig sehr kleinen Wahlbezirken auf der geographischen Karte vom Betrachter als nachrangig wahrgenommen werden, obwohl die politische Bedeutung mit der der flächenmäßig großen Wahlbezirke gleichgestellt ist. Somit ergänzen sich die beiden Kartentypen und der eigentliche Mehrwert besteht in der Möglichkeit, beide Karten konsultieren und deren Visualisierung gegenüberstellen zu können.
Die Wabenkarte von VerbaAlpina zeichnet sich dadurch aus, dass sämtliche politischen Gemeinden im Alpenraum durch jeweils gleich große Hexagone abgebildet werden. Dabei wird versucht, die geographische Logik wenigstens ungefähr zu bewahren. Die Berechnung der Farbgebung der einzelnen Hexagone erfolgt dort in der gleichen Weise wie oben bei der Punktsymbolkarte beschrieben. Der Vorteil einer solchen Wabenkarte besteht gegenüber einer simplen Einfärbung der Gemeindeflächen auf einer georeferenzierten Karte darin, dass suggestive Effekte durch stark unterschiedliche Größe der Gemeindeflächen unterdrückt werden.
(auct. Stephan Lücke)
Tags: Informationstechnologie Webseite
Quellen
(1) Die Quelle liefert einen Einzelbeleg:
Einzelbeleg: [a̠lpˈejo̞] – Ort: Bassano del Grappa – Quelle: ALD-II 848_1, 181 (Valrovina)
Phonetischer Typ: (nicht typisiert)
Morpho-lexikalischer Typ: Treccani alpeggio (roa. m.)
Basistyp: alpe; vgl. DELI 42
Konzept: ALM
(2) Die Quelle liefert einen phonetischen Typ:
(Kein Einzelbeleg vorhanden) – Ort: Adelboden
Phonetischer Typ: Anke – Quelle: SDS V_179_1, BE104
Morpho-lexikalischer Typ: Anke (gem. m.), vgl. Idiotikon s.v. Anke, 1, 341 ff.
Basistyp: anko; vgl. Kluge 2001, 47
Konzept: BUTTER
(3) Die Quelle liefert einen morpho-lexikalischen Typ:
(Kein Einzelbeleg vorhanden) – Ort: St. Peter-Pagig
Phonetischer Typ: Putter – Quelle: SDS V_179_1, GR22
Morpho-lexikalischer Typ: Butter (gem. n.), vgl. Idiotikon s. v. [[Butter, 1, 341 ff. – Quelle: SDS V_179_1, GR22
Basistyp: butyru(m); vgl. DELI 178
Konzept: BUTTER
(4) Die Quelle liefert einen morpho-lexikalischen Typ, der zwar im Standarddeutschen existiert, jedoch mit einem anderen Konzept verbunden ist:
Morpho-lex. Typ: Pelz Duden s.v. Pelz (nicht für dieses Konzept); Idiotikon s.v. Belz P-, 4, 1222 – Quelle: SDS V_162_1
Konzept: HAUT AUF DER MILCH, BEIM ABKÜHLEN NACH DEM KOCHEN
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Webseite
Rätische Inschriften
Die neuzeitliche Verteilung der Sprachfamilien im Untersuchungsgebiet lässt die Alpen als eine Barriere, gewissermaßen als gewaltigen Sperrriegel erscheinen, insofern sie grosso modo den deutschsprachigen Raum (nördlich) vom romanisch- und slawischsprachigen Raum (südlich) trennt (Link). Das über den Alpenhauptkamm hinweg deutlich nach Süden ausgreifende, bairischsprachige Südtirol wirkt beinahe als Sonderfall. Diese 'Ansicht' ist in historischer Perspektive irreführend. Schon die ältesten sprachlichen Zeugnisse, Inschriften aus vorrömischer Zeit, sind in einem weitestgehend identischen Alphabet verfasst:
(Quelle)
Die Verbreitung dieser sogenannten 'rätischen' Texte reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua; sie lässt sich nur vor dem Hintergrund eines die Alpen überschreitenden kulturellen Zusammenhangs verstehen (vgl. die Überblickskarte zu den raetischen Inschriften). Im selben Alphabet wurden, grosso modo, auch die uns erhaltenen Dokumente des Etruskischen geschrieben; es geht offensichtlich auf eine antike westgriechische Schrift zurück. Obwohl der Lautwert der Zeichen einigermaßen klar ist, konnte die Bedeutung der Texte bis heute nicht entschlüsselt werde. Es ist weiterhin dunkel, ob der antike Name Raetii 'Räter' im Sinne einer spezifischen Kultur- und/oder Sprachgemeinschaft oder als Sammelbegriff für ganz unterschiedliche alpine Ethnien zu verstehen ist (vgl. dazu Rageth 2012). Jedenfalls kann man feststellen, dass sich das Verbreitungsgebiet der genannten Inschriften durchaus nicht mit der römischen Provinz Raetia deckt. Dasselbe gilt für die von den Archäologen als meist als 'rätisch' identifizierte Fritzens-Sanzeno-Kultur, deren charakteristische Keramik im Westen des heutigen Kantons Graubünden fehlt, obwohl diese Gebiete zur Raetia gehörten, andererseits jedoch an etlichen Orten in der östlich anschließenden Provinz Noricum gesichert wurden (vgl. Lang 1992, Rageth 1992, Marzatico 1992).
(auct. Thomas Krefeld)
Rätoromanisch
(auct. Thomas Krefeld)
Tags: Linguistik
Referent
(auct. Stephan Lücke)
Tags: Linguistik
Referenzwörterbücher
Sofern im Einzelfall keines der definierten Referenzwörterbücher ein passendes Lemma aufweist, legt VerbaAlpina in orthographischer Schreibweise einen morpholexikalischen Typ fest, der fortan Referenzstatus besitzt und auf den alle weiteren Sprachdaten dieser morpholexikalischen Kategorie bezogen werden. Durch diese Eigenreferenzierung erhält auch VerbaAlpina selbst den Status eines Referenzwörterbuchs.
Da es sich bei der beschriebenen Zuweisung auf die Referenzwörterbücher um eine interpretationsabhängige Arbeit handelt, ermöglicht VerbaAlpina durchaus auch eine kontroverse Kommentierung einzelner Lemmazuweisungen durch Wissenschaftler und Laien, die es Externen erlaubt, alternative Typisierungen vorzunehmen, die ihrerseits wieder kommentiert und diskutiert werden können.
Wörter aus dem germanischen Sprachraum werden, sofern möglich, verknüpft mit den Lemmata von:
- Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch
- Grimm, Jacob und Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm, 16 Bde. in 32 Teilbänden, Leipzig (Quellenverzeichnis Leipzig 1971) (DWB)
- Duden (Berücksichtigung aufgrund seiner faktischen Bedeutung und der großen Materialfülle – trotz der Dürftigkeit hinsichtlich der von ihm präsentierten lexikographischen Informationen)
- Vocabolario Treccani
- Trésor de la langue française informatisé, (TLFi)
- Glossaire des patois valdôtains
- Banca lessicala ladina, (BLad; Ladinisch, lld.)
- Pledari grond (Rätoromanisch, roh.) und DRG
- Glossaire des Patois de la Suisse Romande, GPSR
- Grant Dizionari Bilengâl Talian Furlan, GDBtf (Friaulisch, fur.)
- TLIO – Tesoro della Lingua Italiana delle Origini, TLIO
- LSI und RID
- Slovar slovenskega knjižnega jezika, (SSKJ)
- Georges, Karl Ernst (1913-1916, Reprint 1998): Ausführliches lateinisch-deutsches Handwörterbuch. Aus den Quellen zusammengetragen und mit besonderer Bezugnahme auf Synonymik und Antiquitäten unter Berücksichtigung der besten Hilfsmittel ausgearbeitet, 2 Bände, Darmstadt.
- Wartburg, Walther von (1922-1967): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel (FEW), mit seinen artikelschließenden Kommentare, die oft auch über das Französische und sogar das Romanische hinaus grundlegend sind.
- Kluge
- DELI
- Bezlaj und auch die neuste Ausgabe Snoj. Allgemein für slawische Etymologien s. Berneker
- Als Referenzform für germanische Basistypen dienen wenn möglich die Lemmata des AWB, denn sie repräsentieren die ältesten belegten Formen.

(auct. Thomas Krefeld | Stephan Lücke)
Tags: Linguistik
Relationales Datenmodell
Für die Abbildung von Informationen im relationalen Datenmodell existieren eigene Regeln, die de facto eine Wissenschaft für sich darstellen (z. B. die sog. Normalisierung). Gleichzeitig ist die konkrete Wahl der Modellierung anwendungsabhängig und die Einhaltung bestehender Modellierungsregeln in manchen Fällen aus der Perspektive der Nutzbarkeit und Performanz eher hinderlich. In der Praxis stellt jede Datenmodellierung einen Kompromiss zwischen den Vorgaben des theoretischen Regelwerks, technischen Erfordernissen und Nutzerfreundlichkeit dar. Darüber hinaus kann ein einmal gewähltes Datenmodell jederzeit geändert und an veränderte Erfordernisse angepasst werden.
(auct. Stephan Lücke)
Tags: Linguistik
Repositorien
VerbaAlpina ist bestrebt, jede VA-Version in einem oder mehreren Repositorien abzulegen.
(auct. Stephan Lücke)
Tags: Webseite
Reusability von VerbaAlpina
Semantik

Graphik: Stephan Lücke
Im Lichte der dabei zu Tage tretenden Konzeptrelationen lässt sich das synchrone semantische Profil eines jeden polysemen Ausdrucks skizzieren; die wichtigsten Ausprägungen von Polysemie werden im Folgenden genannt.
- Taxonomische Polysemie liegt vor, wenn ein Ausdruck hierarchisch sowohl einander über- als auch untergeordnete Konzepte bezeichnet.
- Meronymische Polysemie liegt vor, wenn ein Ausdruck sowohl komplexe Sachzusammenhänge ('Ganze') als auch Konstituenten dieser Zusammenhänge ('Teile') bezeichnet; so wird die ALM, der für den Bauern wichtige Teil des Berges, häufig schlechthin als 'Berg' bezeichnet: Vgl. Karte Konzept ALM
Meronymische Bezeichnung des Konzepts ALM als Teil des Bergs durch Übertragung der Bezeichnung des Ganzen
Morpho-lex. Typ montagna 'Berg' (roa. fem.) (16 Belege) |
|
Morpho-lex. Typ monte (roa. m.) (67 Belege) |
Andererseits kann die ALM, als wirtschaftliches Ganzes (mit allem, was dazu gehört), mit Ausdrücken bezeichnet werden, die eigentlich nur für Komponenten der Almwirtschaft stehen: Vgl. Karte Konzept ALM
Meronymische Bezeichnung des Konzepts ALM als Ganzes durch Übertragung der Bezeichnung von Komponenten | |
Morpho-lex. Typ cascina 'Sennhütte' (roa. fem.) (1 Beleg) |
|
Morpho-lex. Typ casera 'Sennhütte' (roa. fem.) (1 Beleg) |
|
Morpho-lex. Typ cjampei 'Felder' (roa. m.) (2 Belege) |
|
Morpho-lex. Typ pascol 'Weide' (roa. m.) (1 Beleg) |
|
Morpho-lex. Typ pascolo 'Weide' (roa. m.) (1 Beleg) |
- Metonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die innerhalb ein und desselben 'Ganzen' unterschiedliche 'Teile' bezeichnen; so gehören zu einer ALM u. a. das VIEH, GEBÄUDE für das PERSONAL und für das Vieh, eine HÜRDE usw. Alle genannten Komponenten können in unterschiedlichen romanischen Ortsdialekten durch den morpho-lexikalischen Typen roa. mandra bezeichnet werden: Vgl. Karte
Metonymische Bedeutungen des morpho-lexikalischen Typs roa. mandra
Konzept ALMHÜTTE (1 Beleg) |
|
Konzept ALMSTALL (2 Belege) |
|
Konzept HERDE (15 Belege) |
|
Konzept RINDERHÜRDE (3 Belege) |
- als 'Kopf': capo (roa. m.), (19 Belege), dazu capo di latte (roa.), wörtlich 'Milchkopf' (12 Belege), il capo del latte (roa.) (1 Beleg)
- als 'Blume': fleur / fiore (roa. m.) (15 Belege), fiora (roa. fem.) (17 Belege), dazu fiora cruda (1 Beleg), wörtlich 'ungekochte Blume', fiore di latte (roa.), wörtlich 'Milchblume' (2 Belege)
- als 'Haut': Haut (ger. m.) (2 Belege), peau / pelle (roa. fem.) (1 Beleg), la pelle del latte (roa.) (1 Beleg)
- als 'Pelz': pelliccia (roa. fem.) (2 Belege), Pelz (ger. m.) (4 Belege)
- als 'Nebel': sbrumacje (roa. fem.) (2 Belege), sbrume (roa. m.) (11 Belege)
- als 'Schaum': écume / schiuma (roa. fem.) (2 Belege), spuma (roa. fem.) (1 Beleg), spumacje (roa. fem.) (1 Beleg)
- als 'Tuch': toile / tela (roa. m.) (14 Belege), dazu tela del latte (roa.) (1 Beleg) und tela di latte (roa.) (5 Belege), wörtlich 'Milchtuch'
- Vgl. Karte
-
- Antonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die im Gegensatz zueinander stehen.

(auct. Thomas Krefeld)
Tags: Linguistik
Sprachatlanten und Wörterbücher im Alpenraum
- Romania alpina: ALF, AIS (Details), ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
- Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAO;
- Slavia alpina: SLA.
Darüber hinaus gibt es im Alpenraum auch zahlreiche Wörterbücher, die die Idiome von unterschiedlichen, mehr oder weniger großen, Sprachgebieten erfassen. Die Wörterbücher, die von VerbaAlpina verwendet werden, sind folgende:
- Romania alpina: DRG (Dicziunari Rumantsch Grischun), LSI (Lessico dialettale della Svizzera italiana), GPSR (Glossaire des patois de la Suisse romande), ALTR (Archivio lessicale dei dialetti trentini)
- Germania alpina: Idiotikon (Schweizerisches Idiotikon), BWB (Bayerisches Wörterbuch), WBOE (Wörterbuch der bairischen Mundarten in Österreich).

(auct. Beatrice Colcuc | Thomas Krefeld)
Tags: Linguistik
Sprachinseln
- sprachliche Differenz (dialektal, einzelsprachlich) zur Umgebung
- kleinräumige Begrenzung relativ zur unmittelbaren Umgebung
Oft geht auch eine entsprechende ethnokultrelle Differenz der Sprachinselbewohner zu ihrer Umgebung einher, was jedoch im Zusammenhang damit steht, dass Sprachinseln oft auf eine gezielte Besiedelung zurückzuführen sind und die Menschen nicht nur ihre Sprache, sondern auch ihre Sitten und Bräuche ihres Herkunftsgebiets mitnehmen.
Auch hinsichtlich ihrer Religionszugehörigkeit können sich Sprachinselbewohner von ihrer Umgebung unterscheiden, da die Errichtung sogenannter "Kolonien" häufig auch religiöse Gründe hatte, wie beispielsweise bei den überseeischen Mennonitengemeinschaften oder den Siebenbürger Landlern in Rumänien.
Manche Sprachinseln verfügten auch über besondere Priviligien wie Zollfreiheit, Selbstbestimmung, Rodungsrecht usw. Mit diesen Mitteln versuchten manche Landesherren die Ansiedlung neuer Bevölkerung zum Zwecke der Urbarmachung attraktiv zu machen. Nicht zuletzt begünstigen topographische Hindernisse und damit die schwierige verkehrstechnische Erschließung die Beständigkeit einer Sprachinsel (vgl. Mattheier 1994, Wiesinger 1983).
Auch innerhalb des Untersuchungsgebiets von VerbaAlpina liegen zahlreiche, zum Teil nur noch historische, deutsche Sprachinseln in Oberitalien (vgl. Comitatio unitario delle isole linguistiche storiche germaniche in Italia).
Hierzu gehören in den Westalpen im Grenzgebiet zwischen Italien und der Schweiz die alemannischsprachigen Walsergemeinden:
- Gressoney/Greschoney (Aostatal)
- Issime/Èischeme (Aostatal)
- Campello Monti/Kampel (Provinz Vercelli)
- Rimella/Remmalju (Provinz Verbania)
- Carcoforo/Chalchoufe (Provinz Vercelli)
- Alagna Valsesia/Im Land (Provinz Vercelli)
- Formazza/Pumatt (Provinz Verbano Cusio Ossola)
- Fersental/Valle dei Mòcheni (Provinz Trient)
- Zimbrische Sprachinsel Lusérn/Luserna (Provinz Trient)
- Zimbrische Sprachinsel XIII Gemeinden, Ljetzan/Giazza (Provinz Verona)
- Zimbrische Sprachinsel VII Gemeinden, Robaan/Roana (Provinz Vicenza)
- Zimbrische Sprachinsel Kansilien (Provinz Belluno, Provinz Treviso)
- Sappada/Plodn (Friaul-Julisch Venetien)
- Sauris/Zahre (Friaul-Julisch Venetien)
- Timau/Tischlbong (Friaul-Julisch Venetien)
- Val Canale/Kanaltal (Friaul-Julisch Venetien)
Neben den Belegen aus dem Tirolischen Sprachatlas wurden über die Crowdsourcing-Seite des Projekts bereits wertvolle zimbrische bzw. fersentalerische Belege aus (A) Palai im Fersental, (B) Lusern und sogar aus der (C) Kommune Selva di Progno beigesteuert (vgl. 3144).
(auct. Markus Kunzmann)
Tags: Linguistik
Sprachkontakt
(auct. Thomas Krefeld)
Tags: Linguistik
Strata
Von Sub- und Superstraten spricht man also nur rückblickend, aus der Sicht einer Zeit, in der die jeweiligen Sprachen im Untersuchungsgebiet nicht mehr gesprochen werden; dabei müssen oft große Zeitspannen überbrückt werden, so dass man sich kurzerhand an den sprachlichen Systemen orientiert und dort nach kontaktinduzierten Veränderungen, also nach den Resultaten des Sprachkontakts sucht. Für das eigentliche Verständnis der mutmaßlichen Sprachkontakterscheinungen ist jedoch die historische Periode der jeweiligen Zweisprachigkeit entscheidend, d.h. die Zeit, in der beide Sprachen neben- bzw. miteinander gesprochen wurden. Diese gleichzeitig gesprochenen Sprachen heißen 'Adstrate'. Damit muss jedoch unweigerlich eine synchronische Perspektive eingenommen werden, die nicht auf die 'Sprachen' beschränkt werden kann, sondern den 'Sprecher' mit seiner spezifischen Kompetenz und womöglich die konkrete Äußerung, das 'Sprechen' mitberücksichtigt. Das ist in historischer Perspektive zwar häufig unmöglich, muss jedoch grundsätzlich auch bei der Rekonstruktion der Stratigraphie bedacht werden, denn die Äußerung eines zweisprachigen Sprecher ist grundsätzlich anders als die eines einsprachigen zu beurteilen.
(auct. Thomas Krefeld)
Tags: Linguistik
Stratigraphie
Allgemeines
Die Alpen sind seit prähistorischer Zeit ein Gebiet vielfältiger Sprachkontakte, die auf ganz unterschiedliche Stratakonstellationen zurückgehen. Grundsätzlich werden Sprachen, die in einem Gebiet in Kontakt stehen, weil es dort mehr oder weniger viele zweisprachige Sprecher oder gar Sprechergemeinschaften gibt, als Adstrate bezeichnet. Falls ein Basistyp nur in einem bestimmten Gebiet verbreitet ist, also etwa in den Alpen, und in den betroffenen Sprachfamilien ansonsten nicht vorkommt, sind die Entlehnungsrichtung und die Herkunftssprache oft nicht eindeutig (vgl. den Basistyp roa. baita / deu. Beiz, Beisl).Wenn die Herkunftssprache des entlehnten Elements im Verbreitungsgebiet, oder in einem Teil davon, nicht mehr gesprochen wird, werden zwei Konstellationen unterschieden: Im Fall des Substrats wurde die Herkunftssprache (Substratsprache) im Verbreitungsgebiet gesprochen, bevor ihre Überlieferungskontinuität abriss und die geltende Sprache sich durchsetzte; das Romanische ist eine Substratsprache des gesamten deutsch- und slowenischsprachigen Alpengebiets. Substratwörter setzen zwar Sprachwechsel voraus; sie zeichnen sich aber trotzdem oft durch außerordentliche regionale oder lokale Kontinuität aus.
Im Falle des Superstrats galt die Herkunftssprache während eines gewissen Zeitraums im Verbreitungsgebiet, ohne sich dort dauerhaft zu etablieren. So herrschten in Teilen des heute romanischsprachigen Alpenraums nach dem Zusammenbruch der römischen Infrastruktur zeitweise germanische Superstrate (Gotisch, Langobardisch) und in Slowenien spielte das Deutsche während der langen Habsburgerzeit diese Rolle.
Zwischen den drei Sprachfamilien haben sich nun durchaus unterschiedliche Szenarien ergeben; hinsichtlich der Bedeutung des Sprachkontakts für die Geschichte des sprachlichen Raums ist vor allem die Chronologie der Entlehnung wichtig: Handelt es sich beispielsweise bei Romanismen im germanischen und slawischen Sprachraum um Substratwörter mit regionaler Überlieferungskontinuität seit der Antike oder um jüngere adstratale Übernahmen? Dieselbe Frage gilt mutatis mutandis ebenso für die Germanismen im romanisch- bzw. slawischsprachigen und die Slawismen im deutsch- und romanischsprachigen Raum.
Entlehnungen sind ein zuverlässiger Indikator historischer Akkulturationsprozesse; deshalb ist eine quantitative Darstellung angebracht, die es gestattet, die relative Häufigkeit der belegten Entlehnungen ortsgenau abzubilden. Die Akkulturationsrichtung ist jedoch keineswegs immer eindeutig; nicht selten koexistieren in eng definierten onomasiologischen Bereichen gegenläufige Entlehnungen. Die folgende Graphik schematisiert die stratigraphische Herausforderung. Sie differenziert die drei heute romanisch-, deutsch- und slowenischsprachigen Gebiete nach Substrat- und Superstratsprachen und symbolisiert (durch Kugeln) die mehrsprachigen Sprechergruppen in Adstratkonstellationen. Gleichzeitig wird die besondere historische Bedeutung der Romanisierung verdeutlicht (vgl. Märtin 2017, 102-129), die – wenn auch in sehr unterschiedlicher Intensität – den gesamten Alpenraum erfasste und deshalb wohl auch alles Ältere, Vorrömische vermittelte. Direkter Kontakt zwischen Sprechern vorrömischer Sprachen und Sprechern der das Lateinisch-Romanische gebietsweise überdeckenden nachfolgenden Sprachen (Slawisch und Germanisch) kann zwar nicht kategorisch ausgeschlossen werden; diese Annahme ist jedoch sicherlich problematisch.

Die zentrale Aufgabe der Wortgeschichte besteht nun darin, die mutmaßliche Entlehnungen stratigraphisch zu präzisieren. Die gegenläufige Entlehnung vom deu. Schmalz > roa. smalzo und lat.-roa. butyrum > deu. Butter sowie dessen Weiterentlehnung ins Slo. (> puter ließe sich dann wie folgt schematisieren.

Vorrömische Zeit
Die neuzeitliche Verteilung der Sprachfamilien im Untersuchungsgebiet lässt die Alpen als eine Barriere, gewissermaßen als gewaltigen Sperrriegel erscheinen, insofern sie grosso modo den deutschsprachigen Raum (nördlich) vom romanisch- und slawischsprachigen Raum (südlich) trennt (Link). Das über den Alpenhauptkamm hinweg deutlich nach Süden ausgreifende, bairischsprachige Südtirol wirkt beinahe als Sonderfall. Diese 'Ansicht' ist in historischer Perspektive irreführend. Schon die ältesten sprachlichen Zeugnisse, Inschriften aus vorrömischer Zeit, sind in einem weitestgehend identischen Alphabet verfasst:
Die Verbreitung dieser meist als 'rätisch' bezeichneten, nicht entzifferten Texte (vgl. Schumacher 2004) reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua; sie lässt sich nur vor dem Hintergrund eines die Alpen überschreitenden kulturellen Zusammenhangs verstehen: In diesem Alphabet wurden, grosso modo, auch die uns erhaltenen Dokumente des Etruskischen geschrieben; es geht offensichtlich auf eine antike westgriechische Schrift zurück.
Römische Zeit
Die Römer haben dann den zentralen Alpenraum zwischen 25 und 15 v.Chr. erobert; das Tropaeum Alpium in La Turbie, oberhalb von Monaco, berichtet von 46 eroberten Stämmen, deren Namen sich teils bis heute erhalten haben. Die Inschrift ist leider nur in Bruchstücken erhalten, konnte jedoch durch die Naturgeschichte von Plinius dem Älteren (3, 136-137) vollständig rekonstruiert werden:
"Imperatori Caesari divi filio Augusto / pont(ifici) max(imo) imp(eratori) XIIII trib(unicia) pot(estate) XVII / senatus populusque Romanus / quod eius ductu auspiciisque gentes Alpinae omnes quae a mari supero ad inferum pertinebant sub imperium p(opuli) R(omani) sunt redactae / gentes Alpinae devictae Trumpilini Camunni Vennonetes Vennostes Isarci Breuni Genaunes Focunates / Vindelicorum gentes quattuor Cosuanetes Rucinates Licates Catenates Ambisontes Rugusci Suanetes Calucones / Brixentes Leponti Viberi Nantuates Seduni Veragri Salassi Acitavones Medulli Ucenni Caturiges Brigiani / Sogiontii Brodionti Nemaloni Edenates (V)esubiani Veamini Gallitae Triullatti Ectini / Vergunni Egui Turi Nemeturi Oratelli Nerusi Velauni Suetri" (Datenquelle: Epigraphik-Datenbank Clauss / Slaby)
Die folgende Übersicht zeigt die Namen aus der Aufzählung, die sich allem Anschein nach in aktuellen Namen identifizieren lassen.auf dem Trop.Alpium erwähnter Name | aktueller Name | Geodaten (Breite ; Länge) |
Trumpilini | Val Trompia | 45°44'5.87"N ; 10°12'2.20"E |
Camunni | Val Camonica | 45°57'17.71"N ; 10°17'21.08"E |
Vennonetes | Vinschgau | 46°39'44.81"N ; 10°34'39.75"E |
Venostes | 46°39'44.81"N ; 10°34'39.75"E | |
Isarci | Vgl. die Flussnamen Isère, Isar, Isarco (= deu. Eisack | 47°23'13.25"N ; 11°16'30.42"E |
Breuni | Brenner | 47° 9'59.75"N ; 11°25'0.14"E |
Licates | Flussname Lech (lat. Likias [2 Jh. n. Chr.], später Licca [570 n. Chr.] | |
Brixentes | eventuell der Gemeindename Brixen | 47°30'2.70"N ; 9°44'32.31"E |
Leponti | Val Leventina | 46° 6'47.60"N ; 8°17'31.10"E |
Seduni | Sitten im Kanton Wallis, Schweiz | 46°13'59.25"N ; 7°21'37.80"E |
Caturiges | der Gemeindename Chorges (Dép. Hautes-Alpes) | 44°32'44.67"N ; 6°16'31.60"E |
Brigiani | der Gemeindename Briançon | (Dép. Hautes-Alpes)44° 53′ 47″N, 6° 38′ 08″E |
Ectini | eventuell der Flussname Tinée | 43°55'0.23"N ; 7°11'14.69"E |
Vergunni | der Gemeindename Vergons (Dép. Alpes-de-Haute-Provence) | 43°19'23.90"N ; 6°17'3.20"E |
Im Gefolge der Eroberung richten die Römer im geographischen Anschluss an die Gallia Cisalpina Provinzen ein, die entweder in den Alpen selbst angesiedelt sind (Alpes Maritimae, Nr. 3 auf der folgenden Skizze; Alpes Cottidae, Nr. 2 auf der Skizze; Alpes Poeniae auch: Alpes Graiae, Nr. 1 auf der Skizze) oder aber die Alpen nach Norden überschreiten Raetia, Noricum):
Römische Alpenprovinzen (Ausschnitt aus dieser Quelle)
Die römische Provinzeinteilung im alpinen Raum ist im einzelnen nicht leicht zu beurteilen; insbesondere fällt es schwer, sie direkt auf sprachlich-ethnische Verhältnisse abzubilden. Das größte Rätsel bilden die Raetii 'Räter', d.h. die Namensgeber einer der beiden großen Provinzen im Alpenraum. Über sie konnte sehr wenig und allenfalls Archäologisches in Erfahrung gebracht werden, abgesehen von der kaum bezweifelbaren, allgemeinen Forschungsmeinung, dass es sich nicht um Indogermanen handelte (vgl. dazu Jürg Rageth im HLS). Es ist fraglich, ob sie mit den Etruskern identifiziert werden können; für eine Verbindung sprechen die alpinen Inschriften im etruskischen Alphabet. Allerdings decken sich die Fundorte gerade nicht mit den Provinzgrenzen. Überhaupt deckt sich das Territorium der Raetia höchstwahrscheintlich nicht mit dem Wohngebiet der Räter und auch die spätere Teilung in eine Raetia prima mit der Hauptstadt Curia (heute: Chur) und eine Raetia secunda mit der Hauptstadt Augusta Vindelicorum (heute: Augsburg), ist in dieser Hinsicht keineswegs eindeutig. Die Funde der letzten vorchristlichen Jahrhunderte aus Chur "scheinen eher einem kelt. als einem rät. Kulturkreis nahe zu stehen" (Jürg Rageth im HLS) und die auf dem Tropaeum Alpium erwähnten Vindeliker werden von der Forschung einhellig als Kelten beschrieben; man beachte auch die Kontinuität des Provinznamens Raetia in Gestalt des heutigen Landschaftsnamens Ries (vgl. die Karte zu den römischen Inschriften in dieser Gegend nordwestlich von Augsburg).
In jedem Fall darf man davon ausgehen, dass der nordalpine Raum intensiver romanisiert war als die eigentliche Gebirgszone; es liegt daher nahe, in spätrömischer Zeit von einer stärkeren Ähnlichkeit zwischen dem nord- und südalpinen Alpenvorland auszugehen, als zwischen den Alpen'vorländern' und der Gebirgszone. Eine große, kaum geklärte Frage betrifft die Fortdauer der vorrömischen Sprachen nach der Eingliederung des Gebiets in das Imperium Romanum. Es ist ja grundsätzlich denkbar, dass die germanischen und slawischen Einwanderer oder Invasoren nicht nur auf ein lateinisch-/romanischsprechende Bevölkerung, sondern womöglich auch noch auf Kelten trafen. In diesem Fall, dessen Wahrscheinlichkeit schwer einzuschätzen ist, hätten sprachliche Elemente unmittelbar aus vorrömischen Sprachen (jedenfalls aus dem Keltischen) ins Germanische und Slawische entlehnt werden können. In der Regel muss man jedoch davon ausgehen, dass alles Vorrömische in romanisierter Gestalt, d.h. als romanische Form an die nachrömischen Strata vermittelt wurde.
Zur unterschiedlich starken, womöglich speziell inneralpin schwächeren Romanisierung sind die archäologischen Erkenntnisse über die Lepontier aufschlussreich:
"Als Folge der röm. Expansion in der Poebene kamen die L. ab dem 2. Jh. v.Chr. schrittweise mit römisch geprägten Sitten und Gebräuchen in Kontakt und sie übernahmen erneut – in einem radikal veränderten hist. Umfeld – die Rolle von Mittlern zwischen der Nord- und der Südseite der Alpen. Mit den Feldzügen des Augustus (35-15 v.Chr.), deren Ziel die Unterwerfung der Alpenvölker zur Sicherung der Handelswege und des militär. Durchgangs durch die Alpen war, wurden die L. ins röm. Verwaltungs- und Wirtschaftssystem integriert. Trotz tiefgreifender Akkulturationsprozesse überlebten einige traditionelle Elemente der L., besonders bei der weibl. Bekleidung und den Bestattungsriten, bis ins 2.-3. Jh. n.Chr." (Gianluca Vietti im HLS)
In jedem Fall ist es zum Verständnis möglicher Sprachkontaktszenarien sinnvoll, georeferenzierbare historische Daten in die Datenbank mit aufzunehmen, also zum Beispiel archäologische Funde, das spätantike Straßenverzeichnis der so genannten Tabula Peutingeriana (Link_1, Link_2), die römischen Alpenpässe, die römische Epigraphik usw. So zeigt diese Karte einerseits, dass die früh im bairischen Raum gegründeten Klöster und die ersten germanischen Funde sich offenkundig an romanische Infrastruktur anlagern, die sich in Gestalt von Inschriften, antiken Ortsnamen und der frühmittelalterlichen Bezeichnung anwesender Romanen (Walchen) manifestiert. Andererseits ist in eben diesen Verdichtungsgebieten gleichzeitig mit mutmaßlich frühen Entlehnungen zu rechnen, wie caseareus, -a zeigt.
(auct. Thomas Krefeld)
Tags: Linguistik
Stratigraphie und Onomasiologie
Das spricht in unmissverständlicher Weise dafür, dass die entsprechenden grundlegenden Kulturtechniken im Alpenraum sehr alt sind und an jeweils hinzukommende Ethnien und ihre Sprachen weitergegeben wurden. Aber es wäre natürlich zu einfach, bestimmte onomasiologische Teilbereiche zur Gänze mit bestimmten sprachlichen 'Schichten' zu verknüpfen. Es ist vielmehr bemerkenswert, dass gerade auch Entlehnungen in entgegengesetzter Richtung belegt sind und daher dauerhafter gegenseitige kultureller Austausch anzunehmen ist. Charakteristisch sind die komplementären Bezeichnungstypen für das Konzept BUTTER. Während sich im Bairischen der romanische Typus Butter durchgesetzt hat, ist der deutsche Typ Schmalz in einem Teil der romanischen Mundarten etabliert: Vgl. die synoptische Karte der Basistypen butyrum und Schmalz.
Es scheint also, als ob sich das Auslassen, d. h. das Schmelzen (daher Schmalz) der Butter als elementare Konservierungstechnik ausgehend vom deutschsprachigen Gebiet nach Süden verbreitet hätte.
Ein vergleichbares Bild geben die Bezeichnungstypen lat. stabulu(m) und deu. Stall für einfache Almgebäude: Vgl. die synoptische Karte zu den Basistypen lat. stabulu(m) und deu. Stall.
(auct. Thomas Krefeld)
Tags: Linguistik
Stratigraphie: Romanismen
(1) Exklusiv dialektale Romanismen
-
Diese Kategorie, zu der die lokalen Varianten ohne Entsprechungen in der Standardsprache gehören, bildet gewissermaßen die prototypischen romanischen Entlehnungen des Alpenraums; es handelt sich in aller Regel um Substratwörter, d.h. um solche Ausdrücke, die in der Zeit der romanisch-germanischen bzw. romanische-slawischen Zweitsprachigkeit entlehnt wurden und den späteren Sprachwechsel zur germanischen bzw. slawischen Einsprachigkeit grosso modo ortsfest als Relikte überdauert haben. Ein eindeutiges Beispiel liefert der morpho-lexikalische Typ Käser, der so wie sein romanisches Äquivalent casera auf den Basistyp lat. caseu(m) zurückgeht: Vgl. die Karte zum morpho-lexikalischen Typ casera.
(2) Dialektale Romanismen mit Entsprechungen in der Standsprache und in den romanischen Dialekten des Untersuchungsgebiets
- Da auch bei dieser Gruppe sowie im Falle von (1) eine areale Verbreitung gegeben ist, die die aktuellen Grenzen der Sprachfamilien überschreitet, liegt es nahe, die standardsprachlichen Varianten auf die dialektalen Formen zurückzuführen. Diese Kategorie der Romanismen kann daher auch über den Alpenraum hinaus sprachgeschichtliches Interesse beanspruchen. Ein eindeutiges, in der Etymologie des Standarddeutschen verkanntes Beispiel liefert deu. Butter.
Dieses Muster der primären süddeutschen Entlehnung und ihrer sekundären Verbreitung ins Standardeutsche scheint jedoch nicht immer eindeutig, da auch die Möglichkeit der umgekehrten Verbreitungsrichtung aus dem Standard in die Dialekte des Untersuchungsgebiets in Betracht gezogen werden muss. So könnte man eventuell die deutschen Entsprechungen des Basistyps lat. cellārium sehen.
Sowohl im Fall der exklusiv dialektalen wie der dialektal-standardsprachlichen Romanismen sind im Einzelnen substratale lokale Relikte und adstratale Entlehnungen mit sekundärer arealer Verbreitung zu unterscheiden.
(auct. Thomas Krefeld)
Tags: Linguistik
Synoptische Karte
(auct. Thomas Krefeld)
Tags: Webseite
Tabula Peutingeriana

Ausschnitt aus der Tabula Peutingeriana (in der Mitte Apulien und Kalabrien, dazwischen der Golf von Tarent, unterhalb von Kalabrien Sizilien)
Die Abdeckung der Karte geht nach Osten hin über die Grenze des römischen Reiches hinaus und reicht bis an die Ostküste Indiens, wobei das in diesem Bereich abgebildete Orts- und Straßennetz verglichen mit dem Gebiet des römischen Reichs stark ausgedünnt ist. Die Teile der Karte, auf der die britische Hauptinsel, die iberische Halbinsel sowie der Bereich der nordafrikanischen Küste westlich von Algier abgebildet waren, sind heute verloren (die dortigen Ortschaften und Straßenverläufe wurden z.T. jedoch aus den Angaben im sog. Itinerarium Antonini ergänzt, einem Itinerar aus dem 3. Jh., das allerdings nicht in Kartenform, sondern in Gestalt einer bloßen Routenliste samt Entfernungsangaben vorliegt (lateinischer Originaltext). Die Darstellung der Karte ist weder winkel- noch maßstabsgetreu und insofern nicht mit modernen Karten vergleichbar. Wenigstens ansatzweise entspricht die Abbildung der Küstenverläufe jedoch durchaus den realen Verhältnissen. Ein Beispiel hierfür ist die Darstellung Unteritaliens, die eindeutig Stiefelabsatz und -spitze sowie den dazwischen liegenden Golf von Tarent erkennen lässt. Auf der T.P. sind neben Landflächen und Meeren auch Flußläufe und Gebirgszüge eingetragen. Der vordergründige Informationsgehalt der Karte besteht in der ungefähren Lokalisierung und Benennung von Ortschaften sowie den zwischen den Ortschaften bestehenden Straßenverbindungen (Seewege sind nicht kartiert). Die Markierung von Ortschaften geschieht in unterschiedlicher Weise in Abhängigkeit von deren Größe und Bedeutung. Während vergleichsweise bedeutende Orte durch schematische Darstellungen von größeren oder kleineren Bauwerken angezeigt werden, sind unbedeutende Siedlungen nur durch einen "Knick" innerhalb eines Straßenverlaufs markiert. Grundsätzlich gibt die Karte die Distanz zwischen zwei mit einer Straße verbundenen Ortschaften in römischen Meilen an. Die von der Karte gegebenen Informationen weisen z. T. Inkonsistenzen auf. So ist einerseits das i. J. 79 zerstörte Pompeji verzeichnet, andererseits findet sich der Name Constantinopolis, der der Stadt Byzantion erst im Jahr 337 verliehen worden ist. Diese Inkonsistenz mag darauf hindeuten, dass die T.P. entweder direkt oder mittelbar auf unterschiedlichen Quellen basiert.
Es ist umstritten, welcher Art die antiken Vorlagen gewesen sind, auf die die T.P. rekurriert. Insbesondere ist unklar, ob es eine antike kartographische, in ihrer Erscheinungsform mit der T.P. vergleichbare, Vorlage gegeben hat, an der sich die T.P. orientierte. Diese Frage berührt die viel grundsätzlichere Thematik, ob es in der Antike überhaupt "Landkarten" im modernen Sinn gegeben hat, wobei hier differenziert werden muss. Tatsächlich erhalten sind Kataster- und Stadtpläne. Ein prominentes Beispiel ist die sog. Forma Urbis, ein Plan der Stadt Rom, der unter Kaiser Septimius Severus zu Beginn des 3. Jhs. angefertigt wurde. Der Plan, der auch detaillierte Grundrisse von Gebäuden präsentiert, war auf insgesamt 150 Marmorplatten aufgetragen, die an einer Innenwand des Templum Pacis in Rom angebracht wurden. Zahlreiche Fragmente dieses Plans sind erhalten. Ein weiteres Beispiel antiker "Kartographie" sind die sog. Katasterpläne von Orange. Dabei handelt es sich um insgesamt drei unterschiedliche Pläne, die die Landaufteilung in der Umgebung der römischen Kolonie Arausio (= Orange) in der Provence dokumentieren und deren Entstehung in das letzte Viertel des 1. Jhs. datiert wird (Kaiser Vespasian). Fragmente auch dieser Pläne sind bis heute erhalten (Musée d'Art et d'Histoire in Orange).
Bei der Forma Urbis wie auch bei den Katasterplänen von Orange handelt es sich um Kartierungen einzelner "Siedlungsplätze" im weitesten Sinn. Kartographische Werke, die die übergeordnete Dimension, also die Verortung von Siedlungsplätzen in ihrem lokalen Verhältnis zueinander, abzubilden versuchen, sind realiter nicht aus der Antike auf uns gekommen. Es gibt lediglich eine Reihe von literarischen Nachrichten aus der Antike, die als Hinweise auf die Existenz solcher Kartenwerke interpretiert werden können, was im Einzelfall jedoch sehr umstritten ist. Reisende in der Antike bedienten sich zur Orientierung für gewöhnlich wohl sog. Itinerare, Listen, die die Namen der Ortschaften nannten, die auf einer Reise von einem Punkt A zu einem Punkt B nacheinander anzusteuern waren, und die außerdem die Distanzen zwischen den Orten angaben. Im wesentlichen sind dies die Informationen, die auch aus der T.P. abzulesen sind. Dies lässt an die Möglichkeit denken, dass die T.P. unter Umständen nichts anderes ist als eine nachträgliche, rein mittelalterliche Visualisierungsform eines oder mehrerer solcher antiker Itinerare.

Abschrift eines Itinerars, das auf einen bei der toskanischen Ortschaft Vicarello gefundenen Silberbecher (einer von insgesamt vier nahezu identischen) geschrieben ist und das die Route von Gades/Cadiz nach Rom beschreibt (Itinerarium Gaditanum)
Für VerbaAlpina ist zunächst das toponomastische Repertoire von Interesse, das durch die Karte überliefert wird, da es Einblicke in historische Gegebenheiten und Prozesse erlaubt, die vor allem für die Substratforschung von Bedeutung sind (s. z.B. T. Krefeld, Wortgeschichte und Toponymie: zur Familie von ‚Salles‘, ‚Sala‘ und Verwandtem, in: VerbaAlpina 18/1, https://www.verba-alpina.gwi.uni-muenchen.de/?p=2064&db=181). Die durch die T.P. dokumentierten in der Antike benutzten Verkehrsrouten durch die Alpen können wiederum Aufschluss über die möglichen Verbreitungswege sprachlicher Phänomene geben.
Die auf der T.P. verzeichneten Routen durch die Alpen sind eindeutig hauptsächlich auf deren Überquerung ausgerichtet. Rein inneralpine, gleichsam quer zu den großen Transitrouten verlaufende Kommunikationswege, die etwa gezielt verschiedene Talschaften miteinander verbinden würden, sind nicht kartiert. Aufs Ganze gesehen kann man das auf der T.P. abgebildete Straßensystem im Alpenraum in einen West- und in einen Ostteil gliedern. Die Straßen südlich des Genfer Sees verbinden im Wesentlichen Italien mit den gallischen Provinzen, vor allem der Gallia Narbonensis. Die eingezeichneten Verkehrswege des Ostteils führen von Italien aus in die Provinzen Raetia und Noricum. Unter den Straßen des Westteils befindet sich auch eine der ältesten römischen Straßen im Alpenraum: Die Via Domitia, die zwischen 122 und 118 v. Chr. vom Prokonsul Gnaeus Domitius Ahenobarbus zur Anbindung der neu eingerichteten Provinz Gallia Transalpina (später: Narbonensis) angelegt worden war. Sie führte von der Poebene durch die Val di Susa (Segusio) über den Col de Montgenèvre (1850 m) hinüber nach Briançon und von dort weiter über Gap nach Narbonne (Narbo). Erst gut 100 Jahre nach der Erbauung der Via Domitia wurde von Augustus die Via Iulia Augusta angelegt, die die Seealpen in unmittelbarer Meeresnähe überwindet und an deren höchstem Punkt (512 m) das Tropaeum Alpium steht. Neben diesen beiden Straßen mit prominenter Benennung verzeichnet die T.P. in den Westalpen weitere zwar namenlose, zweifellos jedoch auch bedeutende und stark frequentierte Routen. Eine davon führte durch das Aostatal und schließlich, nach der Gabelung bei Aosta, über den Großen Sankt Bernhard (2469 m) hinüber in das Wallis und schließlich zum Genfer See bzw. über den Kleinen Sankt Bernhard (2188 m) und in der Folge über Albertville und Chambery nach Vienne im Rhonetal. Abzweigungen von der Via Domitia führten nach Vienne und Valence. Es fällt auf, dass der Abstand zwischen den einzelnen Etappenorten im Bereich der Westalpen im Schnitt markant geringer ist als bei den auf der T.P. verzeichneten Streckenverläufen in den Ostalpen.
In den Ostalpen verzeichnet die T.P. im Wesentlichen vier Übergänge von Italien nach Raetien bzw. Noricum. Am weitesten im Westen liegt die Route, die Mailand (Mediolanum) mit Bregenz (Brigantium) und schließlich Augsburg (Augusta Vindelicum) verband. Sie führte von Como über Chiavenna und den Splügenpass (2114 m) nach Chur (Curia) und folgte dann dem Rheintal bis zum Bodensee. Weiter im Osten ist der Verlauf der Via Raetia eingetragen, die Verona über den Brenner mit Augsburg verband. Im südlichen Abschnitt, von Verona bis Bozen (Pontedrusi), folgte sie dabei der Trasse der Via Claudia Augusta, jener Straße, die bereits unter Augustus angelegt und später von Kaiser Claudius ausgebaut worden war. Anders als diese, die von Bozen durch das Vinschgau und dann über den Reschen- (1504 m) und den Fernpass (1216 m) Richtung Augsburg führte, folgte die Via Raetia dem Lauf des Eisack bis zum Brenner (1370 m) hinauf und führte von dort weiter über den Seefelder Sattel (1185 m) und Partenkirchen dorthin. Die Via Raetia war erst von Kaiser Septimius Severus (193-211) angelegt worden und verkürzte die Strecke von Verona bis Augsburg um rund 70 Kilometer. Besondere Hindernisse, die dem Ausbau dieser Route zunächst entgegenstanden, waren die Eisackschlucht zwischen Bozen und Klausen (Sublabione) sowie die Sillschlucht bei Innsbruck. Noch weiter im Osten verzeichnet die T.P. je eine Straßenverbindung von Viruno, dem heutigen Maria Saal wenig nördlich von Klagenfurt, über den Radstädter Tauernpass (1738 m) nach Salzburg (Iuvavo) bzw. über die Triebener Tauern (1274 m) nach Liezen (Stiriate) und von dort weiter nach Wels (Ovilia = Colonia Aurelia Antoniana Ovilabis).
Die auf der T.P. im Alpenraum verzeichneten Straßenverbindungen repräsentieren bei weitem nicht alle in der römischen Antike genutzten Verkehrswege in dieser Region. Als Beispiel sei hier nur die Römerstraße genannt, die über den Iulierpass (römischer Meilenstein auf der Passhöhe) führend das Oberengadin mit Chur im Rheintal verband.
Einige wenige der von der T.P. im Alpenraum verzeichneten Ortschaften sind in ihrer Bedeutung durch die Verwendung eines besonderen Symbols in Hausform hervorgehoben. Innerhalb des Perimeters der Alpenkonvention sind dies im Bereich der Westalpen Riez (Reis Apollinaris = Colonia Iulia Augusta Apollinarium Reiorum) und Aosta (Augusta Pretoria = Colonia Augusta Praetoria), in den Ostalpen Bregenz (Brigantio), Trient/Trento (Tredente), Maria Saal (Viruno = Claudium Virunum, von Kaiser Claudius als Hauptstadt der Provinz Noricum gegründet, Nachfolger der Siedlung auf dem Magdalensberg) sowie Salzburg (Iuvavo = Iuvavum).
Seit 2017 läuft an der Katholischen Universität Eichstätt das von der DFG geförderte Forschungsprojekt "Kommentar zur Tabula Peutingeriana" (GEPRIS), dessen Ziel eine ausführliche detaillierte Kommentierung der T.P. ist. Im Rahmen dieses Projekts wurde u. a. eine online konsultierbare Datenbank (https://tp-online.ku.de/) der auf der Karte verzeichneten Toponyme entwickelt.
Die auf der interaktiven Karte von VerbaAlpina gegebene georeferenzierte Präsentation der Daten von der T.P. basiert auf der entsprechenden Vorarbeit von René Voorburg (https://omnesviae.org/), der die Nachnutzung seiner Arbeit ausdrücklich gestattet, wofür ihm hier gedankt sei.
Lit.:
- Brodersen 1995, S. 186f. (T.P. als "Umsetzung von Itinerar-Texten in eine Graphik")
- Fellmeth, Ulrich, “Tabula Peutingeriana”, in: Der Neue Pauly, Herausgegeben von: Hubert Cancik, Helmuth Schneider (Antike), Manfred Landfester (Rezeptions- und Wissenschaftsgeschichte). Consulted online on 27 November 2018
http://dx.doi.org.emedien.ub.uni-muenchen.de/10.1163/1574-9347_dnp_e1128120> First published online: 2006; - Rathmann 2016
(auct. Stephan Lücke)
Tags: Außersprachlicher Kontext
Technologie
Soweit möglich und sinnvoll, werden sämtliche von VerbaAlpina entwickelten Wordpress-Funktionalitäten als sog. Plugins realisiert, die anschließend auf der weithin bekannten und innerhalb der Entwickler-Community fest etablierten Plattform "Github" abgelegt werden (https://github.com/VerbaAlpina/). Sie können von dort uneingeschränkt heruntergeladen und nachgenutzt werden. Die Verwendung der Plugins erfolgt im Rahmen der CC BY-SA 4.0- Lizenz, wobei an geeigneter und allgemein zugänglicher Stelle der Vermerk "Technology licensed under the CC BY-SA 4.0 license (Author: VerbaAlpina)" (inklusive Verlinkung) anzubringen ist. Die auf Github angezeigte Unterscheidung zwischen PHP- und Javascript-Plugins ist artifiziell und wurde vom Github-System automatisch eingetragen. Die meisten der von VerbaAlpina entwickelten Plugins enthalten grundsätzlich neben PHP-Code immer auch gewisse Anteile an Javascript-Code. Derzeit (November 2018) stehen auf der Github-Seite von VerbaAlpina die Plugins "TranscriptionTool-Plugin", "Interactive-Map_Plugin", "Verba-Alpina-Plugin" zur Verfügung. Zusätzlich kann von dort auch das "Verba-Alpina-Theme" heruntergeladen werden, das hauptsächlich für das Design des Frontends verantwortlich ist. Es ist vorgesehen, noch weitere von VerbaAlpina entwickelte Funktionserweiterungen in Form von Plugins auf Github zum Download anzubieten. Bei Verwendung der jeweiligen Komponenten
Liste der wichtigsten bislang von VerbaAlpina entwickelten Funktionserweiterungen:
- Interaktive Online-Karte (vielschichtige Visualisierung von Datenanalysen)
- Transkriptionstool (für die Transkription hauptsächlich von Sprachatlanten)
- Typisierungstool (Kategorisierung von erfasstem Sprachmaterial und Zuweisung zu Typen)
- Konzeptbaum (Verwaltung der hierarchischen Struktur der außersprachlichen Konzeptwelt)
- CS-Tool ("Crowdsourcing"-Tool; Erhebung von Sprachmaterial über das Internet zur Abrundung und Ergänzung des Datenmaterials)
- SQLtoHTML (direkte Einbindung der Ergebnisse von SQL-Abfragen in Wordpressbeiträge)
Neben diesen komplexen Tools, die sehr wahrscheinlich auch für Anwender jenseits von VerbaAlpina von Nutzen sein können, erfolgte die Entwicklung von zahlreichen Funktionalitäten im Detail, deren Umformung in modular verwendbare Plugins nicht sinnvoll erscheint, da sie entweder zu geringfügig oder zu spezifisch zugeschnitten auf die Erfordernisse von VerbaAlpina erscheinen. Zugänglich ist jedoch auch diese Kategorie von Entwicklungen, zumal neben den erwähnten Plugins auch der komplette Softwarecode von VerbaAlpina auf Github abgelegt wird.
Das an die Wordpress-Umgebung angebundene Backend besteht, wie gesagt, aus mehreren MySQL-Datenbanken. Die Datenbank va_wp basiert auf dem Standard-Modell einer MySQL-Datenbank, wie sie üblicherweise als Backend von Wordpress-Installationen Verwendung finden. Über diese Datenbank werden hauptsächlich die "generischen" Funktionalitäten einer Wordpress-Installation wie z.B. die Benutzerverwaltung abgewickelt. Der zentrale fachwissenschaftliche Datenbestand von VerbaAlpina wie etwa Transkriptionen (Tabelle `tokens`), Typisierungen im weitesten Sinn (`morph_typen`, `basistypen`, `etyma`, `lemmata`), Konzepte (`konzepte`), Methodologie-Einträge (`glossar`), Beiträge des Lexikon alpinum (`im_comments`) oder auch die Bibliographie (`bibliographie`) befindet sich in der Datenbank va_xxx. Das Suffix "xxx" bezeichnet dabei die jeweilige Arbeitsversion von VerbaAlpina, deren Datenbestand durch den laufenden Betrieb ständigen Änderungen unterliegt. Bei der Erzeugung einer VerbaAlpina-Version wird jeweils eine dann stabile Kopie dieser Datenbank erzeugt, deren Name die entsprechende Versions-Nummer als Suffix erhält (z.B. va_181). Außerdem existiert für eine Reihe von Kooperationspartnern von VerbaAlpina jeweils eine MySQL-Datenbank. Die Namen dieser Datenbanken weisen jeweils das Praefix "pva_" (= "Partner von VerbaAlpina") auf, es folgt das Kürzel des Partnerprojekts (z.B. pva_ald-i).
Die von VerbaAlpina in der Mediathek (Modul VA_MT) der Wordpressinstallation gesammelten Mediendateien (Bilder, Videos, Tonaufnahmen) werden, wie bei Wordpress-Installationen üblich, im Filesystem des Webservers gespeichert.
Alle technologischen Instanzen von VerbaAlpina, also die Wordpress-Installation wie auch die Datenbanken, nutzen die IT-Infrastruktur der IT-Gruppe Geisteswissenschaften der LMU. Diese Institution betreibt ein professionelles IT-Management mit hochverfügbaren Web- und Datenbankservern und greift dabei auch auf Dienste des Leibniz-Rechenzentrums der Bayerischen Akademie der Wissenschaften zurück. Der Bestand der ITG ist mit derzeit insgesamt sieben unbefristeten Personalstellen langfristig gesichert. Ein Teil des Personals widmet sich ausschließlich dem Betrieb sowie der Wartung und Pflege von Server-Hard- und -Software.
Sämtliche Softwareentwicklungen wurden von den Informatikern David Englmeier (wiss. Mitarbeiter; seit Oktober 2016), Filip Hristov (Hilfskraft; seit September 2016) und Florian Zacherl (wiss. Mitarbeiter; seit Oktober 2014) geleistet.
(auct. Stephan Lücke)
Tags: Informationstechnologie
Transkription
(1) Inputversion in der Originaltranskription
Im VA-Portal werden Quellen zusammengeführt, die aus unterschiedlichen Fachtraditionen stammen (Romanistik, Germanistik, Slavistik) und die historisch unterschiedliche Phasen der dialektologischen Forschung repräsentieren; manche Wörterbuchdaten wurden zu Beginn des letzten Jahrhunderts (GPSR) und andere erst vor wenigen Jahren (ALD) erhoben. Deshalb ist es wissenschaftsgeschichtlich notwendig, die Originaltranskription weitestgehend zu respektieren. Aus technischen Gründen ist es allerdings unmöglich, bestimmte Konventionen unverändert zu erhalten; das gilt insbesondere für die vertikale Kombination von Basiszeichen (‘Buchstaben’) und diakritischen Zeichen, also etwa dann, wenn ein Betonungsakzent über einem Längenzeichen über einem Vokal über einem Schließungszeichen positioniert ist (Betacode). Diese Konventionen werden in jeweils definierten technischen Transkriptionen in lineare Folgen von Zeichen überführt, wobei ausschließlich ASCII-Zeichen benutzt werden (so genannter Betacode). Bis zu einem gewissen Grad können bei der Beta-Kodierung intuitiv verständliche graphische Ähnlichkeiten zwischen den Originaldiakritika und den ASCII-Entsprechungen ausgenützt werden; sie sind mnemotechnisch günstig.
Eine vollständige Liste der Regeln für die Originaltranskription findet sich unter Transkriptionsregeln.
(2) Outputversion in IPA
Im Sinne der Vergleichbarkeit und auch der Nutzerfreundlichkeit ist zudem die Ausgabe in einer einheitlichen Transkription wünschenswert. Alle Beta-Codes werden daher mit spezifischen Ersetzungsroutinen in IPA-Zeichen überführt. Einige wenige, aber unvermeidbare Unverträglichkeiten ergeben sich vor allem dann, wenn einem, durch Diakritika spezifizierten Basiszeichen in der Inputtranskription in IPA zwei unterschiedliche Basiszeichen entsprechen. Das gilt vor allem im Hinblick auf die Öffnungsgrade der Vokale, wo z. B. in der palatalen Reihe die beiden Basiszeichen <i> und <e> in Verbindung mit Schließungspunkt und einem oder zwei Öffnungshäkchen es erlauben, sechs Öffnungsgrade abzubilden; in Beta-Kodierung sind das: i – i( – i((– e?-- e – e(– e((. Dafür stehen in IPA nur vier Basiszeichen i – ɪ – e – ɛ zur Verfügung.
(auct. Thomas Krefeld)
Tags: Linguistik Informationstechnologie
Transkriptionsregeln
Basiszeichen befinden sich auf der Grundlinie. Alle Zeichen, die sich nicht auf der Grundlinie befinden, werden als Diakritika betrachtet. Als Diakritika im weiteren Sinne werden auch rein typographische Variationen eines Basiszeichens behandelt, z.B. wenn das Basiszeichen kleiner dargestellt wird als die anderen.
Basiszeichen
Basiszeichen, die in der ASCII-Tabelle vorhanden sind, werden beibehalten (= alle lateinischen Buchstaben; nicht deutsche Umlaute!). Alle anderen Basiszeichen werden durch eine Kombination von einem Buchstaben und einer Ziffer transkribiert (siehe Tabelle).
Diakritika
Diakritika werden grundsätzlich hinter das Basiszeichen gesetzt, dem sie zugeordnet sind. Bei mehreren Diakritika auf einem Basiszeichen muss die folgende Reihenfolge eingehalten werden.
-
Zunächst werden Diakritika notiert, die eine typographische Variation eines Basiszeichens markieren, z.B. wenn das Basiszeichen höher oder tiefer gesetzt wird. Diese Diakritika werden in der Tabelle gelb dargestellt.
-
Danach folgen Diakritika unter und über dem Basiszeichen in der Reihenfolge von unten nach oben. Insbesondere müssen die Diakritika unter einem Basiszeichen (grün markiert) immer vor denen über einem Basiszeichen (blau markiert) kommen.
-
Als letztes werden Diakritika notiert, die nach dem Basiszeichen kommen, z.B. ein Längenzeichen oder ein Apostroph nach einem Basiszeichen. Diese sind in der Tabelle orange markiert.
Jedes Zeichen, das für die Transkription eines Diakritikums verwendet wird, darf pro Basiszeichen nur einmal vorkommen. Für die Wiederholung des selben Diakritikums gibt es eigene Regeln, z.B. : für zwei Punkte über einem Basiszeichen oder \2 für einen doppelten Gravis.
Wenn sich ein Diakritikum auf zwei oder mehr Zeichen bezieht z.B. a͠e werden die Basiszeichen in eckige Klammern gesetzt, in diesem Fall [ae]~.
Klammern und Kommentare
Kommentare (ob eingeklammert oder nicht) werden nach dem Beleg, auf den sich sich beziehen, in spitze Klammern gesetzt, z.B: (m.) → <m.>. Wenn der gesamte Beleg eingeklammert ist, wird der Beleg ohne Klammern transkribiert und in spitzen Klammern die Bemerkung "eingeklammert" hinzugefügt.Trennzeichen
Eventuelle morphosyntaktische Varianten eines Belegs wie z.B. Singular- und Pluralformen werden durch Kommata, verschiedene Wortformen durch Semikola getrennt. Dies entspricht der Darstellung der Belege im Atlas AIS. Wenn in der Quelle die Belege durch andere Trennzeichen (z.B. / oder -) getrennt sind, müssen diese in der Transkription entsprechend durch Kommata und Semikola ersetzt werden. Eventuelle Nummerierungen von verschiedenen Varianten werden weggelassen.
Typisierte Belege
Wenn die Quelle für einen Informanten sowohl einen Einzelbeleg als auch eine bereits typisierte Variante enthält, wird nur der Einzelbeleg transkribiert. Nur falls dies nicht möglich ist, wird die typisierte Variante transkribiert und über das entsprechende Auswahlmenü als "phon. Typ" bzw. "morph. Typ" markiert. Im Gegensatz zu Einzelbelegen sind bei Typen auch Großbuchstaben erlaubt, sonst gelten die selben Regeln für die Transkription.
Wenn für einen Informanten Einzelbelege und typisierte Belege gemischt vorkommen, müssen für die Transkription zwei verschiedene Zeilen angelegt werden, in denen die Transkripte entsprechend als Typ bzw. Beleg markiert werden.
Sonderzeichen in der Quelle
Alle Zeichen, die in der Transkription als Diakritika verwendet werden (inklusive Ziffern) müssen, wenn sie als Originalzeichen vorkommen, durch die Voranstellung von zwei Backslashes maskiert werden, z.B. * → \\*. Dies bezieht sich aber nur auf Zeichen, die in der Quelle Teil der phonetischen Transkription des Einzelbelegs sind. Bei Zeichen, die eine bestimmte Bedeutung haben, muss diese Bedeutung stattdessen als Bemerkung in spitzen Klammern hinter den Beleg geschrieben werden. Zum Beispiel steht das Zeichen † im AIS für eine veraltete Form und muss in der Transkription mit <veraltet> notiert werden. Klammern werden immer ersetzt (siehe Klammern und Kommentare und Platzhalter).
Folgende Zeichen aus dem AIS können einfach weggelassen werden: ℗, ○, P, S, +
Platzhalter
Alle Formen von Platzhaltern oder verkürzten Schreibweisen müssen durch die Zeichenfolge ersetzt werden, für die sie stehen. Wenn ein Beleg mit Kommentaren in mehrere Belege aufgeteilt wird, müssen diese wiederholt werden. Die folgende Tabelle enthält einige Beispiele:
Beleg Quelle | Transkription |
---|---|
u kā́ni; i ~ | u ka-/ni; i ka-/ni |
(Alm)hütte | Almhu:tte; Hu:tte |
(um bé̜l) pašọ́ɳ (selten) | um be(/l pas^o?/n1 |
Eine Ausnahme gibt es bei kleinen phonetischen Variationen bei bereits typisierten Belegen, so kann z.B. der morpho-lexikalische Typ "Sänn(e)hütte" als "Sa:nn\(e\)hu:tte" transkribiert werden.
Transkription nicht möglich
Bei Informanten, für die in einer Karte keine Daten eingetragen sind, wird der "vacat"-Button verwendet. Falls die Transkription eines Beleges problematisch ist (z.B. weil sie anhand dieser Regeln nicht möglich oder unklar ist), wird der "Problem"-Button verwendet. Die Buttons "Konzept nicht vorhanden" und "Bezeichnung nicht bekannt" werden jeweils verwendet, wenn die Sache an sich nicht bekannt ist bzw. die Sache bekannt ist, aber der Informant sie nicht benennen kann. Sollte die Quelle nur angeben, dass zwar das Wort, jedoch nicht die Bedeutung bekannt ist, dann muss dieser Beleg nicht transkribiert werden.
Konzeptzuweisung
Über das rechte Auswahlmenü wird der Äußerung ein Konzept zugeordnet. Der vorausgewählte Wert entspricht dabei immer dem Konzept, welches für diesen Stimulus bisher am häufigsten zugeordnet wurde, also im Normalfall dem "Hauptkonzept" der jeweiligen Karte. Wenn dieses nicht zutreffend ist, weil bespielsweise für einen Beleg ein spezifischeres Konzept angegeben wird, muss dieses (falls noch nicht vorhanden) neu angelegt und zugeordnet werden. Für alle Äußerungen (Ausnahme vacat, Problem etc.) muss ein entsprechendes Konzept ausgewählt sein. Das Konzept bezieht sich immer auf die vollständige Äußerung, auch dann, wenn beispielsweise mehrere Varianten durch Semikola getrennt vorkommen. Falls einzelne Varianten verschiedene Bedeutungen haben, muss für jede Variante eine eigene Zeile angelegt werden. Der Beleg "prẹẓṓr V, káłọ M" von AIS-Karte 1212 muss zum Beispiel, da die Abkürzungen "V" und "M" für verschiedene Konzepte stehen, folgendermaßen transkribiert werden:
Äußerung | Konzept |
---|---|
pre?z?o-/r | LAB, VOM KALB |
ka/l1o? | LAB, KÜNSTLICH |
Falls für eine Äußerung in der Quelle mehrere Bedeutungen angegeben werden, können im Auswahlmenü auch mehrere Konzepte ausgewählt werden.
Vorschau bei der Transkription
Beim Eingeben der Transkription wird zu Vergleichszwecken hinter dem jeweiligen Textfeld eine Vorschau angezeigt, wie der Beleg nach der Rückkonvertierung aussieht. Falls der Text "Nicht gültig" erscheint, ist der Beleg falsch transkribiert und kann so nicht eingetragen werden. Falls einzelne Zeichen rot markiert im Beta-Code erscheinen, bedeutet das, dass der Beleg zwar gültig ist, aber das Zeichen (momentan) noch nicht konvertiert werden kann. Das tritt hauptsächlich bei Zeichen auf, die in dieser Form noch nicht vorgekommen sind. Der Beleg kann in diesem Fall ganz normal eingetragen werden.
Basiszeichen
Zeichen | Beschreibung | Beta-Code | Kommentar |
---|---|---|---|
α | Griechisches Alpha | a1 | |
ɒ | Spiegelverkehrtes a | a2 | |
æ | Ligatur ae | a3 | |
β | Griechisches Beta | b1 | |
ƀ | Durchgestrichenes b | b2 | |
χ | Griechisches Chi | c1 | |
ҁ | Zeichen für Glottisverschluss | c2 | |
Durchgestrichenes c | c3 | ||
ɕ | lateinische Minuskel c mit Schleife | c4 | eng. ship |
δ | Griechisches Delta | d1 | |
đ | Durchgestrichenes d | d2 | |
ð | Eth | d3 | |
ə | Schwa | e1 | |
![]() | Haken links vom e | e2 | |
ε | Griechisches Epsilon | e3 | |
φ | Griechisches Phi | f1 | |
ƒ | Labiodentale Fortis | f2 | |
ɣ | Griechisches Gamma | g1 | |
![]() | Rechts offenes g | g2 | |
g mit unterem Strich | g3 | ||
ʔ | Glottisschlag | g4 | |
ɥ | lateinische Minuskel h gespiegelt und auf dem Kopf stehend | h1 | fra. huit |
i̷ | i mit schrägem Strich | i1 | |
ı | i ohne Punkt | i2 | |
ɨ | i mit waagrechtem Strich | i3 | |
ɪ | lateinisches Kapitälchen i | i4 | |
ɟ | lateinische Minuskel j mit Querstrich | j1 | |
ł | Durchgestrichenes l | l1 | |
![]() | l mit stark geschwungenem Strich | l2 | |
![]() | l mit zwei geschwungenen Strichen | l3 | |
λ | Lambda | l4 | |
ʎ | diagonal gespiegelte lateinische Minuskel y | l5 | ita. figli |
ɱ | lateinische Minuskel m mit Haken rechts unten | m1 | |
ɳ | Zeichen für velares „n“ (dt. kling) | n1 | |
ŋ | velare Nasale | n2 | |
ɲ | lateinische Minuskel n mit Haken links unten | n3 | wie ita. gnocchi |
œ | Ligatur oe | o1 | |
ɔ | links offenes o | o2 | |
ơ | o mit Haken am oberen rechten Rand | o3 | |
ǫ | o mit Ogonek | o4 | |
ø | o mit diagonalem Strich | o5 | |
ω | Griechisches Omega | o6 | |
π | Kreiszahl Pi | p1 | |
þ | Thorn | p2 | |
ꝗ | q mit waagrechtem Strich | q1 | |
ʀ | Großbuchstabe R auf Höhe eines Kleinbuchstaben | r1 | |
ɹ | diagonal gespiegelte lateinische Minuskel r | r2 | |
ɾ | lateinische Minuskel r ohne linke obere Serife | r3 | |
ʃ | Esh | s1 | |
![]() | s mit Schrägstrich links | s2 | |
ʂ | lateinische Minuskel s mit retroflexivem Haken links unten | s3 | |
ϑ | Griechisches Theta | t1 | |
![]() | Stärker geschwungenes u | u1 | |
ʊ | Latin small letter Upsilon | u2 | |
ʒ | Ezh | z1 | |
ʑ | lateinische Minuskel z mit Schleife | z2 | eng. vision |
Diakritika
Zeichen | Beschreibung | Beta-Code | Kommentar | Beispiel |
---|---|---|---|---|
ṣ | Punkt unter Basiszeichen | ? | s? | |
ė | Punkt über Basiszeichen | ?1 | e?1 | |
ä | Zwei Punkte über Basiszeichen | : | a: | |
ṳ | Zwei Punkte unter Basiszeichen | :1 | u:1 | |
o̜ | Nach rechts geöffnetes Häkchen unter Basiszeichen | ( | o( | |
![]() | Zwei nach rechts geöffnete Häkchen unter Basiszeichen | (1 | e(1 | |
r͗ | Nach links geöffneter Halbkreis (spiritus lenis) über Basiszeichen | ) | r) | |
o̹ | Nach links geöffneter Halbkreis unter Basiszeichen | )1 | o)1 | |
ç | Cedille | )2 | c(2 | |
ó | Akut auf Basiszeichen | / | o/ | |
ő | Doppelter Akut auf Basiszeichen | /2 | o/2 | |
à | Gravis auf Basiszeichen | </td> | a</td> | |
ȁ | Doppelter Gravis auf Basiszeichen | \2 | a\2 | |
![]() | Gravis mit Punkt am oberen Ende auf Basiszeichen | \3 | u\3 | |
ā | Waagrechter Strich über Basiszeichen | - | Minuszeichen - | a- |
ā̄ | Zwei waagrechte Striche über Basiszeichen | -2 | Minuszeichen - | a-2 |
ṉ | Waagrechter Strich unter Basiszeichen | _ | Underscore _ | n_ |
n͇ | Doppelter waagrechter Strich unter Basiszeichen | _1 | n_1 | |
ẽ | Tilde ÜBER Basiszeichen | ~ | e~ | |
![]() | Stärker geschwungene Tilde ÜBER Basiszeichen | ~1 | ||
ḛ | Tilde UNTER Basiszeichen | + | e+ | |
ă | Nach OBEN geöffneter Halbkreis ÜBER Basiszeichen | ! | a! | |
ȃ | Nach UNTEN geöffneter Halbkreis ÜBER Basiszeichen | % | a% | |
a̯ | Nach UNTEN geöffneter Halbkreis UNTER Basiszeichen | @ | a@ | |
k̮ | Nach OBEN geöffneter Halbkreis UNTER Basiszeichen | @1 | k@1 | |
ů | Kreis ÜBER Basiszeichen | | | u| | |
s̥ | Kreis UNTER Basiszeichen | & | s& | |
e̩ | Senkrechter Strich unter Basiszeichen | $ | e$ | |
ǧ | Hacek | ^ | g^ | |
ĝ | Zirkumflex | ^1 | g^1 | |
o̭ | "Zirkumflex" unter Basiszeichen | ^2 | o^2 | |
d̬ | "Hacek" unter Basiszeichen | ^3 | d^3 | |
u∞ | Unendlichkeitszeichen über Basiszeichen | " | u" | |
n͐ | "Größer-als-Zeichen" über Basiszeichen | > | n> | |
a͓ | Kreuz unter Basiszeichen | * | a* | |
a̽ | Kreuz über Basiszeichen | *1 | a*1 | |
g’ | Apostroph nach Basiszeichen | ' | auf der #-Taste | g' |
aߵ | Umgedrehter Apostroph nach Basiszeichen | '1 | auf der #-Taste | a'1 |
gˈ | Erhöhte vertikale Linie nach Basiszeichen | '2 | auf der #-Taste | g'2 |
![]() | Häkchen nach Basiszeichen | = | k= | |
c² | Ziffer hochgestellt nach Basiszeichen | \<n>0 | Ziffer mit \ maskieren und nachgestellte 0 | c\20 |
aː | IPA Längenzeichen | :2 | a:2 | |
aˑ | IPA Längenzeichen halb | :3 | a:3 | |
ᵃb | Basiszeichen oberhalb der Grundlinie | 0 | a0b | |
![]() | Basiszeichen auf der Grundlinie, kleiner als alle anderen Zeichen | 8 | n8d | |
ᵢn | Basiszeichen unterhalb der Grundlinie | 9 | i9n | |
![]() | Obere bzw. untere Diakritika eingeklammert | [<d>] | Eingeklammertes Diakritikum zwischen eckigen Klammern | u[:] bzw. e[?] |
aͦ | Basiszeichen über Basiszeichen | {<z>} | Erhöhtes Basiszeichen zwischen geschweiften Klammern | a{o} |
![]() | Basiszeichen unter Basiszeichen | {1<z>} | a{1o} |
Spezielle Zeichen
Zeichen | Beschreibung | Beta-Code | Beispiel |
---|---|---|---|
·e̜kọ́ɳ | Ein Punkt, vor oder nach dem Basiszeichen. Höher als die Grundlinie. | .1 | .1e(ko?/n1 |
Spezielle Leerzeichen
(Reguläre Leerzeichen werden in dieser Tabelle durch das Symbol ␣ dargestellt.)
Zeichen | Beschreibung | Beta-Code | Beispiel |
---|---|---|---|
w‿d | Leerzeichen mit Bogen | {␣} | w{␣}d |
(auct. Stephan Lücke | Florian Zacherl)
Tags: Informationstechnologie
Tropaeum Alpium

Rekonstruktion des Tropaeum Alpium im Museum von La Turbie. Auf dem Sockel ist die im Folgenden besprochene Inschrift erkennbar.
(Von Matthias Holländer – Selbst fotografiert, Copyrighted free use, https://commons.wikimedia.org/w/index.php?curid=37407992)
Aus Sicht von VerbaAlpina ist vor allem die monumentale (etwa 20 x 4 Meter) an dem Denkmal angebrachte Inschrift (CIL V 7817 = EDCS-05401067; Foto) von Interesse, die die Namen der damals unterworfenen Stämme auflistet. Diese Inschrift ist nur teilweise erhalten, und die Reste sind überdies in knapp 170 Fragmente zerschlagen. Der vollständige Text ist jedoch vom römischen Schriftsteller Plinius dem Älteren in dessen Naturalis Historia überliefert (Plin. NH 3, 136f.), so dass die Rekonstruktion der fragmentierten Inschrift gelingen konnte.

Die, über weite Strecken rekonstruierte, Inschrift auf dem Sockel des Tropaeum Alpium
(Foto: Stefano Costa https://www.flickr.com/photos/47912543@N00/11358571655/in/pool-1876758@N22, Lizenz: https://creativecommons.org/licenses/by-sa/2.0/)
Reflexe der in der Inschrift genannten Stammesnamen haben sich z.T. bis heute in der Benennung von Orten oder Regionen im Alpenraum erhalten, so dass auch aufgrund dessen in manchen Fällen die Lokalisierung der jeweiligen Siedlungsräume mit einiger Sicherheit angegeben werden kann. Aus Sicht der Sprachwissenschaft können dies im Hinblick auf die Substratforschung wichtige Informationen sein (vgl. Krefeld, Thomas [2018]: Geschichte des romanisch-germanischen Sprachkontakts. Vorlesung dh-lehre. Version 8 [27.08.2018, 17:03]. https://www.dh-lehre.gwi.uni-muenchen.de/?p=53255&lv=8&v=8#p:5).
Die Passage bei Plinius, in der der Text der Inschrift zitiert ist, liest sich wie folgt (Plin. a.a.O.; die Auflösung der Abkürzungen in runden Klammern stammt von mir, Buchstaben[folgen], die nur in der Inschrift am Tropaeum Alpium vorhanden sind, sind unterstrichen; die Zeilenumbrüche sind durch senkrechte Striche angegeben; die Nummerierung in Klammern hinter den Stammesnamen stammt von mir):
(136) Non alienum videtur hoc loco subicere inscriptionem e tropaeo Alpium, quae talis est:
IMP(eratori) · CAESARI DIVI FILIO AVG(usto) | · PONT(ifici) · MAX(imo) · IMP(eratori) · XIIII · TR(ribunicia) · POT(estate) · XVII | · S(enatus) · P(opulus) · Q(ue) · R(omanus) |· QVOD EIVS DVCTV AVSPICIISQVE GENTES ALPINAE OMNES QVAE A MARI SVPERO AD INFERVM PERTINEBANT SVB IMPERIVM P(opuli) · R(omani) · SVNT REDACTAE · | GENTES ALPINAE DEVICTAE TRVMPILINI (1)· CAMVNNI (2) · VENOSTES (3)· VENNONETES (4)· ISARCI (5)· BREVNI (6)· GENAVNES (7)· FOCVNATES (8) · | VINDELICORVM GENTES QVATTVOR (9)· COSVANETES (10)· RVCINATES (11)· LICATES (12)· CATENATES (13)· AMBISONTES (14)· RVGVSCI (15)· SVANETES (16)· CALVCONES (17) · | BRIXENETES (18)· LEPONTI (19)· VBERI (20)· NANTVATES (21)· SEDVNI (22)· VARAGRI (23)· SALASSI (24)· ACITAVONES (25)· MEDVLLI (26)· VCENNI (27)· CATVRIGES (28)· BRIGIANI (29)· | SOGIONTI (30)· BRODIONTI (31)· NEMALONI (32)· EDENATES (33)· VESVBIANI (34)· VEAMINI (35)· GALLITAE (36)· TRIVLLATI (37)· ECDINI (38)· | VERGVNNI (39)· EGVI (40)· TVRI (41)· NEMATVRI (42)· ORATELLI (43)· NERVSI (44)· VELAVNI (45)· SVETRI (46).
(138) Non sunt adiectae Cottianae civitates XV, quae non fuerant hostiles, item adtributae municipiis lege Pompeia.
(ed. C. Mayhoff, Stuttgart [Teubner] 1906; Text der Edition Loeb [zugangsbeschränkt])
Übersetzung:
Es erscheint nicht abwegig, an dieser Stelle die Inschrift vom Tropaeum Alpium anzufügen, die folgendermaßen lautet:
Dem Imperator Caesar, Sohn des Göttlichen, Augustus, Pontifex Maximus, als er 14 Mal die imperatorische Akklamation erhalten hatte und zum 17. Mal die tribunizische Amtsgewalt ausübte, haben der Senat und das römische Volk, weil unter seiner Führung und unter seinem Oberbefehl alle Stämme in den Alpen, die sich vom oberen bis zum unteren Meer erstreckten, unter die Herrschaft des römischen Volkes gebracht worden sind, (dieses Monument errichtet). Die besiegten alpinen Stämme: [Liste der Namen].
Nicht hinzugefügt sind die 15 Gemeinden der Cottier, die nicht feindselig gewesen waren und auch (schon) durch die Lex Pompeia zu den Municipien hinzugefügt worden sind. (Übers. Stephan Lücke)
Plinius dürfte den Text der Inschrift nicht am Monument selbst, sondern vielmehr das originale Schriftstück im Archiv in Rom gesehen haben. Darauf deuten nicht zuletzt die Abweichungen hin, die zwischen dem Text der Inschrift und dem von Plinius überlieferten bestehen.
Mit dem "mare superum" ist die Adria gemeint, "mare inferum" ist das tyrrhenische Meer (s. Georges, s.v. mare; man vergleiche auch die Formulierung von Plinius [NH 3, 133]: verso deinde in Italiam pectore Alpium iuris Euganeae gentes, quarum oppida XXXIIII enumerat Cato. Die Metapher von der "Brust der Alpen" [bei den Euganei, also ungefähr dem heutigen Veneto/Friaul] versteht man gut, wenn man sich die Alpen als einen auf seiner linken Seite liegenden Riesen vorstellt, dessen in Richtung Süden blickendes Haupt am "oberen" Meer zu verorten ist. In diesem Sinn liegt das Tropaeum Alpium am "Fuß" der Alpen, und auch der Name der italienischen Region Piemonte [ich danke Thomas Krefeld für diesen Hinweis] erhält dadurch eine spezifische, bislang wohl eher selten wahrgenommene Konnotation; es ist allerdings einzuräumen, dass die Bezeichnung "Piemonte" für die heute so genannte Region in Antike und Mittelalter anscheinend unbekannt war Treccani s.v. Piemonte), die Unterwerfung betraf also Stämme fast im kompletten Alpenbogen. Ausgenommen scheint allerdings die Gegend östlich des Brenners gewesen zu sein, in der Metapher des Plinius also das "Caput Alpium". Diese Region war ein Jahr vor dem Feldzug des Drusus und Tiberius von Publius Silius Nerva niedergeworfen worden, wobei speziell Noricum keinen Widerstand geleistet hatte (s. Junkelmann, Die Legionen des Augustus, 1986, S. 63 und 70 [non vidi]; zum widerstandslosen Anschluss Noricums: Karl-Wilhelm Welwei, Römische Weltherrschaftsideologie und augusteische Germanienpolitik, Gymnasium 93, 1986, S. 118–138 [non vidi]).
Einige der genannten Stämme werden auch in antiken literarischen Quellen erwähnt und können aufgrund dessen lokalisiert werden. Im Folgenden geben die Nummern hinter den Namen die Position innerhalb der Inschrift an. Die Trumpilini (1) und die Camunni (2) seien Stämme der Euganeer, so Plinius (NH 3, 134). Plinius (ebd.) berichtet von den Leponti (19) – deren Name von Manchen angeblich vom griechischen Wort für VERLASSEN, ZURÜCKLASSEN (λείπω) hergeleitet werde, weil sie angeblich bei der Überschreitung der Alpen im Gefolge des Herakles dort zurückgeblieben seien, da ihnen die Kälte die Glieder hatte gefrieren lassen –, dass sie in der Nähe der Quelle der Rhone siedelten. Die Uberi (20) (im Text der Inschrift VIBERI) bezeichnet Plinius (a.O. 135) als einen Teil, also vermutlich Stamm, der Lepontier, was diese einerseits als Volk erscheinen lässt und damit gleichzeitig im Widerspruch zur Inschrift auf dem Tropaeum Alpium steht, wo sie als gens figurieren. Auffällig ist, dass Leponti und Uberi offenkundig in nächster Nachbarschaft zu einander siedelten und in der Inschrift des Tropaeum Alpium auch unmittelbar nach einander genannt werden. Dies reflektiert u.a. die der Anordnung innewohnende geographische Logik (s. unten). In 3,135 erwähnt Plinius auch die Vennonenses, bei denen es sich um einen Stamm der Raeter handle und die, gemeinsam mit den Sarunetes, in der Nähe der Rheinquelle siedelten. Dass sie mit den Vennonetes (4) der Inschrift zu identifizieren sind, ist jedoch sehr unwahrscheinlich, wie aus dem Folgenden ersichtlich werden wird. Von den in der Inschrift erwähnten Turi schließlich berichtet Plinius (NH 3,135), dass sie ein Stamm der Ligurer seien, demnach also bereits irgendwo im Bereich der Seealpen lebten.
Neben den Nachrichten aus antiken Quellen gibt auch die neuzeitliche Toponomastik Hinweise auf die Lage der Siedlungsgebiete der genannten Gentes. Der Name der Trumpilini (1), von denen Plinius sagt, sie seien ein Stamm der Euganeer, an die noch heute die Colli Euganei westlich von Padua erinnern, kann mit dem Namen der Val Trompia etwas westlich des Gardasees in Verbindung gebracht werden (s. Thomas Krefeld). Nördlich der Val Trompia befindet sich die Val Camonica, deren Name sich sehr wahrscheinlich von den Camunni (2) herleitet. Wiederum nördlich davon liegt das Vinschgau, italienisch Val Venosta, das man unschwer mit den Venostes (3) assoziieren kann. Die Isarci (5) passen zum Isarco, dem linken Nebenfluss der Etsch, der am Brenner entspringt. Der Brenner wiederum mag seinen Namen von den Breuni (6) bekommen haben.
Die Vindelici (9) sind wohlbekannt durch den römischen Namen für Augsburg, Augusta Vindelic(or)um. Da es hier um Bewohner der Alpen geht, wird man ihr Siedlungsgebiet also irgendwo am nördlichen Rand der Alpen unmittelbar südlich von Augsburg zu suchen haben. Es ist umstritten, ob der Eintrag VINDELICORVM GENTES QVATTVOR als Überschrift zu verstehen ist und somit die nachfolgenden vier Gentes als Vindelicer zu verstehen sind. Dafür könnte sprechen, dass eine dieser im Folgenden genannten Gentes, die Licates (12), sicher als vindelikischer Stamm angesehen wurde (Strab. 4,6,8: ἰταμώτατοι δὲ τῶν μὲν Οὐινδολικῶν ἐξητάζοντο Λικάττιοι καὶ Κλαυτηνάτιοι καὶ Οὐέννωνες, τῶν δὲ Ῥαιτῶν Ῥουκάντιοι καὶ Κωτουάντιοι [ed. Loeb [zugangsbeschränkt]). Sehr wahrscheinlich haben sie irgendwo im Lechtal (lat. Licca) gesiedelt, somit in einer Region, die man als Siedlungsgebiet der Vindelicer erwarten würde. Entsprechend wären dann auch die Cosuanetes (10), Rucinates (11) und Catenates (13) Vindelicer und in der näheren oder weiteren Umgebung des Lechtals zu suchen (eine genauere Lokalisierung ist anscheinend bislang noch nicht möglich). Eine weitere Stütze der Annahme, dass VINDELICORVM GENTES QVATTVOR als Überschrift zu verstehen ist, kann in der Analogie von GENTES ALPINAE DEVICTAE, das die Namensliste einleitet, gesehen werden. Auch dieser Passus hat offenkundig den Charakter einer Überschrift. Hinzu kommt, dass VINDELICORVM GENTES QVATTVOR ebenso wie GENTES ALPINAE DEVICTAE am Anfang einer Inschriftenzeile steht.
Brixenetes (18) ist ein anderer Name der Briganti, die ihren Namen an den der Stadt Bregenz am Bodensee weitergegeben haben (HLS, s.v. Brigantii; ich danke Thomas Krefeld für den Hinweis). Thomas Krefeld a.a.O bringt die Val Leventina mit dem Namen der Leponti in Verbindung, was sehr gut zur Nachricht des Plinius passt, diese hätten in der Nähe der Quellen der Rhone gelebt. Den Namen der Caturiges (28) schließlich erkennt Thomas Krefeld im Namen der französischen Ortschaft Chorges in der Nähe von Gap.
Auch die Siedlungsgebiete noch einer Reihe weiterer der in der Inschrift genannten Gentes lassen sich wenigstens ungefähr georeferenzieren, wobei allerdings durchaus die Gefahr von Zirkelschlüssen besteht. Trägt man diese ungefähren Lokalisierungen auf einer Karte ab und kippt diese um ca. 90 Grad nach Westen, erkennt man die der Inschrift innewohnende Logik (die Nummern beziehen sich wiederum auf die Rangfolge der Nennung in der Inschrift. Türkise Zahlen markieren Stämme, deren Lokalisierung allein auf Grundlage der geographischen Logik der Inschrift erschlossen wurde; die Verortung kann nicht wörtlich genommen werden, sondern ist absolut vage):

Ungefähre Lokalisierung der Alpenstämme auf einer um 90 Grad nach links gekippten Karte
(Kartengrundlage: Google Earth; Download der kmz-Datei)
Die unterworfenen Stämme werden, beginnend beim "oberen" Meer, der Reihe nach nach unten bis zum "unteren" Meer aufgezählt – was ja auch exakt dem Wortlaut der Inschrift entspricht: GENTES ALPINAE OMNES QVAE A MARI SVPERO AD INFERVM PERTINEBANT. Genau an der Stelle, an der die letztgenannten Stämme gelebt haben, steht symbolisch das Siegesmonument und setzt damit im übertragenen Sinn ein Ausrufezeichen unter die Liste. Der Standort ist also alles andere als zufällig und überdies auch deswegen ideal gewählt, weil er an einer sicher sehr stark frequentierten Land- und Seeroute (das Monument ist vom Meer her sehr gut zu sehen) gelegen war. Das Tropaeum Alpium lag genau am höchsten Punkt der Via Iulia Augusta, einer sehr wichtigen Straßenverbindung, die erst wenige Jahre vor der Errichtung des Siegesmonuments (im Jahr 13 v. Chr., also unmittelbar nach der siegreichen Beendigung des Feldzugs von Drusus und Tiberius im Spätsommer 15 v. Chr.) von Augustus angelegt worden war und die Italien mit der Provinz Gallia Narbonensis verband.
Wirklich irritierend ist zunächst allein die Nennung des Stammes der Ambisontes (14), da deren Siedlungsgebiet traditionell im Saalfeldener Becken und somit vollkommen außerhalb der ansonsten konsistenten Reihung von Ost nach West bzw. oben nach unten angenommen wird. Diese Lokalisierung geht anscheinend auf eine Stelle in den Geographica des Claudius Ptolemaeus (2,13,2: Κατέχουσι δὲ τὰ μὲν δυσμικώτερα τῆς ἐπαρχίας ἀπὸ ἄρκτων ἀρχομένοις Σεούακες καὶ Ἀλαυνοὶ (Ἀλανοὶ) καὶ Ἀμβισόντιοι, τὰ δὲ ἀνατολικώτερα Νωρικοὶ καὶ Ἀμβίδραυοι καὶ Ἀμβίλικοι.) zurück. Ziemlich sicher liegt hier eine fehlerhafte Identifizierung vor (bereits Theodor Mommsen, CIL III 2, p. 588, hatte vermutet, dass die bei Ptolemaeus genannten Ambisonten nicht mit denen auf dem Tropaeum Alpium identisch sind). Aufgrund der Position 14 innerhalb der Liste des Tropaeum Alpium wäre ihr Siedlungsgebiet wesentlich weiter westlich, vielleicht im Unterengadin oder dem angrenzenden österreichischen Inntal zu suchen. Hinzu kommt, dass die von Ptolemaeus genannten Ambisontes ein Stamm der Noriker gewesen sind, von denen wir wissen, dass diese sich bereits ein Jahr vor dem großen Alpenfeldzug, auf den sich das Tropaeum Alpium bezieht, im Rahmen der Kampagne des Publius Silius Nerva widerstandslos unterworfen hatten. Andere Stämme der Noriker werden in der Inschrift nicht genannt, die Ambisonten wären also der einzige in der Inschrift erwähnte Stamm der Noriker, was allein schon verdächtig wäre. Schließlich ist noch anzumerken, dass die Inschrift vom Tropaeum Alpium von "Ambisontes" spricht, bei Ptolemaios jedoch von den Ἀμβισόντιοι, in der lateinischen Entsprechung also von den Ambisontii, die Rede ist. Einander sehr ähnliche Stammesnamen sind für den Alpenraum auch anderwärts nachgewiesen (vgl. die Vennonenses und die Vennonetes [4]).
Soweit mir bekannt, sind die folgenden in der Inschrift genannten Stämme bislang noch nicht genauer lokalisiert worden: Clucones (17), Acitavones (25), Sogionti (30), Brodionti (31), Nemaloni (32), Veamini (35), Gallitae (36), Ecdini (38), Egui (40), Nematuri (42), Oratelli (43), Nerusi (44), Velauni (45), Suetri (46). Auf Basis der in der Inschrift vom Tropaeum Alpium offenbar vorliegenden geographischen Logik, lässt sich nun aber zumindest eine ungefähre Verortung dieser Stämme vornehmen. Demnach ist das Siedlungsgebiet der Clucones (17) irgendwo in Graubünden, am ehesten vielleicht im Rheintal in der Umgebung von Chur zu suchen. Die Acitavones (25) könnten irgendwo südlich des Mont Blanc im oberen Aosta- oder auch Isère-Tal gelebt haben. Sogionti (30), Brodionti (31), Nemaloni (32) wären in der Gegend südlich von Gap zu suchen, die übrigen genannten bislang nicht lokalisierten Stämme wiederum weiter südlich davon im Bereich der Seealpen.
Laut Plinius fehlen in der Inschrift diejenigen, die sich während des Feldzugs den Römern gegenüber freundschaftlich verhalten hatten. Konkret (aber eben nicht namentlich) genannt werden die 15 Stämme der Cottii (s. Georges, s.v. cottius), deren Siedlungszentrum sich im Susa-Tal (Segusio) südwestlich von Turin befand (Märtin 2017, S. 108). Die Namen von insgesamt 14 Stämmen der Cottii sind durch eine Inschrift (CIL CIL V 7231; Eintrag in der Epigraphischen Datenbank Heidelberg) auf dem Augustusbogen von Susa überliefert (aus dem Jahr 9/8 v. Chr.). Dort werden genannt: Segovii, Segusini, Belaci, Caturigi, Medulli, Tebauii, Adanatii, Savincatii, Ecdinii, Veaminii, Venisami, Iemerii, Vesubianii, Quadiatii.
Bei der von Plinius erwähnten Lex Pompeia muss es sich um die sog. Lex Pompeia de Transpadanis handeln, ein Gesetz aus dem Jahr 89 v. Chr., das vom Konsul Pompeius Strabo (dem Vater Pompeius' des Großen) eingebracht worden war (vgl. E. Weiss, RE 12,2 [1925], Sp. 2403, s.v. Lex Pompeia [1]; G. Rotondi, Leges publicae populi Romani, 1912 [Nachdruck 1962] S. 342 [non vidi]). Gegenstand des Gesetzes ist die Verleihung des latinischen Bürgerrechts an die nördlich des Flusses Po lebenden Verbündeten der Römer im Bundesgenossenkrieg (91-88) gewesen (vgl. Luraschi, Giorgio [1980]. Sui destinatari della c.d. Lex Pompeia de Transpadanis. In: Atti del II seminario romanistico Gardesano, S. 267-292. Milano [non vidi]). Insofern stellt dieses Gesetz eine Ergänzung der Lex Iulia de Civitate Latinis et Sociis Danda aus dem Jahr 90 sowie der Lex Plautia Papiria de Civitate Sociis Danda (89 v. Chr.) dar, durch die die in Italien südlich des Po lebenden Stämme bzw. Völker das latinische Bürgerrecht erhalten hatten.
Die Inschrift vom Tropaeum Alpium unterscheidet hinsichtlich der gelisteten Namen mindestens zwei unterschiedliche Status. Beim Gros der Namen handelt es sich offenkundig um "gentes", also um Stämme. Der Eintrag "Vindelicorum gentes quattuor" zeigt jedoch, dass "gentes" grundsätzlich eine Gliederung einer größeren Einheit sein konnten, die man wohl als "Volk" bezeichnen kann. Es mag sein, dass unter den civitates der Cottier, von denen Plinius spricht, im Grunde auch "gentes" zu verstehen sind. Die unterschiedliche Bezeichnung dürfte mit dem geänderten rechtlichen Status zu erklären sein, der sich aus der Verleihung des latinischen Bürgerrechts ergeben hat (civitas < civis !).
(auct. Stephan Lücke)
Tags: Außersprachlicher Kontext
Typisierung
Im Zentrum des Interesses von VerbaAlpina steht die morphologische Typisierung des gesammelten Sprachmaterials. Ein morphologischer Typ wird dabei durch Übereinstimmung der folgenden Eigenschaften definiert: Sprachfamilie – Wortart – einfaches Wort vs. affigiertes Wort – Genus – lexikalischer Basistyp. Die Nennform des morphologischen Typs schließlich orientiert sich an den korrespondierenden Lemmata ausgewählter Referenzlexika (s.u.).
Durch die Zuweisung zu einem gemeinsamen lexikalischen Basistyp wird die Zusammengehörigkeit aller vereinigten morpho-lexikalischen Typen klar – auch über Sprachgrenzen hinweg. So lassen sich die folgenden (hier nicht im Detail beschriebenen) Nomina und Verben einem einzigen Basistyp malga zuweisen: malga (ALM, HERDE), malgaro (SENN), malghese (HIRTE), immalgare (ALM BEZIEHEN), dismalgare (ALM VERLASSEN). Allerdings sagt der lexikalische Basistyp nichts über die Wortgeschichte der einzelnen morpho-lexikalischen Typen aus: Ob ein Typ mit lateinisch-romanischem Etymon, der heute im germanischen oder slowenischen Sprachgebiet belegt ist, wie z. B. slowenisch bajta 'einfaches Haus', auf altes lokales Substrat zurückgeht oder aber auf neueren romanischen Sprachkontakt, muss jeweils einzeln herausgearbeitet werden. Aus diesem Grund wird die Bezeichnung "Etymon", die sich grundsätzlich auf die unmittelbare historische Vorstufe eines Wortes bezieht, in diesem Kontext vermieden – auch wenn in vielen Fällen der lexikalische Basistyp tatsächlich auch das Etymon eines morpho-lexikalischen Typs ist. Die Basistypen, die von den Referenzwörterbüchern als unbekannt oder umstritten gekennzeichnet sind, werden durch eine zusätzliche Voranstellung eines Fragezeichens markiert, wie im Beispiel: (?) battuere. Wenn im Prozess der Typisierung die Bestimmung des Basistyps nicht möglich ist, verwendet VerbaAlpina einen unbekannten Typ, der mit einem ? markiert wird.
Die morpho-lexikalischen Typen bilden die Leitkategorie in der Verwaltung der sprachlichen Daten; sie sind den Lemmata der Lexikographie vergleichbar. Mittels der oben genannten, robusten und gut operationalisierbaren Kriterien lassen sich z.B. die vier phonetischen Typen barga, bark, margun, bargun mit der Bedeutung ALMHÜTTE, ALMSTALL auf drei morpho-lexikalische Typen reduzieren:

Die Zugehörigkeit der morpho-lexikalischen Typen zu Sprachfamilien (gem., roa., sla.) hängt von der jeweiligen Quelle ab; sie ergibt sich im Fall traditionell erhobener Atlas- oder Wörterbuchdaten automatisch über die jeweiligen Informanten und wird entsprechend in der Datenbank notiert. Zeigen einzelne Wörter in bestimmten Varietäten ein Suffix, das aber keinen Genuswechsel mit sich bringt, so wird kein gesonderter morpho-lexikalischer Typ angelegt (vgl. bar. Nom. Sg. die Wiesn vs. deu. die Wiese), da die Bündelung der Belege im Vordergrund steht. Im Fall der Daten, die VerbaAlpina selbst durch Crowdsourcing erhebt, wird die Sprach- bzw. Dialektzugehörigkeit von den Informanten behauptet und im Idealfall quantitativ bestätigt; die Anzahl von bestätigenden Informanten wird so zu einem Instrument der Datenvalidierung.
Morpho-lexikalische Typen sind auf eine Sprachfamilie beschränkt. Es stellt sich nun die Frage, durch welche Form ein morpho-lexikalischer Typ in der Suchfunktion der interaktiven Karte repräsentiert werden soll. Im Hinblick auf die germanische und slawische Sprachfamilie fällt die Antwort eher leicht, da beide jeweils nur durch eine standardisierte Einzelsprache ('Deutsch' [deu] bzw. 'Slowenisch' [slo]) vertreten sind. Die morpho-lexikalischen Typen können in Gestalt ihrer standardsprachlichen Varianten abgebildet werden, selbstverständlich unter der Bedingung, dass es im Standard Entsprechungen des Typs gibt; so können beispielsweise alle entsprechenden phonetischen Typen des Alemannischen und Bairischen, die Varianten der Standardform
Im Fall der romanischen Sprachfamilie ist die Situation wegen der zahlreichen, teils nicht hinreichend standardisierten Kleinsprachen sehr viel komplexer. Aus pragmatischen Gründen wurde hier der folgende Weg gewählt: Alle morpho-lexikalischen Typen werden, sofern vorhanden, durch die französischen und italienischen Standardformen repräsentiert; so können z. B. alle phonetischen Typen, die Varianten von beurre/burro 'Butter' sind, unter diesen beiden Formen aufgerufen werden; als Referenzwörterbücher fungieren u.a. TLF und Treccani. In entgegengesetzter Perspektive werden jeder Einzeläußerung alle drei Typen, ein Konzept sowie ein Verweis auf ein Referenzwörterbuch zugeordnet: Vgl. Karte Konzept RAHM
Falls nur eine dieser beiden Standardsprachen eine passende Variante hat, erscheint nur diese, wie im Fall von ricotta (die Zugehörigkeit zum Italienischen wird durch die Notationskonvention -/ricotta angezeigt). Wenn in keiner der beiden romanischen Referenzsprachen eine Variante des Typs existiert, wird auf den Eintrag eines dialektalen Referenzwörterbuchs zurückgegriffen, etwa auf LSI. Für den Fall, dass keine verlässlichen Einträge in Dialektwörterbüchern verfügbar sind, schlägt VerbaAlpina einen Basistyp mitsamt grafischer Repräsentation ('VA') vor.
Im Gesamtkonzept und der technischen Umsetzung vorgesehen, jedoch peripher und demnach nicht konsequent umgesetzt, ist die phonetische Typisierung des Sprachmaterials. Die entsprechende Kategorie ist vor allem deswegen unentbehrlich, weil Sprachatlanten bisweilen (z. B. SDS und VALTS) und Wörterbücher ausschließlich phonetische Typen dokumentieren. Bei der phonetischen Typisierung durch VerbaAlpina werden die Tokens nach Kriterien der historischen Phonetik in phonetische Typen eingeteilt (Datenbankfeld 'phon_typ'). Dazu ein charakteristisches Beispiel (aus AIS 1204 LA PANNA | RAHM | CRÈME):

Nach Maßgabe der Phonetik ist es sinnvoll, die Anlautvarianten [kr-] und [gr-] sowie die Tonvokalvarianten [a], [e] und [o] vor [m] zu differenzieren. Sie erscheinen daher als unterschiedliche 'phonetische Typen'. Gleichzeitig ist es klar, dass es sich um lautliche Varianten ein und desselben morpho-lexikalischen Typs handelt, denn es gibt zahlreiche analoge Fälle von Lautwandel. Da sich jedoch keinerlei Evidenz für einen Wandel von [kr-] > [br-] findet, wäre es nicht sinnvoll die entsprechenden dolomitenladinischen Formen (brama) ebenfalls dazu zu stellen. Sie repräsentieren daher trotz der Ähnlichkeiten im Tonvokal und im Silbenauslaut [-ama] einen anderen morpho-lexikalischen Typ.

Eine Automatisierung der phonetischen Typisierung auf Basis von Levenshtein- und soundex-Algorithmen wird untersucht und wenn möglich umgesetzt werden; allerdings wird in jedem Fall ein starker Korrekturaufwand entstehen. Etwa die beiden historisch zusammengehörigen Formen krama und gromma unterscheiden sich rein numerisch im Sinn der Levenshtein-Distanz durch die Menge an Zeichenersetzungen die durchgeführt werden müssen, um eine Form in die andere zu transformieren, stärker als die nicht zusammengehörigen Formen krama und brama.

Durch die Typisierung (Klassenbildung) wird die Datenvielfalt zunehmend übersichtlich; es gilt also in der Regel: Zahl der Tokens > Zahl der phonetischen Typen > Zahl der morpho-lexikalischen Typen > Basistyp. Man beachte jedoch den Extremfall eines einzigen Belegs (Hapax), der einem Token, einem phonetischem Typ und einem morpho-lexikalischen Typ als einzigem Vertreter eines Basistyps entspricht. U.U. ist es sinnvoll, solche Hapax-Formen in der Darstellung herauszufiltern.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Linguistik
Uniform Resource Name (URN)
Untersuchungsgebiet
(auct. Thomas Krefeld)
Tags: Außersprachlicher Kontext
Versionierung

- VA_DB: Datenbestand in der (MySQL-)Projekt-Datenbank (va_xxx)
- VA_WEB: Programmcode der Webschnittstelle des Projektportals www.verba-alpina.gwi.uni-muenchen.de samt zugehöriger Wordpress-Datenbank (va_wp)
- VA_MT: Mediendateien (Photos, Filme, Text- und Tondokumente), die sich in der Medienbibliothek der Webschnittstelle befinden
Alle drei Module bilden ein konsistentes Ganzes mit wechselseitigen Verknüpfungen und Abhängigkeiten und können daher nicht voneinander getrennt werden. Während der Projektlaufzeit wird halbjährlich, jeweils zum 15. Juni und zum 15. Dezember eines Jahres, simultan der jeweils aktuelle Status der Module VA_DB und VA_WEB in Gestalt einer elektronischen Kopie gleichsam "eingefroren". Diese eingefrorenen Kopien erhalten Versionsnummern nach dem Schema [Kalenderjahr]/[laufende Nummer] (z .B. 15/1). Die jeweils produktive VA-Version erhält die Bezeichnung XXX (vgl. Zitierweise).
Die Erzeugung von Kopien der VA-Mediathek (VA_MT) verbietet sich aufgrund der üblicherweise enormen Größe von Mediendateien. Aus diesem Grund wird von diesem Modul im Zuge eines Versionierungsvorgangs keine Kopie erzeugt. Einmal dort abgelegte Elemente können daher, sofern auch nur eine einzige VA-Version mit ihnen verknüpft ist, nicht aus der VA-Mediathek entfernt werden.
Im Projektportal besteht die Möglichkeit, zwischen der jeweils "produktiven" und daher ständigen Änderungen unterworfenen VA-Version sowie den archivierten, "eingefrorenen" Versionen zu wechseln. Im Projektportal wird durch geeignete Farbgebung des Hintergrunds bzw. bestimmter Bedienelemente angezeigt, ob man sich in der produktiven oder einer archivierten Version von VA befindet. Zitierfähig sind *ausschließlich* die archivierten Versionen von VA.
Titelbilder älterer VerbaAlpina-Versionen:


15/1

15/2

20/1
(auct. Stephan Lücke)
Tags: Informationstechnologie
Wikidata
Den Konzepten von VerbaAlpina werden die entsprechenden Q-IDs von Wikidata zugewiesen. Dies ist für VerbaAlpina vor allem hinsichtlich der Kooperation mit dem Projekt GeRDI von Relevanz. So wird Wikidata von GeRDI als Wissensdatenbank (knowledge base) verwendet, um eine disziplinübergreifende Suche in unterschiedlichen Sprachen gewährleisten zu können. Auf diese Weise wird ermöglicht, dass z.B. bei Eingabe eines Suchbegriffs auf Italienisch zugleich auch Ergebnisse in anderen Sprachen gefunden werden.
Konzepte, die auf Wikidata noch nicht erfasst sind, werden von VerbaAlpina dort neu angelegt. Zu diesem Zweck wurde auf Wikidata ein Projektaccount für VerbaAlpina eingerichtet. Als Default-Sprache gilt Englisch. Es können jedoch Übersetzungen des jeweiligen Konzepts in allen auf Wikidata verfügbaren Sprachen eingegeben werden.
(auct. Christina Mutter)
Tags: Informationstechnologie
Wissenschaftskommunikation im Web
- Der Wissenschaftler sucht Informanten.
- Die Informanten liefern dem Wissenschaftler Rohdaten.
- Der Wissenschaftler gibt eine bestimmte Menge der erhobenen Daten, die im Lichte theoretischer Annahmen selektiert und modelliert wurde, an ein im Wesentlichen wissenschaftliches Publikum weiter.

Die drei Schritte der traditionellen Wissenschaftskommunikation
Medien spielen eine zwar grundlegende, aber scharf begrenzte Rolle, denn sie sind in Gestalt des Drucks ausschließlich in der dritten Phase für die Publikation der Forschungsergebnisse zuständig. Diese Ergebnisse sind nur da zugänglich, wo die papierenen Publikationen materiell vorhanden sind, d.h. im wesentlichen in wenigen, meist öffentlichen Bibliotheken; in der Graphik wird die mediale Komponente durch die blaue Unterlegung des Feldes symbolisiert.
Die Neuen Medien haben die Rahmenbedingungen für die Wissenschaftskommunikation revolutioniert,denn alle Schritte der wissenschaftlichen Arbeit setzen hochtechnische Medialität voraus und werden dadurch grundsätzlich zu kommunikativen Handlungen; deshalb ist die folgende Graphik im Ganzen blau unterlegt. Die Organisation und Bündelung der Handlungsschritte zu drei notwendig aufeinander folgenden Phasen wird überwunden; die skizzierte Unidirektionalität der Informationsflusses ist ebenso aufgehoben wie die Bindung der Rolle (INFORMANT, AUTOR, LESER) an unterschiedliche Personen; grundsätzlich kann sich ein und dieselbe Person in schnell wechselnden Funktionen an der Kommunikation beteiligen. Von Grund auf verändert ist im Hinblick auf die Kommunikanten die Funktion INFORMANT, da die Behandlung der gelieferten Daten transparent bleibt und kontinuierlich verfolgt werden kann. Der INFORMANT wird so zum LESER seiner eigenen DATEN – ganz unabhängig davon, ob er die wissenschaftliche Intention überhaupt versteht; gleichzeitig eröffnet sich ihm die Möglichkeit, dazu als AUTOR Stellung zu nehmen. Nicht weniger radikal verändert sich unter diesen Bedingungen der Status Daten selbst, da sie in grundsätzlich dynamischen Datenbank abgelegt werden, deren Umfang und Struktur Veränderungen unterworfen bleibt. Unter diesen Bedingungen wird bereits die Kommunikation zwischen den involvierten Personen, in ihren womöglich wechselnden Rollen, zu einer elementaren Form der Kooperation. Es ist aber deutlich zu sagen, dass der Einsatz von Webtechnologie die Forschungskooperation nicht automatisch optimiert. Vielmehr ist es notwendig, bestimmte Regeln einzuhalten, die in den so genannten FAIR-Prinzipien prägnant formuliert wurden; sie implizieren gleichzeitig den konsequenten Verzicht auf das Copyright (©) der Print-Publikation zugunsten eine angemesseneren Lizenzierung.

Wissenschaftskommunikation unter den Bedingungen des Internet
In diesem Sinn wurde VerbaAlpina als Forschungsumgebung mit unterschiedlichen, aber eng miteinander verflochtenen Bereichen angelegt. Bei der Operationalisierung der FAIR-Prinzipien ist VerbaAlpina weiterhin auf institutionelle Absicherung angewiesen; Projektarbeit ist ja grundsätzlich befristet und insofern prekär. Das Forschungsdatenmanagement erfolgt deshalb auf der Grundlage von Prozeduren, die gemeinsam mit der Universitätsbibliothek der LMU entwickelt werden.

(auct. Thomas Krefeld)
Tags: Webseite
Wissenshorizont
(1) über außersprachliche Realität (‘Sachen’),
(2) über Konzepte, oder: inhaltliche, bzw. onomasiologische Kategorien, die nicht an einzelne Sprachen oder Dialekte gebunden sind,
(3) über sprachliche Ausdrücke der untersuchten Sprachen und Dialekte.
Die getrennte Behandlung von (2) und (3) ist grundlegend, da ja die relevanten Konzepte durchaus nicht immer im gesamten Untersuchungsgebiet mit spezifischen Bezeichnungen belegt (‘lexikalisiert’) sind; so gibt es z. B. in weiten Teilen des bairischen Gebiets kein Wort für den aus Molke hergestellten so genannten Käse (vgl. dafür gsw. (alemannisch) Ziger, ita. ricotta, fra. sérac), während es z.B. für die frische, noch ungeformte Käsemasse (bar. Topfen, deu. Quark) in den romanischen Dialekten oft, so wie auch im Standarditalienischen, keine Bezeichnung gibt. Das Verhältnis von (1) auf der einen Seite und (2) und (3) auf der anderen ist gelegentlich auch problematischer als es auf den ersten Blick erscheint; so finden sich manchmal sprachliche Ausdrücke mit unklarem semiotischen Status, weil aus den Belegen nicht hervorgeht, ob es sich um Bezeichnungen von Konzepten oder aber womöglich um Namen für Dinge handelt; das ist z. B. der Fall, wenn ein Sprecher eine ganz bestimmte Alm, etwa diejenige, die er selbst nutzt, mit einem generischen Wort als munt wörtlich ‘Berg‘ oder als pastüra ‘Weide‘ tituliert.
(auct. Thomas Krefeld)
Tags: Linguistik Außersprachlicher Kontext
Wording
Zitierweise
- Eintrag von VerbaAlpina in einer Bibliographie
Die Nennung des Datums des letzten Zugriffs ist entbehrlich, da die Zitierversionen (im Unterschied zur Arbeitsversion XXX) stabil sind und nicht mehr verändert werden (vgl. Versionierung).
Beispiel:
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.
- Zitat eines Methodologiebeitrages:
Beispiel:
Krefeld, T. / Lücke, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.
Als Autoren sind stets die unter dem Glossareintrag aufgeführten und mit "auct." gekennzeichneten Personen zu nennen.
- Zitat eines Einzelbelegs:
Beispiele:
Hütte|morphTyp|Herisau|SDS#VII_244_1|VA_15/1
Chääsera|phonTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Käserei|BasisTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Hinweis 1: Das Trennzeichen Pipe | erhalten Sie auf Windows-Computern durch Drücken von Strg+Alt zusammen mit der Taste, auf der sich neben der Pipe die Größer/Kleiner-Zeichen <> befinden. Auf Apple-Geräten ist die Tastenkombination Alt+fn+7 zu drücken.
Hinweis 2: Die folgenden Sprachkürzel nach ISO 639-1 sind zu verwenden: für Deutsch deu, für Französisch fra, für Italienisch ita, für Rätoromanisch roh, für Slowenisch slv.
(auct. Stephan Lücke | Susanne Oberholzer)
Tags: Webseite