Methodologie

Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P  Q   R   S   T   U   V   W   X  Y  Z  


Alpenwörter (Zitieren)

Typisch alpine Realia (wie die GAMS, die ZIRBELKIEFER oder die ALM) werden oft durch vorrömische Substratwörter bezeichnet. Diese sprachliche Schicht wurde wohl zuerst von Jakob Jud 1911 ausführlicher beschrieben; sie bildet den Kern der so genannten Alpenwörter. Allerdings ist der Ausdruck nicht ganz eindeutig, denn er wird von Otto von Greyerz 1933, der ihn wohl geprägt hat, und Johannes Hubschmid 1951, der ihn vor allem bekannt gemacht hat, etwas weiter gefasst: "Ich verstehe darunter Wörter, die Geländeformationen, Naturerscheinungen, Tiere und Pflanzen oder mit der menschlichen Tätigkeit zusammenhängende konkrete Begriffe bezeichnen, Wörter, die sich nur oder hauptsächlich in den Alpenmundarten erhalten haben, oder die zwar auf einem größeren Gebiet leben, aber in den Alpen häufig eine speziell 'alpine' Bedeutung zeigen. Alpenwörter können auch germanischen oder romanischen Ursprungs sein" (Hubschmid 1951, 7; vgl. zur Begriffsgeschichte neuerdings auch Rampl 2011, 131 ff.).

(auct. Thomas Krefeld)

Tags: Linguistik



Analoge Sprachgeographie (Zitieren)

Die Wissensdimensionen, die im inhaltlichen Horizont von VerbaAlpina liegen, d.h. SACHEN, KONZEPTE und WÖRTER, werden in der analogen Präsentationsweise der traditionellen Sprachgeographie in der Regel sehr eng und oft in ganz unklarer Weise miteinander verquickt. Exemplarisch ist AIS 1192a LA CASCINA DI MONTAGNA. Der Kartentitel hat zunächst den Status eines Konzepts, nämlich GEBÄUDE, “wo ein gut ausgebildeter Käser (‘Senn’) mit Hilfspersonal die Milch sachgemäss zu Käse, Butter, Zieger verarbeitet”. Weiterhin erfährt man, dass es sich um einen Oberbegriff handelt, denn manche Sennhütten dienen gleichzeitig als Lagerraum für Milch und Käse, während in anderen Fällen dafür spezielle Milch- und Käsekeller zur Verfügung stehen, die wiederum angebaut oder freistehend sein können und häufig von einem Wasserlauf durchflossen werden. Ausserdem ist die “meist massive steinerne Sennhütte” von hölzernen zu unterscheiden usw. Es gibt, mit anderen Worten, eine ganze Typologie untergeordneter und spezifischerer Konzepte, ohne dass im einzelnen immer klar ist, welche Hütte mit dem jeweils auf der Karte belegten Wort gemeint ist. Das Konzept im Kartentitel ist also häufig unterspezifiziert, und an keinem Ort kann die Existenz anderer Bezeichnungen für spezifischere Hütten ausgeschlossen werden; Dialektwörterbücher bestätigen diesen Eindruck mit großer Regelmäßigkeit. Gleichzeitig kommen mit dem MILCH- und KÄSEKELLER andere Konzepte ins Spiel, die keine Unterbegriffe von SENNHÜTTE sind; ferner wird in derselben Legende auf das häufige Vorkommen von Ställen (für unterschiedliche Tiere, auch für Schweine) hingewiesen, auf ein drittes Konzept also. Bezeichnungen für diese weiteren Konzepte werden in der Regel nicht auf der topographischen Karte eingetragen, sondern am Rand in Form von Listen, die meist nur Belege für wenige Orte zeigen. Gleichzeitig kommt es nicht selten vor, dass auf den Listen polyseme Wörtern auftauchen, die in einzelnen Orten ganz andere Konzepte bezeichnen. Man vergleiche den Typ kort, der auf der Liste zum Konzept ALPSTALL in den AIS_Orten 107 und 109 belegt ist, obwohl er in einem der beiden Belege (Punkt 109) ein ganz anderes Konzept, nämlich den offenen LAGER- UND MELKPLATZ FÜR VIEH BEI DER ALMHÜTTE bezeichnet.





Dergleichen Inkonsistenzen müssen bei der digitalen Datenaufnahme unbedingt beseitigt werden; oberstes Gebot ist hier die scharfe Trennung der genannten inhaltlichen Dimension, sozusagen die systematische Dekonstruktion der gebotenen Information.





Im Zuge einer solchen Dekonstruktion ergibt die oben als Beispiel genannte Karte folgende Datensätze:

AIS 1192a, Stimulus LA CASCINA DI MONTAGNA; SENNHÜTTE
weitere Stimuli (= onomasiologisch eindeutige KONZEPTE): 8 (MILCHKELLER, KÄSEKELLER, LA CANTINA DA LATTE, MAIENSÄSSE, ALMSTALL, SCHLAFRAUM IN DER SENNHÜTTE, ANDERE ÖKONOMIEGEBÄUDE, DIE ALP WECHSELN)
mögliche untergeordnete KONZEPTE: 120
sprachliche Einzelbelege: 1032
Erhebungsorte: 134

Im Anschluss können dann alle Informationen in konsistenten Kategorien und quasi beliebiger Kombination aus der Datenbank abgerufen und visualisiert werden.

(auct. Thomas Krefeld)

Tags: Linguistik



Autorenschaft (Zitieren)

Alle verbalen Beiträge der VerbaAlpina-Seite sind namentlich gekennzeichnet; Autoren werden mit dem Kürzel "auct." markiert, Übersetzer eines Beitrags mit dem Kürzel "trad.". Die Software wird im Wesentlichen von Florian Zacherl, David Englmeier (seit 1.10.2016) und Filip Hristov (seit 1.10.2016) entwickelt.

(auct. Thomas Krefeld | Susanne Oberholzer)

Tags: Webseite



Betacode (Zitieren)

In Anlehnung an die Terminologie des Thesaurus Linguae Graecae (TLG), der das entsprechende Konzept Anfang der 1970er Jahre für die elektronische Erfassung altgriechischer Texte mit den damaligen computertechnischen Mitteln entwickelt hatte, wird im Rahmen von VerbaAlpina die Transkription komplexer Schriftsysteme unter ausschließlicher Verwendung von ASCII-Zeichen als "Betacode" bezeichnet.
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):





Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel das Häkchen unterhalb des u im Wort tu durch eine öffnende runde Klammer wiedergegeben: tu(. Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Beta-Kodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Linguistik Informationstechnologie



Bezeichnung (Zitieren)

Unter 'Bezeichnung' versteht VerbaAlpina die idealisierte Instanz eines geschriebenen, gesprochenen oder gedachten Wortes, das ein oder mehrere Konzepte benennt und womöglich auf konkrete Dinge referiert. Anstelle eines einzelnen Wortes kann auch die spezifische Abfolge mehrerer Wörter diese Funktionen übernehmen (sogenannte Mehrwortlexie). Im Hinblick auf die Kategorie 'Konzept' ergibt sich, informatisch gesprochen, eine sogenannte m:n-Beziehung: Eine polyseme Bezeichnung kann mehrere Konzepte benennen, umgekehrt kann ein Konzept durch eine Vielzahl von synonymen Bezeichnungen benannt werden.





(auct. Stephan Lücke)

Tags: Linguistik



Codepage (Zitieren)

VerbaAlpina vereinigt Daten aus verschiedenen Arten von Quellen: Daten aus gedruckten Sprachatlanten und Wörterbüchern, die zunächst noch digitalisiert werden müssen, sowie bereits elektronisch vorliegende Daten aus einer Reihe von Partnerprojekten. Jede dieser unterschiedlichen Quellen verwendet mehr oder weniger individuelle Systeme zur Transkription. Um die erforderliche Vereinheitlichung zu realisieren, sind Listen nötig, in denen festgelegt ist, welches Schriftzeichen im Transkritionssystem der einen Quelle welche Entsprechung im Transkriptionssystem der anderen Quelle besitzt. Hauptsächlich geht es darum, die unterschiedlichen Transkriptionssysteme auf das Internationale Phonetische Alphabet (IPA) abzubilden, das innerhalb von VerbaAlpina als Referenztranskription fungiert. Zur Überführung eines quellenspezifischen Transkriptionssystems in das IPA-System ist die Anlage einer vollständigen Liste in Tabellengestalt mit Schriftzeichenentsprechungen erforderlich. Eine solche Tabelle wird als "Codepage" bezeichnet.
Nachfolgend ein Auszug aus der für die Konvertierung des AIS-Transkriptionssystems in IPA grundlegenden Codepage. Insgesamt umfasst diese Codepage rund 4500 Zeilen/Zuordnungen:


Die Kolumne `BETA` enthält die im AIS verwendeten Zeichen in nach dem Prinzip des Betacodes transkribierter Form, die Kolumne `IPA` das jeweils entsprechende IPA-Zeichen und die Kolumne `HEX` den oder die Zahlenwerte der Unicodetabelle, die dem jeweiligen IPA-Zeichen entsprechen.

(auct. Stephan Lücke)

Tags: Linguistik Informationstechnologie



Crowdsourcing (Zitieren)

Obwohl bereits viele relevante Sprachdaten zu den Gegenstandsbereichen von VerbaAlpina vorliegen (vor allem in Atlanten und Wörterbüchern), ist es vorgesehen, neue Daten zu erheben. Damit sollen (1) Inkonsistenzen zwischen den bereits vorliegenden Quellen ausgeglichen, (2) Lücken bzw. Ungenauigkeiten beseitigt und (3) überkommene Bezeichnungen bzw. Geräte als solche gekennzeichnet werden. Die Neuerhebungen werden aber nicht mit den klassischen Verfahren der Feldforschung durchgeführt, sondern mit den Mitteln, die uns die sozialen Medien inzwischen zur Verfügung stellen. Entsprechende Verfahren werden oft unter dem Ausdruck crowdsourcing zusammengefasst.
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008).
Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.

In VerbaAlpina geht es konkret darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen. Sehr interessiert ist VerbaAlpina darüber hinaus an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wer immer also Kenntnisse eines im Alpenraum gesprochenen Dialekts hat, ist eingeladen, spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina
einzutragen. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z. B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich am Projekt in dieser Weise beteiligen. – Außerdem sind Bilder von alpentypischen Objekten, aber auch von Almen, Hütten, Flora, Fauna, Bergen und Landschaftsformen mitsamt ihren Bezeichnungen willkommen. Sie können in der Mediathek gespeichert werden.

Parallel zur gezielten Mitarbeit bei VerbaAlpina erhält jeder Nutzer die Möglichkeit, sich in unserem System eine eigene Forschungsumgebung einzurichten, die für die Sammlung von hauptsächlich Sprachdaten, jedoch durchaus auch von anderen Daten verwendet werden kann. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Er hat die Möglichkeit, diese Daten gleichsam ausschließlich für die persönliche Verwendung unter Verschluss zu halten oder aber den Zugriff anderen Nutzern freizugeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Nur wenn möglichst viel Daten der Allgemeinheit zur Verfügung gestellt werden, kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.


(auct. Thomas Krefeld | Stephan Lücke)

Tags: Funktionsbereiche



Datenmodellierung (Zitieren)

s. Relationales Datenmodell

Tags: Linguistik Informationstechnologie



Digital Humanities (Zitieren)

Das Projekt VerbaAlpina wurde von vornherein mit Blick auf Webtauglichkeit konzipiert, denn es will ganz entschieden zur Überführung der etablierten geisteswissenschaftlichen Traditionen, genauer: der Geolinguistik, in die Digital Humanities beitragen .
Das bedeutet:
(1) Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
(2) Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
(3) Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
(4) Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld)

Tags: Informationstechnologie



Digitalisierung (Zitieren)

Mit Digitalisierung wird im Kontext von VerbaAlpina nicht der schlichte Einsatz von Computern zur elektronischen Datenverarbeitung, sondern vielmehr und wesentlich die digitale Tiefenerschließung des Materials durch systematische und transparente *Strukturierung* und Kategorisierung verstanden.





Dabei kommt quasi ausschließlich das relationale Datenmodell zum Einsatz, bei dem das Datenmaterial grundsätzlich in Tabellengestalt organisiert wird. Die Tabellen bestehen aus Zeilen (= Datensätze, Tupel) und Spalten (= Attribute, Felder, Eigenschaften), wobei jede Tabelle in jede Richtung um zusätzliche Zeilen und Spalten erweitert werden kann. Zwischen den Tabellen bestehen logische Zusammenhänge, die sinnvolle Verknüpfungen und entsprechende synoptische Darstellungen (sog. "Joins") von zwei und mehr Tabellen erlauben. Für die Verwaltung der Tabellen setzt VerbaAlpina derzeit das Datenbankmanagementsystem MySQL ein, die Tabellen sind jedoch nicht an dieses System gebunden, sondern können jederzeit z.B. in Textgestalt mit eindeutig zu definierenden Trennzeichen für Feld- und Datensatzgrenzen (sog. Separatoren) zusammen mit den Spaltennamen und der Dokumentation der logischen Zusammenhänge (Entity-Relationship-Modell) exportiert werden. Die derzeit vielfach verwendete XML-Struktur wird im operativen Bereich von VerbaAlpina nicht eingesetzt. Im Rahmen des Schnittstellenkonzepts ist XML jedoch als Exportformat verankert.

Neben der logischen Strukturierung der Daten spielt im Zusammenhang mit dem Stichwort "Digitalisierung" die Kodierung der Schriftzeichen die zweite zentrale Rolle. Gerade im Hinblick auf die Langzeitarchivierung des Datenmaterials ist der richtige Umgang mit dieser Thematik von großer Bedeutung. Soweit möglich, orientiert VerbaAlpina sich dabei an der Kodierungstabelle und den Vorgaben des Unicode-Konsortiums. Im Fall der Digitalisierung von Schriftzeichen, die bislang noch nicht in die Unicodetabelle aufgenommen sind, erfolgt die digitale Datenerfassung eines Einzelzeichens vorzugsweise durch Serialisierung in Gestalt einer Abfolge von Zeichen aus dem Unicode-Bereich x21 bis x7E (innerhalb des ASCII-Bereichs). Die entsprechenden Zuordnungen werden in speziellen Tabellen dokumentiert, wodurch eine spätere Konvertierung in dann möglicherweise vorhandene Unicodewerte stets möglich ist.

(auct. Stephan Lücke)

Tags: Linguistik



Dokumentation (Zitieren)

VerbaAlpina dokumentiert die dialektale Variation innerhalb eines ethnographisch definierten Raums; der onomasiologische Rahmen wird durch kulturelle Techniken und Lebensformen abgesteckt, die sich unter den jeweils spezifischen, auch kulturunabhängigen Umweltbedingungen konventionalisiert haben. Dergleichen Räume, die durch die Alpen in prototypischer Weise repräsentiert werden, konnten die sprachwissenschaftlichen Forschungstraditionen nicht angemessen erfassen, da sich die Teildisziplinen, die sich systematisch mit der Konstitution von Räumen beschäftigen – also die Sprachgeographie bzw. Dialektologie oder auch Geolinguistik – beinahe ausnahmslos an vorgegebenen politischen und/oder (einzel)sprachlichen Grenzen orientieren. Der räumliche Zuschnitt zentraler und in mancher Hinsicht bis heute maßgeblicher Unternehmungen ist zwar nachzuvollziehen (vgl. etwa den AIS und das FEW) – zustimmen mag man jedoch oft nicht. Gerade die besonders faszinierenden mehrsprachigen Kulturräume, also z. B. das Gebiet zwischen der montenegrinisch-albanischen Adriaküste und der Donau, fallen daher durch das Raster der etablierten, durch nationalphilologische Voreinstellungen gesteuerten Forschung. Der ambitioniert geplante Atlante linguistico mediterraneo hätte ein richtungweisendes Großprojekt werden können; er ist jedoch über Ansätze niemals hinausgekommen.
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).

Perspektive

Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Hinblick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.

Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als Ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.

Kartographie

Den Zugang zur Dokumentation vermittelt vor allem ein interaktive Karte. Bislang werden zur Visualisierung nur Punktsymbolkarten mit interaktiven Symbolen eingesetzt. Komplementär wird eine interaktive Flächensymbolisierung auf Basis der Gemeindeflächen vorbereitet, um eine bessere Visualisierung quantitativer Verhältnisse zu erzielen. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern.

Linguistische Datenaufbereitung

Bei Aktivierung ('Klick') eines Punktsymbols öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten; das folgende Beispiel zeigt die Bezeichnung des Konzepts BUTTER in Ramosch (Unterengadin):



Präsentation der sprachlichen Daten mit einem Pop-up-Fenster der interaktiven Karte

Die Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Demnächst kommen – wenn möglich – Verweise auf Referenzwörterbücher hinzu.

Filter

Mehrere Filter erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen. Der oben gezeigte Kartenausschnitt stammt aus der Karte, die bei Auswahl des 'Konzepts' BUTTER erscheint:



Filter zu Steuerung der interaktiven Karte

Gruppieren und Sortieren

Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) führt zu 1448 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:



Die Sortierfunktion der interaktiven Karte: Konzepte

Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen oder Basistypen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:





Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen:



Polysemie des morpho-lexikalischen Typs malga

Quellen

Bislang wurden einige georeferenzierbare Wörterbücher, vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:
    1. Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.).


    2. Das von VA entwickelte Transkriptionstool

    3. Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD und den ALTR praktiziert.
    4. Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; dies gilt bislang vor allem für SAO-Daten.

    Multidimensionalität

    Für ein umfassendes Verständnis der historischen Prozesse ist es unbedingt wünschenswert, die sprachliche Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die
    • Orte mit lateinischen Inschriften in der Provinz Noricum ;
    • Orte mit lateinischen Inschriften aus Raetien ;
    • aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae .
    Andererseits wurden die Reflexe von drei lateinischen, genauer: zwei lateinischen und einem latinisierten aber mutmaßlich vorrömischen Basistypen aufgerufen:
    • Basistyp lat. casearia in der Bedeutung 'Hütte'  in Nord-, Süd- und besonders prägnant in Osttirol;
    • den Basistyp vorröm. baita in der Bedeutung 'Haus'   in Slowenien südlich von Ljubljana;
    • den Basistyp lat. cellarium in der Bedeutung 'Hütte'  in Oberösterreich.


    Synoptische Karte zur lateinischen Epigraphik, den Tabula Peutingeriana-Orten und den Basistypen cellarium und baita in einem Teil des deu. und slow. Raums (vgl. die Legende oberhalb der Karte)

    Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.

    (auct. Thomas Krefeld)

    Tags: Funktionsbereiche



Entity Relationship (Zitieren)

Daten können grundsätzlich zu sogenannten "Entitäten" zusammengefasst werden. Dabei handelt es sich um Klassen von Daten, die jeweils eine bestimmte Art und Anzahl spezifischer Merkmale aufweisen. So können beispielsweise die Städte Trento, Innsbruck und Luzern eine Klasse "Orte" bilden, der die Merkmale "Ortsname", "Längengrad", "Breitengrad", "Staat" und "Einwohnerzahl" zu eigen ist. Die einzelnen Mitglieder einer solchen Klasse unterscheiden sich durch die unterschiedlichen Werte der die Klasse ausmachenden Merkmale.
In einer relationalen Datenbank werden Entitäten idealerweise in jeweils eigenen Tabellen gespeichert, wobei jede Tabellenspalte die Werte jeweils eines spezifischen Merkmals aufnimmt. Die Tabellenzeilen enthalten die individuellen, durch ihre Merkmalswerte von einander unterschiedenen Mitglieder der Datenklasse (Entität). In den allermeisten Fällen – und so auch bei VerbaAlpina – stellt eine relationale Datenbank eine Sammlung verschiedener Entitäten (und somit Tabellen) dar, zwischen denen logische Beziehungen bestehen. So wäre etwa die Entität "Informant", die durch die Merkmale "Alter", "Geschlecht", "Geburtsort" und "Wohnort" definiert ist, mit der Entität "Orte" in der Weise logisch verbunden, dass die Werte der Merkmale "Geburtsort" und "Wohnort" Entsprechungen in der Entität "Orte" besitzen. Beziehungen zwischen Mitgliedern dieser beiden Entitäten ergeben sich aus Übereinstimmungen der Werte eines oder mehrerer, ihrem Wesen nach kongruenter, Merkmale der jeweiligen Entitäten. Im gegebenen Fall könnte sich theoretisch eine Zuordnung aus identischen Werten der Merkmale "Geburtsort" und "Ortsname" ergeben, wodurch mittelbar einem Informanten die Geokoordinaten seines Geburtsortes zugeordnet werden könnten. Es ist leicht zu erkennen, dass in diesem Beispiel Probleme aufgrund von Homonymen auftreten könnten. Um dergleichen zu vermeiden, ist es üblich, Ganzzahlen als Identifikatoren (kurz: "ID") zu verwenden, die die Mitglieder einer Entität eindeutig bezeichnen.
Das skizzierte System der Entitäten und ihrer logischen Zusammenhänge wird als Entity Relationship bezeichnet. Der in einer relationalen Datenbank gesammelte Datenbestand ist ohne eine Erläuterung dieser dort bestehenden Abhängigkeiten nur schwer versteh- und nutzbar. Üblicherweise erfolgt die Abbildung der Entity Relationship in Gestalt eines graphischen Schemas.
Die Entity Relationship unterliegt während der zyklischen Entwicklungsphasen von VerbaAlpina (s. Versionierung) ständigen Anpassungen und somit Veränderungen. Jeder archivierten Version von VerbaAlpina wird das Entity Relationship Modell der jeweils zugrundeliegenden Datenbankversion in Form eines ER-Diagramms beigegeben, das mit dem Programm yEd erzeugt und als GraphML- und PDF-Dokument abgespeichert wird. Folgende Graphik basiert auf den Entitäten und Verknüpfungen der Datenbank VA_XXX in ihrem aktuellen Zustand (20.3.2015), bildet diese jedoch nicht vollständig ab und ist nur als illustrierendes Beispiel zu verstehen:





(auct. Stephan Lücke)

Tags: Informationstechnologie



Ergänzende Daten (Zitieren)

Für die induktive Kulturraumforschung sind demographische und institutionelle Daten immer dann interessant, wenn sie sich als georeferenzierbar erweisen. Dazu zählen siedlungsgeschichtliche Informationen, insbesondere im Hinblick auf die Zugehörigkeit zu kirchlichen und staatlichen Institutionen. Aber auch Verkehrswege, insbesondere Passverbindungen, sind von grundlegender Bedeutung (vgl. Karte).
Ökologische und geophysikalische Daten sind immer dann relevant, wenn sie einen klaren Bezug zur Siedlungsgeschichte haben. Das ist zum Beispiel evident im Hinblick auf die Vegetationszonen, die bestimmte Nutzungen gestatten oder verlangen (z. B. die Almwirtschaft setzt Höhenlagen über der Baumgrenze voraus (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_DE).

(auct. Thomas Krefeld)

Tags: Außersprachlicher Kontext



Erklärungssprache (Zitieren)

Die Oberfläche dieses Portals wird in mehreren Standardsprachen aufrufbar sein, nämlich (in alphabetischer Reihenfolge) auf Deutsch, Englisch, Französisch, Italienisch, Rätoromanisch (Rumantsch Grischun) und Slowenisch, dabei ist im Fall des Deutschen je nach Autor/in gelegentlich mit schweizerischen und österreichischen Standardvarianten zu rechnen. Unabhängig von der gewählten Erklärungssprache hat der Nutzer jedoch stets Zugriff auf sämtliche objektsprachlichen Materialien aller erfassten Dialekte und Sprachen.

(auct. Thomas Krefeld)

Tags: Webseite



Ethnolinguistik (Zitieren)

"On ne peut pas faire l'histoire des mots sans faire l'histoire des choses" (Jaberg 1936, 23).
In der romanistischen, aber vor allem italianistischen Forschungstradition war die Dialektologie von Beginn an, d.h. in Italien mindestens seit Giuseppe Pitré, immer sehr eng mit den Sozialwissenschaften, genauer gesagt mit der Soziologie und der Ethnologie verbunden. In dieser Perspektive lässt sich die gesamte Geolinguistik sogar als Teildisziplin einer übergeordneten 'Ethnowissenschaft' verstehen. Dieser Ausdruck, der hier als Übersetzung von ita. etnoscienza (aus engl. ethnoscience) gesetzt wird, hat allerdings weder in Italien, noch in Deutschland etablieren können. In dem sehr scharfsinnigen und informativen Manuale di etnoscienza von Giorgio Raimondo Cardona (Cardona 1995) heißt es:

"[...] il prefissoide etno- permette un'immediata 'etnologizzazione' di qualunque sottodisciplina [...]. L'inglese offre ancora un altro tipo di formazione, quella con folk- (folk-taxonomy), che ha però lo svantaggio di non essere atrettanto facilmente esportabile quanto il suo concorrente grecizzante.
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 f.; Hervorhebung durch fette Schrift: ThK)  

Die so skizzierte etnoscienza wird in der US-amerikanischen Tradition auch als cultural anthropology (dt. Kulturanthropologie) bezeichnet. Speziell im deutschsprachigen Raum wurde darüber hinaus zwischen Volkskunde für die Erforschung einheimischer Kultur(en) und Völkerkunde für die Erforschung fremder, insbesondere nichteuropäischer Kulturen unterschieden. In der Gegenwart wird stattdessen meist allgemein von Ethnologie mit dem besonderen Teilgebiet der Europäischen Ethnologie (im Sinne der Volkskunde) gesprochen. Die Bezeichnung Ethnolinguistik ist daher auch nicht eindeutig, da sie oft auf die sprachwissenschaftliche Untersuchung nichteuropäischer Kulturen eingeschränkt wird (vgl. Senft 2003), obwohl sie die europäischen nicht ausschließen sollte; die kategorische Trennung erweist sich im Hinblick auf die massenhaften und weiträumigen Migrationsströme ohnehin in rapide zunehmendem Maße als sinnlos.

Eine Unschärfe im zitierten Passus von Cardona bleibt zu klären; sie betrifft das 'Präfixoid' ethno-, das einerseits als Synonym des en. folk und andererseits mit Bezug auf etnia verwendet wird. Mit folk (in folk-taxonomy usw.) wird auf die alltags- oder lebensweltlichen Wissensbestände und Konventionen der Laien bzw. Nicht-Wissenschaftler verwiesen und genau in diesem Sinne sollte auch Ethnie (bzw. ethno-) auf alltagsweltliche Kulturgemeinschaften bezogen werden, ohne jedoch idealisierte Vorstellungen von Homogenität, Archaizität, sozialer Abgeschlossenheit usw. zu implizieren. Die Unterscheidung Cardonas (a vs. b) verweist weiterhin auf zwei komplementäre Forschungsperspektiven in den Kultur- und Sozialwissenschaften.

Zusammenfassend darf man dialektologische Forschungen im Sinn von Cardona (auch im Nachhinein) als 'ethnolinguistisch' bezeichnen, wenn sie ihre sprachlichen Daten im engen Zusammenhang mit der Alltagskultur der Sprecher erheben und analysieren.
In der romanistischen Tradition wurde diese Ausrichtung durch den prototypischen Sprach- und Sachatlas Italiens und der Südschweiz (AIS) etabliert; sie markiert zweifellos den größten Unterschied und Fortschritt zum ALF, wie Karl Jaberg nicht ohne Emphase festhält. Der im Hinblick auf das Selbstverständnis des AIS und die Wissenschaftsgeschichte aufschlussreiche Passus verdient durchaus herausgehoben zu werden:
"L'importance des «choses» n'a pas échappé à l'esprit de Gilliéron [...] Que Gilliéron ait complètement négligé ce point de vue dans la conception de l'Atlas et qu'il n'en ait tenu compte qu'en passant dans ses autres publications, c'est un fait d'autant plus étrange qu'il connaissait fort bien les «choses» et s'y intéressait passionnément. A-t-il approuvé l'enseignement que Ferdinand de Saussure a tiré de ses incursions dans les domaines limitrophes de notre science, à savoir que la «linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même», principe qui, malgré l'admiration que j'ai pour le grandsavant genevois, m'a toujours semblé singulièrement rétrécir le champ d'action du linguiste." (Jaberg 1936, 27 f.)
Jaberg weist explizit und vollkommen zu Recht darauf hin, dass der Saussuresche Strukturalismus gerade in diesem Punkt junggrammatische Vorstellungen beibehält; aus der Sicht der zeitgenössischen Geolinguistik wird der Versuch, die Sprache als isolierbares 'Modul' zu betrachten, also keineswegs als ein neues Paradigma, sondern geradezu als traditionalistisch wahrgenommen:
"La conception du Petit Atlas phonétique du Valais roman [ebenfalls von Gilliéron; Th.K.] et celle de l'Atlas linguistique de la France remontent à une époque qui était encore sous l'empire des néogrammairiens, et on sait ce que les néogrammairiens doivent aux sciences naturelles. Ce n'est certes pas un hasard que le Cours de linguistique générale s'en ressente également. M. Jud et moi, nous avions pas ces attaches avec les néogrammairiens, Gilliéron lui-même nous avait aidés à les rompre. Nous étions en revanche fortement impressionnés par les brillants articles de Meringer et de Schuchardt. La réalité des choses était autours de nous. Nous avions nous-mêmes parcouru les pays romans ; nous avions recueilli sur le terrain des observations ethnographiques et folkloriques. Comment en rester aux mots? Tout en sauvegardant le caractère essentiellement linguistique de notre ouvrage, nous croyions devoir fournir à l'historien des mots les données nécessaires pour se faire une idée des choses, afin qu'il ne bâtisse pas dans le vide." (Jaberg 1936, 28).


Richtungweisend für die ethnolinguistisch orientierte Tradition der italienischen Dialektologie ist die in teilnehmender Beobachtung entstandene Untersuchung von Hugo Plomteux 1980 über die Cultura contadina in Liguria. Ethnolinguistisch sehr gut, im regionalen Vergleich vielleicht am besten erschlossen ist Sizilien. Zu nennen sind vor allem: Fanciullo 1983 und mehrere wichtige Arbeiten, die im Rahmen des Atlante linguistico della Sicilia entstanden sind; die folgenden Titel geben Auskunft über die jeweils untersuchten kulturellen Techniken und Traditionen: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 und Castiglione 1999.

(auct. Thomas Krefeld)

Tags: Linguistik Außersprachlicher Kontext



Ethnolinguistisches Ähnlichkeitsprofil (Zitieren)

Aus der ethnolinguistischen Sicht dieses Projekts bilden die Basistypen das Fundament des mehrsprachigen alpinen Raums. Im Sinne einer synthetischen Darstellung sind zwei unterschiedliche quantitative Kartierungsfunktionen vorgesehen:
  1. Zunächst sind die Alpenwörter von besonderem Interesse; ihre Gesamtheit bildet sozusagen einen fiktiven Idealtyp, dem die einzelnen Ortsdialekte mehr oder weniger nahe kommen. Dem entspricht die Kartierung einer gradueller Ähnlichkeit, die durch die Darstellung des champ gradient de la gasconité im ALG 6 inspiriert wurde.
  2. Sodann wird nach dem Vorbild des ASD die relative Ähnlichkeit aller Aufnahmeorte untereinander kartiert, indem die gemeinsamen Basistypen eines beliebigen Aufnahmeortes und diejenigen eines beliebigen anderen Ortes als Bezugspunkt festgestellt und angezeigt werden.


(auct. Thomas Krefeld)

Tags: Linguistik Außersprachlicher Kontext



Etymologie (Zitieren)

Die Freilegung der sprachlichen Strata, die Stratigraphie, setzt die Etymologisierung voraus. Der etymologische Kommentar geht jeweils vom Basistyp aus und verfolgt ein dreifaches Ziel:
- die Ermittlung der Herkunftssprache der lexematischen Basis;
- die Begründung der Zusammengehörigkeit aller unter dem Basistyp vereinigten Typen; dafür sind die Regularitäten der historischen Phonetik und die semantische Plausibilität der zugrundeliegenden Konzeptrelationen entscheidend;
- die Rekonstruktion der Entlehnungswege, falls der Basistyp in mehreren Sprachgebieten verbreitet ist; sobald die Sprache des Etymons einerseits und des Informanten andererseits nicht übereinstimmen, wird automatisch Sprachkontakt festgestellt.

(auct. Thomas Krefeld)

Tags: Linguistik



Forschungsumgebung (Zitieren)

Die Aufgaben und Leistungen von VerbaAlpina können den folgenden Bereichen zugeordnet werden:
(1) Dokumentation und sprachgeschichtliche Analyse des dialektalen Wortschatzes, der nach Maßgabe des onomasiologischen Rahmes als charakteristisch eingeschätzt wird;
(2) Kooperation mit Projektpartnern zum gegenseitigen Datenaustausch und zur Datenanalyse;
(3) Publikation des Datenbestandes, analytischer Texte und unterschiedlicher, projektbezogener Materialien, die sich teils an die fachliche, teils an die breite Öffentlichkeit richten.
Die Funktionen (1) bis (3) wurden mit der ersten Version 15/1 bereits aktiviert ; ergänzt wurden sie mit Version 17/1 um::
(4) Datenerhebung durch Crowdsourcing.
Alle aktiven Funktionen werden kontinuierlich ausgebaut. In der Vorbereitung befindet sich schließlich:
(5) die Einrichtung eines Forschungslabors.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Fotos (Zitieren)

Die Mediathek von VerbaAlpina enthält eine umfangreiche, ständig wachsende Sammlung georeferenzierter Fotos; diese Aufnahmen erfüllen einen doppelten Zweck: Einerseits verweisen sie auf konkrete Referenten mit all ihren idiosynkratischen Besonderheiten, die vor allem bei Gebäuden sehr ausgeprägt sein können; andererseits sollen die Fotos in möglichst anschaulicher Weise ein Konzept illustrieren und so zur Grundlage für die Erhebung weiterer Bezeichnungen des Konzepts werden. In dieser Funktion geht es also nicht darum, den spezifischen Referenten, also eine ganz bestimmte Almhütte, wiederzuerkennen. Das wäre sogar eher störend, denn in diesem Fall neigen Informanten dazu, den Eigennamen der Alm zu liefern, und nicht die Bezeichnungen des Konzepts. Das Risiko ist allerdings überschaubar; ein grundsätzliches Missverständnis ergibt sich eigentlich nur beim Wiederkennen bekannter Personen; hier ziehen die individuellen Merkmale die gesamte Konzentration des Betrachters auf sich, so dass der Abgebildete spontan und unwillkürlich mit dem Namen genannt wird ("das ist doch der Willi!") – und nicht in der Funktion, die er auf dem Foto ausübt (SENN). Strenggenommen wäre daher zur Erhebung von Bezeichnungen die Verwendung idealisierter Zeichnungen anstelle von Fotos konkreter Objekte vorzuziehen; das scheitert jedoch am Fehlen entsprechender Vorlagen. Alle Abbildungen von Referenten sind über die Datenbank mit den Kategorien "Konzept" und "Bezeichnung" verbunden.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Außersprachlicher Kontext



Georeferenzierung (Zitieren)

Ein wesentliches Ordnungskriterium der in VerbaAlpina verwalteten Daten ist die Georeferenzierung unter Verwendung von Breiten- und Längengraden. Die Genauigkeit dieser Referenzierung variiert je nach Datentyp, wobei grundsätzlich eine möglichst exakte, metergenaue Referenzierung angestrebt wird. Im Fall der Sprachdaten aus Atlanten und Wörterbüchern ist in aller Regel lediglich eine vergleichsweise ungefähre Referenzierung nach Maßgabe eines Ortsnamens möglich, im Fall von z. B. archäologischen Daten hingegen sind tatsächlich metergenaue Georeferenzierungen möglich. Es können Punkte, Linien (etwa Straßen, Flüsse u. Ä.) und Flächen gespeichert werden. Aus technischer Perspektive findet hauptsächlich das sogenannte WKT-Format (https://en.wikipedia.org/wiki/Well-known_text) Verwendung, das in der VA-Datenbank mit der Funktion geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html in ein spezifisches MySQL-Format überführt und so gespeichert wird. Die Ausgabe im WKT-Format erfolgt durch die MySQL-Funktion astext().
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Linguistik Informationstechnologie Außersprachlicher Kontext



Induktive Kulturraumforschung (Zitieren)

Das Projekt fokussiert die Alpen als einen einzigen kulturräumlichen Komplex, da es von der Erwartung gemeinsamer kultureller Techniken im gesamten Alpenraum ausgeht. Die Grundlage dafür liegt in der Adaptation an identische oder zumindest sehr ähnliche Lebensbedingungen im Hochgebirge und in der damit verbundenen, selbstverständlichen Verbreitung entsprechender Fertigkeiten und Traditionen. Da sich diese Gemeinsamkeiten in entsprechenden Bezeichnungen sprachlich deutlich manifestieren, ist es nicht angemessen, alpine Sachkultur sozusagen top down im verengten Rahmen einzelner Sprachgemeinschaften, d.h. über ein festes Netz von Erhebungspunkten in a priori festgelegten Sprach- oder Dialektregionen zu beschreiben; dies entspricht meist den Absichten der Dialektologie, die auf möglichst vollständige Beschreibung einzelner Gebiete und idealerweise spezifischer Varietäten zielt. In der hier eingenommenen sprachgrenzüberschreitenden Perspektive einer interlingualen Geolinguistik sollen die Verbreitungsgebiete kultureller Traditionen und ihrer sprachlichen Bezeichnungen dagegen bottom up, d.h. aus der Akkumulation möglichst zahlreicher lokaler Befunde induktiv freigelegt werden.
Das Grundprinzip besteht darin, ausschließlich mit georeferenzierbaren Daten zu operieren und – abgesehen von der Zugehörigkeit der Orte zur Alpenkonvention – keinerlei großräumige Kategorien vorzugeben. Zur kulturräumlichen Profilierung des Alpenraums können die ergänzenden Daten beitragen, die aktuelle oder historische Informationen über die soziale Organisation der Einwohner und/oder über deren infrastrukturelle Erschließung und Bewirtschaftung des Raums liefern. Im Hinblick auf die historische Rekonstruktion des alpinen Kulturraums ist es erstrebenswert, die Gebiete archäologischer Persistenz mit den Arealen sprachlicher Relikte abzugleichen und quantitativ in Gestalt einer kombinierter Sach- und Sprachschichtenkartographie zu visualisieren; vgl. dazu aus archäologischer Sicht allgemein Häuber/Schütz 2004a sowie den modellhaften Kölner Stadtschichtenatlas (vgl. Häuber/Schütz/Spiegel 1999 und Häuber u.a. 2004).

(auct. Thomas Krefeld)

Tags: Linguistik



Informant (Zitieren)

Der Ausdruck wird in VerbaAlpina technisch verstanden, denn er fasst je nach Quelle zwei unterschiedliche Dinge zusammen: In den Atlanten sind alle Sprachdaten in der Regel bis ‘hinunter’ zum Sprecher transparent; in der Datenbank sind diese Informanten über eine individuelle Nummer identifizierbar (ID). Sie sind weiterhin über das Jahr der Erhebung chronoreferenziert und über den Ort der Erhebung georeferenziert. In georeferenzierbaren Wörterbücher ist es dagegen in aller Regel unmöglich, konkrete Sprecher zu identifizieren. Aus datenbanktechnischen Gründen werden aber auch den Quellen dieser Gattung fiktive Informanten zugeschrieben. Jeder Informant ist einer Sprachfamilie zugeordnet; diese Sprachzuweisung wird an alle auf ihn zurückgehenden Sprachdaten ‘vererbt’.

(auct. Thomas Krefeld)

Tags: Webseite



Inputdaten (Zitieren)

In VerbaAlpina werden ausschließlich Daten verwandt, die mindestens im Gebiet einer politischen Gemeinde, wenn möglich aber noch genauer (wie z. B. Photos von Almen) georeferenziert sind. Im Blick auf die besonders wichtigen sprachlichen Daten sind zwei Typen zu unterscheiden: einerseits solche, die unmittelbar auf Äußerungen einzelner Informanten zurückgehen – wie etwa die Belege mancher, insbesondere romanischer Sprachatlanten oder auch der Bayerischen Dialektdatenbank (BayDat); diese Äußerungen werden in ihre konstitutiven Bestandteile, die so genannten Tokens zerlegt. Andererseits liefern manche Atlanten, wie etwa der SDS oder der VALTS, sowie alle Wörterbücher keine Sprecheräußerungen, sondern Formen, die von den Herausgebern bereits typisiert wurden, so dass es nicht möglich ist, bis auf die Tokens zurückzugehen.

(auct. Thomas Krefeld)

Tags: Linguistik



Interlinguale Geolinguistik (Zitieren)

Zu den Zielen dieses Portals gehört es, die prägende Kraft des Sprachkontakts und speziell seine ethnolinguistische Konditionierung bei der Entwicklung des alpinen Sprachraums herauszuarbeiten. Die Konzeption der Datenbank wird es erlauben, die erfassten Entlehnungen auch quantitativ in ihrer lokalen Kumulation abzubilden, denn sie ergeben sich automatisch dann, wenn die Zugehörigkeit des Informanten zu einer der drei Sprachfamilien nicht mit derjenigen des Etymons übereinstimmt.
Es sind, genauer gesagt, drei Sprachfamilien, die den neuzeitlichen Alpenraum in Gestalt unterschiedlich großer und vor allem unterschiedlich stark differenzierter Dialektkontinua prägen; die Verbreitungszonen der drei Sprachfamilien lassen sich übrigens nicht auf spezifische Staaten abbilden vgl. aktuelle Sprachgebiete. Das Germanische ist durch alemannische und bairische Varietäten vertreten, die der plurizentrischen deutschen Sprache zugerechnet werden; allerdings ist der gemeinsame Bezug auf die schweizerische, deutsche und österreichische Standardvarietät, der die Zugehörigkeit zu ein und derselben Sprachgemeinschaft überhaupt erst stiftet, bei manchen walserischen und altbairischen (zimbrischen) Sprachinseln auf der Alpensüdseite eigentlich nicht mehr gegeben.
Im Unterschied zum germanischsprachigen Teilgebiet kann man die Varietäten des romanischen Kontinuums mehreren Sprachen zuordnen; neben dem Französischen und Italienischen handelt es sich dabei nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien um Okzitanisch, Frankoprovenzalisch, Rätoromanisch (im Sinne von Bündnerromanisch), Dolomitenladinisch und Friaulisch.
Das Slawische ist durch slowenische Dialekte vertreten, die außer in Slowenien auch in etlichen italienischen und österreichischen Gemeinden gesprochen werden. Zu den Zielen von VerbaAlpina gehört es jedoch nicht, die Dialekte des Alpenraums möglichst vollständig zu beschreiben, die lokalen oder regionalen Dialektgrenzen herauszuarbeiten und den Raum so gewissermaßen als Mosaik von Varietäten darzustellen. Vielmehr sollen durch die großräumige Anlage gerade die (vor allem lexikalischen) Merkmale hervortreten, die über die einzelnen Dialekt- und Sprachgrenzen hinweg verbreitet sind und so die ethnolinguistischen Gemeinsamkeiten hervortreten lassen.





Da Dialekte in sich vollständige sprachliche Systeme bilden, darf man im Hinblick auf die gemeinsame Untersuchung der drei 'genetisch' verschiedenen Kontinua sagen, dass der Sprachkontakt hier in Gestalt einer interlingualen Geolinguistik untersucht wird.

(auct. Thomas Krefeld)

Tags: Linguistik



Kartographie (Zitieren)

Die Kartographie ist ein vielleicht nicht ganz unumstrittenes, aber gut bewährtes Verfahren der Sprachgeographie, denn sie dient gleichermaßen der Dokumentation wie der Visualisierung räumlicher Relationen (vgl. die Beiträge in Lameli 2010). Die üblichen Verfahren unterscheiden sich deutlich in ihrer Prägnanz; im Fall so genannter ‘analytischer’ Karten werden sprachliche (Teil-)Äußerungen wiedergeben, so dass die Dokumentation stark im Vordergrund steht und die Aufdeckung der eigentlich räumlichen Beziehungen zwischen den dokumentierten Formen dem Leser überlassen bleibt. Bei den so genannten Punktsymbolkarten werden dagegen durch die ‘synthetische’ Symbolvergabe direkt die räumlichen Relationen zwischen einzelnen Äußerungsaspekten zum Ausdruck gebracht. Quantitative Verhältnisse lassen sich nur so wiedergegeben. Die Online-Kartierung von VerbaAlpina erfolgt auf georeferenzierter Grundlage und kombiniert beide Verfahren, insofern sie zwar auf den ersten Blick ‘synthetische’ Karten anzeigt, auf den zweiten Blick, nach Klick auf das Symbol, jedoch Zugriff auf die (Teil-)Äußerung gibt.
Das heuristisches Potential der Kartographie ist beachtlich; daher wird dem Nutzer von VerbaAlpina die Option angeboten, unterschiedliche Datenklassen aus einer Kategorie (z. B. mehrere Basistypen) oder aus den unterschiedlichen Kategorien (z. B. außersprachliche und sprachliche Daten) auf synoptischen Karten zu kombinieren und zu kumulieren.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist.

Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Thomas Krefeld)

Tags: Linguistik Webseite Außersprachlicher Kontext



Kontinuität (Zitieren)

Der Frage nach der Überlieferungskontinuität kommt bei der Rekonstruktion mehrsprachiger Kommunikationsräume eine zentrale Bedeutung zu; sie muss im Sinne einer datengeleiteten, induktiven Vorgehensweise interdisziplinär bearbeitet werden. Selbst mit vereinten Kräften mehrerer Disziplinen sind allerdings im Blick auf die vorrömischen Substrate des Alpenraums kaum Antworten zu erwarten. Viel besser ist die Ausgangslage in Bezug auf das romanische Substrat des mittlerweile deutsch- und slowenischsprachigen Teilgebiete. Der Sprachwechsel vom Romanischen zum Deutschen ist ja geradezu eine historische Konstante, die sich in Graubünden sogar aktuell noch beobachten lässt. #Karte der Germanisierungsphasen des ganzen Alpengebiets?# Die Prozess beginnt bereits mit dem Zusammenbruch der römischen Infrastruktur (im Jahre 476); die unmittelbar folgende Periode ist für die Sprachgeschichte von größtem Interesse; sie ist allerdings schriftlich äußerst spärlich dokumentiert, so dass die Kooperation mit anderen historischen Fächern, insbesondere mit der Archäologie, unerlässlich ist. Hier klaffen zwar noch große Forschungslücken, aber mit Weindauer 2014 liegt immerhin eine Aufarbeitung der archäologischen und onomastischen Quellen (6.-8. Jh.) des südlichen Oberbayern, des Salzburger Raums sowie des Tiroler Inntals vor. Demnach kann man "eine längere, grundlegende Siedlungsunterbrechung zwischen Römer- und Bajuwarenzeit" ausschließen, denn alles spricht für "einen fließenden Übergang der Besiedlungsstruktur von der Spätantike zum Frühmittelalter" (Weindauer 2014, 248). Gleichwohl bleibt im Hinblick auf die empirische Absicherung ein gradueller Unterschied zwischen den genannten Gebieten: "Was bezüglich des Zusammenhangs spätantiker und frühmittelalterlicher Fundstellen für das oberbayerische Alpenvorland noch überwiegend theoretisch galt {...}, findet in den österreichischen Gebieten seine nachweisliche Bestätigung: Die frühmittelalterlichen Ortsgründungen des 6. Jhs. orientieren sich fast ausschließlich an spätrömischer Infrastruktur bzw. – soweit noch vorhanden – an der romanischen Siedlungsstruktur." (Weindauer 2014, 257)

(auct. Thomas Krefeld)

Tags: Linguistik



Konzept (Zitieren)

Der Bereich der Konzepte (oder: Onomasiologie) ist vielfältig; vorgegeben sind die drei thematischen Domänen:
- Traditionelle Alltagswelt,
- Natürliche Umwelt,
- Moderne Alltagswelt,
die jedoch für die Organisation der Daten nur eine sehr allgemeine Bedeutung haben. Auf der Ebene der Datenbank sind vielmehr solche Ordnungsprinzipien relevant, die es erlauben Relationen zwischen den einzelnen Konzepten festzulegen. Zunächst lassen sich alltagsweltliche Kategorien durch Konzepte sehr unterschiedlichen Abstraktions-, bzw. Spezifikationsgrads erfassen, so dass sich taxonomische Hierarchien ergeben. Zwischen Konzepten, die auf unterschiedlichen hierarchischen Ebenen liegen, bestehen strenge
(1) Inklusionsrelationen
in der Weise, dass jede Definition eines Unterbegriffs die Definition ihres Oberbegriffs enthält und spezifiziert. Dazu das Beispiel einer konzeptuellen Kategorie:
- Oberbegriff: GEBÄUDE
- Unterbegriff der 1. Ebene: SENNHÜTTE, STALL, KÄSEKELLER usw.
- Unterbegriff der 2. Ebene: SENNHÜTTE AUS STEIN, SENNHÜTTE AUS HOLZ, SENNHÜTTE AUS HOLZ MIT UNTERBAU AUS STEIN usw.
Während jede Sennhütte usw. auch ein Gebäude ist, gilt das Umgekehrte selbstverständlich nicht. Das jeweils inkludierte Konzept ist abstrakter und insofern bei Darstellung in Gestalt von Baumgraphen auch übergeordnet.
Zwischen den hierarchisch gleichgeordneten Konzepten auf ein- und derselben Ebene bestehen dagegen stets:
(2) Exklusionsrelationen
Eine Sennhütte ist weder ein Stall, noch ein Käsekeller.
Ganz anders ist dagegen die Hierarchie, die sich ergibt, wenn komplementäre Konzepte einen komplexen Funktionszusammenhang bilden, der ebenfalls als Konzept gefasst werden muss. Hier spricht man von
(3) Teil-Ganzes-Relationen.
So gehören zum umfassenden Konzept ALM (als Ganzes) unterschiedliche Sektionen, das GELÄNDE, das VIEH, die GEBÄUDE, das PERSONAL und die TÄTIGKEITEN, insbesondere die MILCHVERARBEITUNG (Teile). Teil-Ganzes-Relationen sind einerseits hierarchisch (wie die Inklusionsrelationen), aber andererseits beruhen sie gerade nicht auf definitorischer Inklusion, sondern auf Exklusion. Baumgraphen sind für ihre Darstellung nicht geeignet.
Man vergleiche exemplarisch das Schema zur begrifflichen Sektionierung des Feldes ALMWESEN.





Im Bereich der Sektionen lassen sich wiederum Ganze und deren konstitutive Teile erkennen. So gehören zur PRODUKTION VON KÄSE (Ganzes) diverse TÄTIGKEITEN, PROZESSE, GERÄTE, GEFÄSSE, PERSONEN und GEBÄUDE (Teile).






(auct. Thomas Krefeld)

Tags: Linguistik



Konzeptbeschreibung (Zitieren)

Die Konzepte werden in der Tabelle KONZEPTE der Datenbank am Beispiel des Deutschen wie folgt erfasst: Existiert eine lexikalisierte Bezeichnung für ein Konzept, so wird diese im Datenbankfeld 'Name_D' eingetragen. Bei fehlender Lexikalisierung bleibt dieses Feld leer. Unabhängig davon wird im Feld 'Beschreibung_D' das Konzept genauer spezifiziert bzw. definiert. Dies erfolgt nach einer festgelegten Vorgehensweise, die am Beispiel des Konzepts 'MILCHKANNE' (ID_Konzept 610) demonstriert wird: Das eben genannte Konzept wird mit einem spezifischen Lexem bezeichnet, daher wird MILCHKANNE in 'Name_D' eingetragen. Die Beschreibung sieht folgende hierarchische Reihenfolge vor: Gerät, Zweck, Material, Form (evtl.). Angewendet auf das Konzept ergibt sich also die Beschreibung: GEFÄSS, ZUM AUFBEWAHREN VON MILCH, AUS METALL. Falls möglich bzw. nötig sollen weiterhin diese zusätzlichen Regeln befolgt werden: Zahlen von 1-10 werden ausgeschrieben, zum Wiedergeben eines Prozesses, einer Handlung usw. kann entweder 'zu+Artikel+Infinitiv (substantiviertes Verb)' oder 'für+Substantiv' verwendet werden. Das Einhalten dieser Muster ermöglicht analoge Übersetzungen, die Bildung sprachunabhängiger Kategorien auf unterschiedlichen Abstraktionsebenen (-> GEFÄSSE -> GEFÄSSE ZUR AUFBEWAHRUNG -> GEFÄSSE AUS METALL usw.), automatisierte Korrekturen bzw. Änderungen und eine transparente Suche. Alle Konzepte werden auf diese Weise auf Deutsch, Italienisch, Französisch, Slowenisch und Rätoromanisch erfasst.

(auct. Giorgia Grimaldi | Thomas Krefeld)

Tags: Informationstechnologie



Kooperation (Zitieren)

Zusammenarbeit mit anderen Projekten ist für die Konzeption von VerbaAlpina grundlegend; sie spiegelt sich in zahlreichen Kooperationsvereinbarungen mit Projektpartnern wider. Ihre Umsetzung ist de facto jedoch nicht immer einfach; sie wird durch praktische, d.h. vor allem informationstechnische und damit verbundene datenrechtliche Probleme, aber am Rande auch ein wenig durch ideologische Vorbehalte gegenüber der open source-Ausrichtung behindert. Jede Kooperation stützt sich auf eine formale Vereinbarung, die den Partnern (PVA) eine exklusiv nutzbare Datenbank zum Upload zusichert. Jede Partner-Datenbank steht allen Partnern zum Download zur Verfügung. Aber die Kooperation soll selbstverständlich nicht auf Datenaustausch beschränkt bleiben; vielmehr sind alle Partner eingeladen (und aufgefordert), alle Funktionsbereiche zu nützen.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Langzeitarchivierung (Zitieren)

Sämtliche VerbaAlpina-Projektdaten werden so verwaltet, dass diese über einen möglichst langen Zeitraum les- und verwendbar bleiben. Die ins Auge gefasste Perspektive umfasst dabei wenigstens mehrere Jahrzehnte, das zugrundeliegende Konzept ist letztlich jedoch auf eine Konservierung ohne zeitliche Befristung ausgerichtet.

Im einzelnen werden die folgenden Aspekte berücksichtigt:
1. Welche Institution(en) wird(/werden) mit der Bewahrung der Daten bzw. der betreffenden Datenträger betraut?
2. Dokumentation der Datenstrukturierung sowie der logischen Zusammenhänge zwischen Daten und Datenkategorien (Entity Relationship)
3. Dokumentation der verwendeten Zeichenkodierung(en)

Mehrere Kopien der Projektdaten sollen bei mehreren verschiedenen Institutionen archiviert werden. Derzeit sind dafür die IT-Gruppe Geisteswissenschaften der Ludwig-Maximilians-Universität München (ITG) mit deren Anbindung an die Archivierungsserver des Leibniz-Rechenzentrums sowie das BAS Clarin Repository vorgesehen. Es ist geplant, zusätzliche Sicherungskopien bei weiteren geeigneten Institutionen zu deponieren. Die Archivierung findet im Rhythmus der Versionierungen statt. Archiviert werden jeweils die Datenbank mit sämtlichen Projektdaten (Modul VA_DB zusammen mit dem Entity-Relationship-Modell) sowie das Web-Framework (VA_WEB), das für die Präsentation der Daten im Internet (inklusive der jeweiligen Funktionalität) zuständig ist, so dass, zumindest theoretisch, ein "Wiedererwecken" jeder einzelnen Version in entsprechenden emulierten Betriebssystem- bzw. Softwareumgebungen möglich ist. Archiviert wird ferner die Medienbibliothek, die hauptsächlich Photos, Filme, Text- und Tondokumente enthält (Modul VA_MT).

(auct. Stephan Lücke)

Tags: Informationstechnologie



Lizenzierung (Zitieren)

Die Module von VerbaAlpina (VA_DB, VA_WEB und VA_MT) und die darin enthaltenen Daten unterliegen im Wesentlichen den folgenden Creative Commons Lizenzen:




CC BY-SA 3.0 DE (http://creativecommons.org/licenses/by-sa/3.0/de/; "Namensnennung, Weitergabe unter gleichen Bedingungen") (objektabhängig) bzw.




CC BY-NC-SA 3.0 DE (http://creativecommons.org/licenses/by-nc-sa/3.0/de/; "Namensnennung, nicht kommerziell, Weitergabe unter gleichen Bedingungen").

Einzelne Mediendateien im VA-Modul VA_MT, die VA aus externen Datenquellen bekommen oder erworben hat, können auch dem Copyright unterliegen. Die Objekte im Modul VA_MT werden individuell mit entsprechenden Merkmalen versehen.

Das Lizenzierungssystem sowie die Zugriffsrechte der verschiedenen VA-Benutzergruppen werden durch die folgende Graphik dokumentiert:






(auct. Stephan Lücke)

Tags: Webseite



Module (Zitieren)

s. Versionierung

Tags: Informationstechnologie



Notation (Zitieren)

In den Textbeiträgen werden die folgenden, weitgehend üblichen Notationsprinzipien angewandt: objektsprachliche Formen (Belegbeispiele) werden kursiviert und sprachliche Bedeutungsangaben werden durch einfache Anführungszeichen markiert, z. B. ita formaggio 'Käse'. Außersprachliche Kategorien (Konzepte) werden durch Majuskeln repräsentiert. Der Unterschied zwischen sprachlicher Bedeutung und Konzept ist vor allem dann wichtig, wenn es in einzelnen Sprachen/Dialekten kein Wort für bestimmte Konzepte gibt, wie im Fall von KÄSE AUS DER FLÜSSIGKEIT NACH DER ERSTEN SCHEIDUNG DER FESTSTOFFE. Dafür sagt man ita ricotta, fra sérac, alemannisch Ziger usw.; ein hochdeutsches Wort fehlt jedoch.

(auct. Thomas Krefeld)

Tags: Linguistik Webseite



Öffentlichkeit (Zitieren)

Integraler Bestandteil von VerbaAlpina ist auch die direkte, verlagsunabhängige Publikation von Ergebnissen. Denn nicht alles, was Publikation genannt wird, dient der PUBLIKATION. So bewirkt das traditionelle Medium des Drucks mittlerweile das strikte Gegenteil: Es entzieht der Öffentlichkeit Informationen, die ihr angesichts der Forschungsförderung durch öffentliche Mittel in weitestmöglicher Weise gegeben werden sollten und die ihr bei Verwendung der Neuen Medien auch leicht so geliefert werden könnten. Die in den Wissenschaften üblichen papierenen Auflagen von 200 oder 300 Exemplaren schaffen nicht inklusive 'Öffentlichkeit', sondern exklusive Privatheit. Es gibt daher angesichts der leicht verfügbaren Informationstechnologie keinen stichhaltigen Grund, den Druck als Mittel der Wissensverbreitung zu bevorzugen oder absolut zu setzen.
In manchen Wissenschaftsdisziplinen (nach unserer Kenntnis trifft dies u. a. auf die Informatik zu) ist in den vergangenen Jahren gar ein Trend zu beobachten, der die mit den Neuen Medien einhergehenden technischen Möglichkeiten ad absurdum führt: Während es nunmehr eigentlich ein Leichtes ist, weltweit bequemen Zugang zu Informationen und Texten zu gewähren, geschieht auch dort das blanke Gegenteil, indem der entsprechende Zugang nur gegen Bezahlung freigegeben wird. Dies ist sogar ein Rückschritt gegenüber der von uns zuvor kritisierten traditionellen Publikation auf Papier. Wir warnen an dieser Stelle nachdrücklich vor derartigen Entwicklungen, die auch im Bereich der Geisteswissenschaften bereits ansatzweise zu beobachten sind.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Webseite



Onomasiologischer Rahmen (Zitieren)





(auct. Thomas Krefeld)

Tags: Linguistik



Quantifizierende Darstellungen (Zitieren)

[Vorbemerkung: Der nachfolgende Artikel nimmt in Teilen Bezug auf derzeit noch in Entwicklung befindliche Funktionalitäten von VA_WEB, die für die Öffentlichkeit derzeit noch nicht zugänglich sind.]

Die interaktive Online-Karte von VerbaAlpina erlaubt neben der qualitativen Kartierung auch die Visualisierung aggregierter Daten im Sinne einer quantifizierenden Abbildung der Daten im Raum. Die Aggregierung orientiert sich dabei stets an geographischen Regionen. Der Nutzer hat dabei die Auswahl zwischen Aggregierung auf Basis der Gemeindeflächen (Kleinraum), der sog. NUTS-3-Regionen (Mittelraum) und schließlich der Verbreitungsregionen der drei großen Sprachfamilien Germanisch-Romanisch-Slavisch (Großraum). Darüber hinaus besteht die Möglichkeit, beliebige Gemeindeflächen als individuelle Regionen zu definieren, die dann wiederum als Bezugsgröße der Aggregierung fungieren. Letztere Option kann verzerrenden Effekten entgegenwirken, die sich in der Perspektive der Aggregierung über die administrativ – und somit aus Sicht der Sprachwissenschaft sachfremd – motivierten Flächen der Gemeindegebiete oder der NUTS-3-Regionen ergeben. Im Einzelfall kann die entsprechende Vorgehensweise natürlich nur heuristisch sein, der Nutzer hat aber die Möglichkeit, einmal entdeckte sinnvolle regionale Kohärenzen abzuspeichern, zu kommentieren, wiederzuverwenden und der Allgemeinheit zur Verfügung zu stellen.

Bezogen auf die gewählten Regionen bzw. Flächen werden sodann sämtliche bis zur Aktivierung der quantifizierenden Darstellung ausgewählten qualitativen Daten aggregiert. Größe und Farbgebung der einzelnen Kartensymbole korrelieren dabei mit der Anzahl der jeweils in einem Symbol gebündelten qualitativen Einzeldaten. Der arithmetisch zugrunde gelegte Maximalwert, bei dessen Erreichen ein Symbol stets die jeweils maximale Größe und Farbgebung erhält, entspricht dabei standardmäßig der höchsten Anzahl an aggregierten Daten, der in einer der ausgewählten Flächen bzw. Regionen auftritt. Wahlweise kann dieser maximale Referenzwert auf die Gesamtanzahl der aggregierten Einzeldaten umgesetzt werden, was zu einer Änderung der Kartendarstellung führt.

Bei aktivierter Quantifizierung können durch Deaktivierung einzelner Listeneinträge in der Kartenlegende die entsprechenden qualitativen Daten aus der Berechnung der Quantitäten herausgenommen oder andere durch zusätzliche Auswahl hinzugenommen werden.

Neben der Quantifizierung vor dem Hintergrund einer georeferenzierten, die realen Grenzverläufe abbildenden Karte erlaubt VerbaAlpina auch die Darstellung quantifizierter Daten auf einer sog. Wabenkarte. Gestalterisches Vorbild ist eine Wikipedia-Grafik, die die Wahlergebnisse der britischen Unterhauswahl von 2015 visualisiert. Im folgenden ist zunächst die punkt-, längen- und winkeltreue Karte (im folgenden als "geographische Karte" bezeichnet) mit den Wahlergebnissen in den einzelnen Wahlkreisen wiedergegeben. Daran anschließend ist die Wabenkarte abgebildet, auf der jeder Wahlkreis durch ein Sechseck jeweils identischer Größe dargestellt ist.




Quelle: https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Quelle: https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (abgerufen am 03.11.2016)

Die Gegenüberstellung der beiden Kartentypen zeigt die jeweiligen Vor- und Nachteile. Die Wabenkarte weist geographische Ungenauigkeiten bzw. diesbezüglich sogar Fehlinformationen auf. So erkennt man z.B. im Distrikt Greater London eine isolierte rote Wabe, die von lauter blauen Waben umgeben ist – ein scheinbares Faktum, das jedoch keinen Rückhalt in der geographischen Karte findet. Auf der anderen Seite besitzt die Wabenkarte den Vorteil, die realen Zahlenverhältnisse zwischen den einzelnen Farben besser zu visualisieren, da eine Vielzahl von flächenmäßig sehr kleinen Wahlbezirken auf der geographischen Karte vom Betrachter als nachrangig wahrgenommen werden, obwohl die politische Bedeutung mit der der flächenmäßig großen Wahlbezirke gleichgestellt ist. Somit ergänzen sich die beiden Kartentypen und der eigentliche Mehrwert besteht in der Möglichkeit, beide Karten konsultieren und deren Visualisierung gegenüberstellen zu können.

Die Wabenkarte von VerbaAlpina zeichnet sich dadurch aus, dass sämtliche politischen Gemeinden im Alpenraum durch jeweils gleich große Hexagone abgebildet werden. Dabei wird versucht, die geographische Logik wenigstens ungefähr zu bewahren. Die Berechnung der Farbgebung der einzelnen Hexagone erfolgt dort in der gleichen Weise wie oben bei der Punktsymbolkarte beschrieben. Der Vorteil einer solchen Wabenkarte besteht gegenüber einer simplen Einfärbung der Gemeindeflächen auf einer georeferenzierten Karte darin, dass suggestive Effekte durch stark unterschiedliche Größe der Gemeindeflächen unterdrückt werden.

(auct. Stephan Lücke)

Tags: Informationstechnologie Webseite



Rätoromanisch (Zitieren)

Im Einklang mit der Bundesverfassung der Schweizerischen Eidgenossenschaft wird hier der Ausdruck 'Rätoromanisch' für die romanischen Varietäten Graubündens benutzt, die traditionell nicht zum Italienischen gerechnet werden (vgl. Gross 2004 und Liver 2010). Damit soll aber keineswegs die Zusammengehörigkeit dieses Bündnerromanischen mit dem Dolomitenladinischen und Friaulischen im Sinne einer gemeinsamen 'Sprache' behauptet werden; eben für dieses, heute nicht mehr tragbare Konzept wurde der Ausdruck 'Rätoromanisch' im 19. Jahrhundert von der Sprachwissenschaft ursprünglich geprägt. Die Idee als solche hat Graziadio Isaia Ascoli entwickelt und auf Italienisch als 'ladino' bezeichnet.

(auct. Thomas Krefeld)

Tags: Linguistik



Sprachatlanten im Alpenraum (Zitieren)

Von Westen nach Osten wird die alpine Dialektlandschaft durch die folgenden, teils noch nicht vollständigen Atlanten erschlossen:
  • Romania alpina: ALF, AIS (Details), ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
  • Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAO;
  • Slavia alpina: SLA.
Die große Zahl darf aber nicht über die erheblichen, teils durchaus überraschenden Diskrepanzen zwischen den einzelnen Atlanten hinwegtäuschen. So sind ausgerechnet manche Regionalatlanten, wie z. B. der ALD-II oder auch der BSA keineswegs besonders an ethnolinguistischen Daten interessiert. Gerade das Almwesen – das ja eine der grundlegenden Wirtschaftsformen des Alpenraums repräsentiert – wird so gut wie überhaupt nicht thematisiert; im ALD-II gibt es zwar (im Unterschied zum BSA) einen Stimulus 869 l'alpeggio 'Alm'/ la baita 'Sennhütte'. Aber schon ganz fundamentale Konzepte der Milchverarbeitung wie SENN (ita. casaro, caciaio), MELKEN (ita. mungere), LAB (ita. caglio), ENTRAHMEN (ita. scremare) und der Viehhaltung wie STALL (ita. stalla), HIRTE (ita. pastore), WEIDE (ita. pascolo) usw. fehlen (vgl. das Fragebuch).



(auct. Thomas Krefeld)

Tags: Linguistik



Sprachfamilien im Alpenraum (Zitieren)

Im Territorium der Alpenkonvention und damit im Untersuchungsgebiet von VerbaAlpina werden traditionell Sprachen aus drei Sprachfamilien gesprochen. Alle drei sind durch dialektale Kontinua repräsentiert, deren Ausdifferenzierung offenkundig auch von der Ausdehnung ihres Verbreitungsgebiets abhängt. Die Fragmentierung der romanischen Zone ist stärker als die der germanischen und diese wiederum als die der slawischen; über die dialektalen Verhältnisse informieren die einschlägigen Sprachatlanten, deren Erhebungspunkte hier zu einem umfassenden, mehrsprachigen Netz verknüpft werden. Auf der Ebene der übergeordneten Nationalsprachen bzw. regional implementierten Minderheitensprachen ist jedoch nur die Romania alpina weiter untergliedert. Denn neben dem Französischen und Italienischen sind hier nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien das Okzitanische, das im Aostatal politisch offizialisierte Arpitanische (oder: Frankoprovenzalische), das Rätoromanische, das Dolomitenladinische und das Friaulische zu nennen. Die Slavia alpina und die Germania alpina kennen dagegen mit dem Slowenischen und mit dem Deutschen jeweils nur eine Standardsprache. Was das plurizentrische Deutsche betrifft, sind allerdings mindestens für die Schweiz, für Deutschland und für Österreich koexistierende nationale Standardvarietäten zu unterscheiden.
Das Projekt zielt auf dialektale ('basilektale') Daten; standardsprachliche oder standardnahe ('akrolektale') Varianten werden nicht erhoben; sie können de facto aber jeder Zeit auftauchen, weil die korrespondierenden Dialektformen nicht mehr geläufig oder allenfalls noch passiv bekannt sind; dieser Fall ist in Bereich der traditionellen Lebenswelt nicht selten. Es kann aber ebenso sein, dass lokale Dialektvarianten niemals existiert haben; genau diese Konstellation wird in einer eventuell dritten Phase, in der die moderne Lebenswelt thematisiert werden soll, vermehrt erwartet (vgl. Onomasiologischer Rahmen). Es wäre jedoch zu einfach, die sprachliche Dynamik ausschließlich im Abbau diatopisch markierter Formen zu vermuten: Aktuell fehlende regionale oder lokale Formen schließen zukünftige Entstehungen keineswegs aus.

(auct. Thomas Krefeld)

Tags: Linguistik



Sprachkontakt (Zitieren)

Beim Sprachkontakt, zu dem auch der Varietätenkontakt gehört, sind zwei grundverschiedene Typen zu unterscheiden, je nachdem ob es sich – auf der Ebene des sprachlichen Systems – um feste, sprecherunabhängige Integrate ('Entlehnungen') oder aber – auf der Ebene des Sprechers – um indivuelle Erscheinungen handelt. Letztere wiederum können habitualisierten oder ganz okkasionellen Verwendungen, so genannten switchings, entsprechen. Dieser Vorbehalt ist auch bei der Interpretation älterer Atlasmaterialien immer dann zu berücksichtigen, wenn ein Informant eine standardnahe Form oder, in zweisprachigen Gebieten, eine Form der jeweiligen Zweitsprache liefert. Der theoretisch fundamentale Unterschied ist angesichts der sprachlichen Daten mehr oder weniger wahrscheinlich, jedoch eigentlich nie evident. Nur die Vermehrung der Informanten, die mit social media zu einer durchaus realistischen Option wird, verspricht hier zuverlässige Auskunft.



(auct. Thomas Krefeld)

Tags: Linguistik



Stratigraphie (Zitieren)

Die Alpen sind seit prähistorischer Zeit ein Gebiet vielfältiger Sprachkontakte, die auf ganz unterschiedliche Stratakonstellationen zurückgehen. Grundsätzlich werden Sprachen, die in einem Gebiet in Kontakt stehen, weil es dort mehr oder weniger viele zweisprachige Sprecher oder gar Sprechergemeinschaften gibt, als Adstrate bezeichnet. Falls ein Basistyp nur in einem bestimmten Gebiet verbreitet ist, also etwa in den Alpen, und in den betroffenen Sprachfamilien ansonsten nicht vorkommt, sind die Entlehnungsrichtung und die Herkunftssprache oft nicht eindeutig (vgl. den Basistyp rom. baita / dt. Beiz, Beisl).
Wenn die Herkunftssprache des entlehnten Elements im Verbreitungsgebiet, oder in einem Teil davon, nicht mehr gesprochen wird, werden zwei Konstellationen unterschieden: Im Fall des Substrats wurde die Herkunftssprache (Substratsprache) im Verbreitungsgebiet gesprochen, bevor ihre Überlieferungskontinuität abriss und die geltende Sprache sich durchsetzte; das Romanische ist eine Substratsprache des gesamten deutsch- und slowenischsprachigen Alpengebiets. Substratwörter setzen zwar Sprachwechsel voraus; sie zeichnen sich aber trotzdem oft durch außerordentliche regionale oder lokale Kontinuität aus.
Im Falle des Superstrats galt die Herkunftssprache während eines gewissen Zeitraums im Verbreitungsgebiet, ohne sich dort dauerhaft zu etablieren. So herrschten in Teilen des heute romanischsprachigen Alpenraums nach dem Zusammenbruch der römischen Infrastruktur zeitweise germanische Superstrate (Gotisch, Langobardisch) und in Slowenien spielte das Deutsche während der Habsburgerzeit diese Rolle.
Zwischen den drei Sprachfamilien haben sich nun durchaus unterschiedliche Szenarien ergeben; hinsichtlich der Bedeutung des Sprachkontakts für die Geschichte des sprachlichen Raums ist vor allem die Chronologie der Entlehnung wichtig: Handelt es sich beispielsweise bei Romanismen im germanischen und slawischen Sprachraum um Substratwörter mit regionaler Überlieferungskontinuität seit der Antike oder um jüngere adstratale Übernahmen? Dieselbe Frage gilt mutatis mutandis ebenso für die Germanismen im romanisch- bzw. slawischsprachigen und die Slawismen im deutsch- und romanischsprachigen Raum.
Entlehnungen sind ein zuverlässiger Indikator historischer Akkulturationsprozesse; deshalb ist eine quantitative Darstellung angebracht, die es gestattet, die relative Häufigkeit der belegten Entlehnungen ortsgenau abzubilden. Die Akkulturationsrichtung ist jedoch keineswegs immer eindeutig; nicht selten koexistieren in eng definierten onomasiologischen Bereichen gegenläufige Entlehnungen. Die folgende Graphik schematisiert die stratigraphische Herausforderung. Sie differenziert die drei heute romanisch-, deutsch- und slowenischsprachigen Gebiete nach Substrat- und Superstratsprachen und symbolisiert (durch Kugeln) die mehrsprachigen Sprechergruppen in Adstratkonstellationen. Gleichzeitig wird die besondere historische Bedeutung der Romanisierung verdeutlicht (vgl. Märtin 2017, 102-129), die – wenn auch in sehr unterschiedlicher Intensität – den gesamten Alpenraum erfasste und deshalb wohl auch alles Ältere vermittelte. Direkter Kontakt zwischen Sprechern vorrömischer Sprachen und Sprechern der das Lateinisch-Romanische gebietsweise überdeckenden nachfolgenden Sprachen (Slawisch und Germanisch) kann zwar nicht kategorisch ausgeschlossen werden; diese Annahme ist jedoch sicherlich problematisch.




(auct. Thomas Krefeld)

Tags: Linguistik



Synoptische Karte (Zitieren)

Diese Funktion erlaubt es dem Nutzer, eine getroffene Auswahl an Karten auf einer synoptischen Kombinationskarte zu fixieren . So können die Verbreitungsgebiete beliebiger sprachlicher und außersprachlicher Merkmale im Zusammenhang visualisiert werden. Gleichzeitig besteht die Möglichkeit, diese synoptischen Karten in Zoomstufen festzuhalten, wenn ein lokaler Kontext, wie z.B. das Karwendel oder das okzitanisch-frankoprovenzalisch-piemontesische Dialektkontinuum der Westalpen, dokumentiert werden soll.

(auct. Thomas Krefeld)

Tags: Webseite



Transkription (Zitieren)

Die sprachlichen Materialien werden graphisch in doppelter Weise wiedergegeben, um den beiden gegenläufigen Prinzipien der Quellentreue und der leichten Vergleichbarkeit gerecht zu werden:
(1) Inputversion in der Originaltranskription
Im VA-Portal werden Quellen zusammengeführt, die aus unterschiedlichen Fachtraditionen stammen (Romanistik, Germanistik, Slavistik) und die historisch unterschiedliche Phasen der dialektologischen Forschung repräsentieren; manche Wörterbuchdaten wurden zu Beginn des letzten Jahrhunderts (GPSR) und andere erst vor wenigen Jahren (ALD) erhoben. Deshalb ist es wissenschaftsgeschichtlich notwendig, die Originaltranskription weitestgehend zu respektieren. Aus technischen Gründen ist es allerdings unmöglich, bestimmte Konventionen unverändert zu erhalten; das gilt insbesondere für die vertikale Kombination von Basiszeichen (‘Buchstaben’) und diakritischen Zeichen, also etwa dann, wenn ein Betonungsakzent über einem Längenzeichen über einem Vokal über einem Schließungszeichen positioniert ist (Betacode). Diese Konventionen werden in jeweils definierten technischen Transkriptionen in lineare Folgen von Zeichen überführt, wobei ausschließlich ASCII-Zeichen benutzt werden (so genannter Betacode). Bis zu einem gewissen Grad können bei der Beta-Kodierung intuitiv verständliche graphische Ähnlichkeiten zwischen den Originaldiakritika und den ASCII-Entsprechungen ausgenützt werden; sie sind mnemotechnisch günstig.

(2) Outputversion in IPA
Im Sinne der Vergleichbarkeit und auch der Nutzerfreundlichkeit ist zudem die Ausgabe in einer einheitlichen Transkription wünschenswert. Alle Beta-Codes werden daher mit spezifischen Ersetzungsroutinen in IPA-Zeichen überführt. Einige wenige, aber unvermeidbare Unverträglichkeiten ergeben sich vor allem dann, wenn einem, durch Diakritika spezifizierten Basiszeichen in der Inputtranskription in IPA zwei unterschiedliche Basiszeichen entsprechen. Das gilt vor allem im Hinblick auf die Öffnungsgrade der Vokale, wo z. B. in der palatalen Reihe die beiden Basiszeichen <i> und <e> in Verbindung mit Schließungspunkt und einem oder zwei Öffnungshäkchen es erlauben, sechs Öffnungsgrade abzubilden; in Beta-Kodierung sind das: i – i( – i((– e?-- e – e(– e((. Dafür stehen in IPA nur vier Basiszeichen i – ɪ – e – ɛ zur Verfügung.


(auct. Thomas Krefeld)

Tags: Linguistik Informationstechnologie



Typisierung (Zitieren)

Die 'Interaktive Karte' bietet dem Nutzer die Möglichkeit, nach drei verschiedenen sprachlichen 'Typen' zu suchen. Jeder 'Typ' ist als eine Klasse von sprachlichen Ausdrücken zu verstehen; dadurch soll die unübersichtliche Vielfalt der zahlreichen sprachlichen Varianten in überschaubarer Weise strukturiert werden. Es werden phonetische, morphologische und – im Fall des 'Basistyps' – sprachgeschichtliche Kriterien eingesetzt. Die Typisierung der georeferenzierten Sprachdaten gehört zu den grundlegenden Anforderungen von VerbaAlpina. Dazu werden, wo dies möglich ist, aus den Inputdaten nach der Transkription in einem ersten Schritt Tokens ('Einzelwörter') extrahiert und in das gleichnamige Datenbankfeld eingetragen.

Im Zentrum des Interesses von VerbaAlpina steht die morphologische Typisierung des gesammelten Sprachmaterials. Ein morphologischer Typ wird dabei durch Übereinstimmung der folgenden Eigenschaften definiert: Sprachfamilie – Wortart – einfaches Wort vs. affigiertes Wort – Genus – lexikalischer Basistyp. Die Nennform des morphologischen Typs schließlich orientiert sich an den korrespondierenden Lemmata ausgewählter Referenzlexika (s.u.).

Durch die Zuweisung zu einem gemeinsamen lexikalischen Basistyp wird die Zusammengehörigkeit aller vereinigten morpho-lexikalischen Typen klar – auch über Sprachgrenzen hinweg. So lassen sich die folgenden (hier nicht im Detail beschriebenen) Nomina und Verben einem einzigen Basistyp malga zuweisen: malga (ALM, HERDE), malgaro (SENN), malghese (HIRTE), immalgare (ALM BEZIEHEN), dismalgare (ALM VERLASSEN). Allerdings sagt der lexikalische Basistyp nichts über die Wortgeschichte der einzelnen morpho-lexikalischen Typen aus: Ob ein Typ mit lateinisch-romanischem Etymon, der heute im germanischen oder slowenischen Sprachgebiet belegt ist, wie z. B. slowenisch bajta 'einfaches Haus', auf altes lokales Substrat zurückgeht oder aber auf neueren romanischen Sprachkontakt, muss jeweils einzeln herausgearbeitet werden. Aus diesem Grund wird die Bezeichnung "Etymon", die sich grundsätzlich auf die unmittelbare historische Vorstufe eines Wortes bezieht, in diesem Kontext vermieden – auch wenn in vielen Fällen der lexikalische Basistyp tatsächlich auch das Etymon eines morpho-lexikalischen Typs ist. Die Basistypen, die von den Referenzwörterbüchern als unbekannt oder umstritten gekennzeichnet sind, werden durch eine zusätzliche Voranstellung eines Fragezeichens markiert, wie im Biespiel: (?) battuere. Wenn im Prozess der Typisierung die Bestimmung des Basistyps nicht möglich ist, verwendet VerbaAlpina einen unbekannten Typ, der mit einem ? markiert wird.
Die morpho-lexikalischen Typen bilden die Leitkategorie in der Verwaltung der sprachlichen Daten; sie sind den Lemmata der Lexikographie vergleichbar. Mittels der oben genannten, robusten und gut operationalisierbaren Kriterien lassen sich z.B. die vier phonetischen Typen barga, bark, margun, bargun mit der Bedeutung ALMHÜTTE, ALMSTALL auf drei morpho-lexikalische Typen reduzieren:





Die Zugehörigkeit der morpho-lexikalischen Typen zu Sprachfamilien (germ., rom., slaw.) hängt von der jeweiligen Quelle ab; sie ergibt sich im Fall traditionell erhobener Atlas- oder Wörterbuchdaten automatisch über die jeweiligen Informanten und wird entsprechend in der Datenbank notiert. Zeigen einzelne Wörter in bestimmten Varietäten ein Suffix, das aber keinen Genuswechsel mit sich bringt, so wird kein gesonderter morpho-lexikalischer Typ angelegt (vgl. bair. Nom.Sg. die Wiesn vs. nhd. die Wiese), da die Bündelung der Belege im Vordergrund steht. Im Fall der Daten, die VerbaAlpina selbst durch Crowdsourcing erhebt, wird die Sprach- bzw. Dialektzugehörigkeit von den Informanten behauptet und im Idealfall quantitativ bestätigt; die Anzahl von bestätigenden Informanten wird so zu einem Instrument der Datenvalidierung.

Morpho-lexikalische Typen sind auf eine Sprachfamilie beschränkt. Es stellt sich nun die Frage, durch welche Form ein morpho-lexikalischer Typ in der Suchfunktion der interaktiven Karte repräsentiert werden soll. Im Hinblick auf die germanische und slawische Sprachfamilie fällt die Antwort eher leicht, da beide jeweils nur durch eine standardisierte Einzelsprache ('Deutsch' [deu] bzw. 'Slowenisch' [slo]) vertreten sind. Die morpho-lexikalischen Typen können in Gestalt ihrer standardsprachlichen Varianten abgebildet werden, selbstverständlich unter der Bedingung, dass es im Standard Entsprechungen des Typs gibt; so können beispielsweise alle entsprechenden phonetischen Typen des Alemannischen und Bairischen, die Varianten der Standardform sind, unter ebendieser Standardform aufgerufen werden. Falls Standardvarianten nicht existieren, werden die Lemmata der großen Referenzwörterbücher (Idiotikon, WBÖ) herangezogen.

Im Fall der romanischen Sprachfamilie ist die Situation wegen der zahlreichen, teils nicht hinreichend standardisierten Kleinsprachen sehr viel komplexer. Aus pragmatischen Gründen wurde hier der folgende Weg gewählt: Alle morpho-lexikalischen Typen werden, sofern vorhanden, durch die französischen und italienischen Standardformen repräsentiert; so können z. B. alle phonetischen Typen, die Varianten von beurre/burro 'Butter' sind, unter diesen beiden Formen aufgerufen werden; als Referenzwörterbücher fungieren u.a. TLF und Treccani. In entgegengesetzter Perspektive werden jeder Einzeläußerung alle drei Typen, ein Konzept sowie ein Verweis auf ein Referenzwörterbuch zugeordnet: :



Falls nur eine dieser beiden Standardsprachen eine passende Variante hat, erscheint nur diese, wie im Fall von ricotta (die Zugehörigkeit zum Italienischen wird durch die Notationskonvention -/ricotta angezeigt). Wenn in keiner der beiden romanischen Referenzsprachen eine Variante des Typs existiert, wird auf den Eintrag eines dialektalen Referenzwörterbuchs zurückgegriffen, etwa auf LSI. Für den Fall, dass keine verlässlichen Einträge in Dialektwörterbüchern verfügbar sind, schlägt VerbaAlpina einen Basistyp mitsamt grafischer Repräsentation ('VA') vor.

Im Gesamtkonzept und der technischen Umsetzung vorgesehen, jedoch peripher und demnach nicht konsequent umgesetzt, ist die phonetische Typisierung des Sprachmaterials. Die entsprechende Kategorie ist vor allem deswegen unentbehrlich, weil Sprachatlanten bisweilen (z. B. SDS und VALTS) und Wörterbücher ausschließlich phonetische Typen dokumentieren. Bei der phonetischen Typisierung durch VerbaAlpina werden die Tokens nach Kriterien der historischen Phonetik in phonetische Typen eingeteilt (Datenbankfeld 'phon_typ'). Dazu ein charakteristisches Beispiel (aus AIS 1204 LA PANNA | RAHM | CRÈME):




Nach Maßgabe der Phonetik ist es sinnvoll, die Anlautvarianten [kr-] und [gr-] sowie die Tonvokalvarianten [a], [e] und [o] vor [m] zu differenzieren. Sie erscheinen daher als unterschiedliche 'phonetische Typen'. Gleichzeitig ist es klar, dass es sich um lautliche Varianten ein und desselben morpho-lexikalischen Typs handelt, denn es gibt zahlreiche analoge Fälle von Lautwandel. Da sich jedoch keinerlei Evidenz für einen Wandl von [kr-] > [br-] findet, wäre es nicht sinnvoll die entsprechenden dolomitenladinischen Formen (brama) ebenfalls dazu zu stellen. Sie repräsentieren daher trotz der Ähnlichkeiten im Tonvokal und im Silbenauslaut [-ama] einen anderen morpho-lexikalischen Typ.


Eine Automatisierung der phonetischen Typisierung auf Basis von Levenshtein- und soundex-Algorithmen wird untersucht und wenn möglich umgesetzt werden; allerdings wird in jedem Fall ein starker Korrekturaufwand entstehen. Etwa die beiden historisch zusammengehörigen Formen krama und gromma unterscheiden sich rein numerisch im Sinn der Levenshtein-Distanz durch Menge an Zeichenersetzungen die durchgeführt werden müssen, um eine Form in die andere zu transformieren, stärker als die nicht zusammengehörigen Formen krama und brama.



Durch die Typisierung (Klassenbildung) wird die Datenvielfalt zunehmend übersichtlich; es gilt also in der Regel: Zahl der Tokens > Zahl der phonetischen Typen > Zahl der morpho-lexikalischen Typen > Basistyp. Man beachte jedoch den Extremfall eines einzigen Belegs (Hapax), der einem Token, einem phonetischem Typ und einem morpho-lexikalischen Typ als einzigem Vertreter eines Basistyps entspricht. U.U. ist es sinnvoll, solche Hapax-Formen in der Darstellung herauszufiltern.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Linguistik



Uniform Resource Name (URN) (Zitieren)

s. Digital Object Identifier

Tags: Informationstechnologie



Untersuchungsgebiet (Zitieren)

"Eine umfassende und kohärente Geschichte der Alpen wurde bisher noch nicht vorgelegt" (http://www.hls-dhs-dss.ch/textes/d/D8569.php); vielmehr konkurrieren unterschiedliche, "naturräumliche" und "wirtschaftlich-politische Alpendefinitionen" (Bätzing 1997, 23 f.). Im Sinn einer transparenten und pragmatischen Abgrenzung wurde das Untersuchungsgebiet dieses Projekts mit dem klar umrissenen Geltungsbereich der Alpenkonvention gleichgesetzt; die dort festgeschriebenen "Inkonsistenzen zwischen den Mitgliedstaaten" (Bätzing 1997, 31) wurden in Kauf genommen; sie betreffen das bayerische Alpenvorland (eingeschlossen), "größere randalpine Gebiete wie das Emmental oder das Zürcher Oberland" ((Bätzing 1997, 32), ausgeschlossen) sowie den Umgang mit einigen wichtigeren Städten am Alpenrand: Luzern und Salzburg sind eingeschlossen, Graz und Biella dagegen ausgeschlossen. Der Perimeter der Alpenkonvention kann hier heruntergeladen werden. Das eigentliche Ziel des Projekts ist es jedoch, die Alpen in diesem formal abgesteckten Rahmen als sprachlich-kulturellen Raum zu erfassen und die Ähnlichkeit der zugehörigen Orte abzubilden.

(auct. Thomas Krefeld)

Tags: Außersprachlicher Kontext



Versionierung (Zitieren)

VerbaAlpina besteht aus folgenden Modulen:





- VA_DB: Datenbestand in der (MySQL-)Projekt-Datenbank (va_xxx)
- VA_WEB: Programmcode der Webschnittstelle des Projektportals www.verba-alpina.gwi.uni-muenchen.de samt zugehöriger Wordpress-Datenbank (va_wp)
- VA_MT: Mediendateien (Photos, Filme, Text- und Tondokumente), die sich in der Medienbibliothek der Webschnittstelle befinden

Alle drei Module bilden ein konsistentes Ganzes mit wechselseitigen Verknüpfungen und Abhängigkeiten und können daher nicht voneinander getrennt werden. Während der Projektlaufzeit wird in regelmäßigen Abständen simultan der jeweils aktuelle Status der Module VA_DB und VA_WEB in Gestalt einer elektronischen Kopie gleichsam "eingefroren". Diese eingefrorenen Kopien erhalten Versionsnummern nach dem Schema [Kalenderjahr]/[laufende Nummer] (z .B. 15/1). Die jeweils produktive VA-Version erhält die Bezeichnung XXX.

Die Erzeugung von Kopien der VA-Mediathek (VA_MT) verbietet sich aufgrund der üblicherweise enormen Größe von Mediendateien. Aus diesem Grund wird von diesem Modul im Zuge eines Versionierungsvorgangs keine Kopie erzeugt. Einmal dort abgelegte Elemente können daher, sofern auch nur eine einzige VA-Version mit ihnen verknüpft ist, nicht aus der VA-Mediathek entfernt werden.

Im Projektportal besteht die Möglichkeit, zwischen der jeweils "produktiven" und daher ständigen Änderungen unterworfenen VA-Version sowie den archivierten, "eingefrorenen" Versionen zu wechseln. Im Projektportal wird durch geeignete Farbgebung des Hintergrunds bzw. bestimmter Bedienelemente angezeigt, ob man sich in der produktiven oder einer archivierten Version von VA befindet. Zitierfähig sind *ausschließlich* die archivierten Versionen von VA.

Titelbilder älterer VerbaAlpina-Versionen:

15/1

15/2

16/1

16/2

17/1

17/2

18/1



(auct. Stephan Lücke)

Tags: Informationstechnologie



Wissenschaftskommunikation im Web (Zitieren)

VerbaAlpina kann als eine webbasierte raumorientierte Forschungsumgebung beschrieben werden. Dieses Format wird bestimmt durch die aktuellen Rahmenbedingungen, die sich ganz erheblich von der traditionellen Wissenschaftskommunikation unterscheiden. In allen Disziplinen, die in ‚klassischer‘ Weise mit empirischen Daten arbeiten, lassen sich drei einander folgende Phasen unterscheiden:
  1. Der Wissenschaftler sucht Informanten.
  2. Die Informanten liefern dem Wissenschaftler Rohdaten.
  3. Der Wissenschaftler gibt eine bestimmte Menge der erhobenen Daten, die im Lichte theoretischer Annahmen selektiert und modelliert wurde, an ein im Wesentlichen wissenschaftliches Publikum weiter.
Die Kommunikation in den drei Phasen verläuft unidirektional und zielt auf in sich abgeschlossene, dinghafte Publikationen, d.h. auf gedruckte Bücher.

Die drei Schritte der traditionellen Wissenschaftskommunikation

Die Neuen Medien haben die Rahmenbedingungen für die Wissenschaftkommunikation revolutioniert: die skizzierte Unidirektionalität der Informationsflusses ist ebenso aufgehoben wie die Bindung der Rolle (INFORMANT, AUTOR, LESER) an unterschiedliche Personen; grundsätzlich kann sich ein und dieselbe Person in schnell wechselnden Funktionen an der Kommunikation beteiligen. Von Grund auf verändert ist im Hinblick auf die Kommunikanten die Funktion INFORMANT, da die Behandlung der gelieferten Daten transparent bleibt und kontinuierlich verfolgt werden kann. Der INFORMANT wird so zum LESER seiner eigenen DATEN – ganz unabhängig davon, ob er die wissenschaftliche Intention überhaupt versteht; gleichzeitig eröffnet sich ihm die Möglichkeit, dazu als AUTOR Stellung zu nehmen. Nicht weniger radikal verändert sich unter diesen Bedingungen der Status Daten selbst, da sie in grundsätzlich dynamischen Datenbank abgelegt werden, deren Umfang und Struktur Veränderungen unterworfen bleibt.


Wissenschaftskommunikation unter den Bedingungen des Internet

In diesem Sinn sind in VerbaAlpina unterschiedliche, aber eng miteinander verflochtene Funktionsbereiche angelegt.

(auct. Thomas Krefeld)

Tags: Webseite



Wissenshorizont (Zitieren)

Dieses Portal informiert in drei unterschiedlichen Dimensionen:
(1) über außersprachliche Realität (‘Sachen’),
(2) über Konzepte, oder: inhaltliche, bzw. onomasiologische Kategorien, die nicht an einzelne Sprachen oder Dialekte gebunden sind,
(3) über sprachliche Ausdrücke der untersuchten Sprachen und Dialekte.
Die getrennte Behandlung von (2) und (3) ist grundlegend, da ja die relevanten Konzepte durchaus nicht immer im gesamten Untersuchungsgebiet mit spezifischen Bezeichnungen belegt (‘lexikalisiert’) sind; so gibt es z. B. in weiten Teilen des bairischen Gebiets kein Wort für den aus Molke hergestellten so genannten Käse (vgl. dafür alem. Ziger, ital. ricotta, fr. sérac), während es z.B. für die frische, noch ungeformte Käsemasse (bair. Topfen, dt. Quark) in den romanischen Dialekten oft, so wie auch im Standarditalienischen, keine Bezeichnung gibt. Das Verhältnis von (1) auf der einen Seite und (2) und (3) auf der anderen ist gelegentlich auch problematischer als es auf den ersten Blick erscheint; so finden sich manchmal sprachliche Ausdrücke mit unklarem semiotischen Status, weil aus den Belegen nicht hervorgeht, ob es sich um Bezeichnungen von Konzepten oder aber womöglich um Namen für Dinge handelt; das ist z. B. der Fall, wenn ein Sprecher eine ganz bestimmte Alm, etwa diejenige, die er selbst nutzt, mit einem generischen Wort als munt wörtlich ‘Berg‘ oder als pastüra ‘Weide‘ tituliert.


(auct. Thomas Krefeld)

Tags: Linguistik Außersprachlicher Kontext



Zitierweise (Zitieren)

Den Nutzerinnen und Nutzern von VerbaAlpina wird folgende Zitierweise der bereitgestellten Sprachdaten empfohlen:

  • Eintrag von VerbaAlpina in einer Bibliographie
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de,[Version].

Die Nennung des Datums des letzten Zugriffs ist entbehrlich, da die Zitierversionen (im Unterschied zur Arbeitsversion XXX) stabil sind und nicht mehr verändert werden (vgl. Versionierung).

Beispiel:
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.

  • Zitat eines Methodologiebeitrages:
[Autor/en]: s.v. “[Lemma]”, in: VA-[Sprachkürzel nach ISO 639-1] [Version], Methodologie, [URL des Glossareintrags].

Beispiel:
Krefeld, T. / Lücke, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.

Als Autoren sind stets die unter dem Glossareintrag aufgeführten und mit "auct." gekennzeichneten Personen zu nennen.

  • Zitat eines Einzelbelegs:
[zitat]|[kategorie]|[Ort]|[Quellenkürzel]#[Referenz]|VA_[Version]

Beispiele:
Hütte|morphTyp|Herisau|SDS#VII_244_1|VA_15/1
Chääsera|phonTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Käserei|BasisTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1

Hinweis 1: Das Trennzeichen Pipe | erhalten Sie auf Windows-Computern durch Drücken von Strg+Alt zusammen mit der Taste, auf der sich neben der Pipe die Größer/Kleiner-Zeichen <> befinden. Auf Apple-Geräten ist die Tastenkombination Alt+fn+7 zu drücken.
Hinweis 2: Die folgenden Sprachkürzel nach ISO 639-1 sind zu verwenden: für Deutsch de, für Französisch fr, für Italienisch it, für Rätoromanisch rm, für Slowenisch sl.

(auct. Stephan Lücke | Susanne Oberholzer)

Tags: Webseite