Methodologie

Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Abkürzungen (Zitieren)

In den Textbeiträgen, die unter den Menüpunkten "Methodologie" und "Lexicon Alpinum" erscheinen, sind oft Abkürzungen enthalten, die teilweise nicht selbsterklärend sind. Aus diesem Grunde wurde ein Abkürzungsverzeichnis erstellt, das die Bedeutung der einzelnen Abkürzungen erklärt und dem Leser dadurch ein besseres Verständnis der Inhalte ermöglicht. Analog zu den Sprachen, in denen die Webseite von VerbaAlpina aufgerufen werden kann, wurde das Abkürzungsverzeichnis für die Sprachen Deutsch, Italienisch, Französisch und Slowenisch erstellt. Abkürzungen, die in Zitaten vorkommen, sind nicht in Betracht gezogen worden.

Gleichzeitig wurden in den Texten alle Sprachkürzel an die ISO-Normen 639-3 (Einzelsprachen) und 639-5 (Sprachfamilien) angepasst und diese folglich in das Abkürzungsverzeichnis aufgenommen.

Bibliographische Abkürzungen


Mehrbändige Referenzwerke erhalten eine Sigle (z.B. AIS). Andere, in der Bibliographie vollständig aufgenommene Titel werden mit dem Autornamen und dem Jahr der Erscheinung abgekürzt zitiert (z.B. Baer 2000). Zwei Namen werden mit Schrägstrich getrennt (z.B. Jaberg/Jud 1929), ab drei Namen wird "et al." verwendet.






(auct. Beatrice Colcuc | Thomas Krefeld | Stephan Lücke)

Tags: Webseite



Aktualisierung der Daten für die Visualisierung (Zitieren)

Um den durchgehenden Betrieb der interaktiven Karte möglichst zu gewährleisten, werden die Tabellen der Datenzugriffsschicht und die zugehörigen Hilfstabellen nur einmal täglich aktualisiert. Somit werden Änderungen in den sprachlichen Kerndaten bzw. den Daten der sprachbezogenen Peripherie im Normalfall erst am nächsten Tag auf der Karte sichtbar. Für eine sofortige Aktualisierung können die entsprechenden Prozeduren direkt in der Datenbank über SQL-Statements aufgerufen werden:

Sprachliche Kerndaten:
CALL zling();

Daten der sprachbezogenen Peripherie:
CALL zgeo();

(auct. Florian Zacherl)



Alpenkonvention (Zitieren)

Die Alpenkonvention ist ein völkerrechtlich bindender Vertrag, der im Jahr 1991 zwischen den Anrainerstaaten des Alpenraums geschlossen wurde (eine Ausnahme stellt Slowenien dar, das aufgrund der politischen Umbrüche erst zwei Jahre später dem Abkommen beigetreten ist). Im Wesentlichen geht es um die grenzüberschreitende Entwicklung des Alpenraums in einer Reihe von definierten Sektoren bei gleichzeitigem Schutz des Naturraums. Innerhalb der Alpenkonvention existiert für jeden der definierten Sektoren ein sog. Durchführungsprotokoll, durch das die Planung von Maßnahmen innerhalb des jeweiligen Sektors erfolgt. Insgesamt bestehen zur Zeit (2018) knapp zehn Durchführungsprotokolle, z.B. für die Bereiche Tourismus, Berglandwirtschaft oder Naturschutz und Landschaftspflege. Jedes Durchführungsprotokoll muss von den Mitgliedsstaaten der Alpenkonvention gesondert ratifiziert werden. Bislang haben nicht alle Mitgliedsstaaten sämtliche Durchführungsprotokolle ratifiziert. Das beschlussfassende Organ der Alpenkonvention ist die sog. Alpenkonferenz, die im Schnitt alle zwei Jahre tagt. Alle zwei Jahre wechselt auch der Vorsitz in der Alpenkonvention von einem Mitgliedsstaat zu einem anderen. Ständiges koordinierendes Organ der Alpenkonvention ist das "Ständige Sekretariat" mit Sitz in Innsbruck und einer Außenstelle in Bozen/Bolzano.
Die Alpenkonvention ist einer der offiziellen Kooperationspartner von VerbaAlpina. Aus methodischer Sicht besitzt die Alpenkonvention für VerbaAlpina insofern eine besondere Bedeutung, als die von der Alpenkonvention vorgenommene geographische und auf administrativen Grenzen basierende Definition des Alpenraums ("Perimeter der Alpenkonvention") von VerbaAlpina übernommen und als Untersuchungsraum festgelegt wurde. Diese technisch-bürokratische Abgrenzung ist aus methodischer Sicht unumgänglich, auch wenn man angesichts fließender Übergänge der sprachlichen und kulturellen Realität auf diese Weise in vielfacher Hinsicht nicht wirklich gerecht wird. Als Beispiel sei hier das in der Schweiz gelegene Emmental genannt, das sich knapp außerhalb der Grenzen der Alpenkonvention befindet und daher nicht von VerbaAlpina berücksichtigt wird, obwohl es mit seiner Milchwirtschaft den entsprechenden Wirtschaftsformen des Alpenraums sehr ähnlich ist. Auf der anderen Seite reicht das Gebiet der Alpenkonvention gerade im bayerischen Alpenvorland weit in die Ebene und damit in Regionen hinaus, die weit weniger mit den Verhältnissen im gebirgigen Bereich der eigentlichen Alpen vergleichbar sind als etwa das Emmental.

(auct. Stephan Lücke)



Alpenwörter (Zitieren)

Typisch alpine Realia (wie die GAMS, die ZIRBELKIEFER oder die ALM) werden oft durch vorrömische Substratwörter bezeichnet. Diese sprachliche Schicht wurde wohl zuerst von Jakob Jud ausführlicher beschrieben (man vergleiche dazu die bekannten Arbeiten von Jud 1911aJud 1911b, Jud 1924 sowie Stampa 1937); sie bildet den Kern der so genannten Alpenwörter. Allerdings ist der Ausdruck nicht ganz eindeutig, denn er wird von Otto von Greyerz 1933, der ihn wohl geprägt hat, und Johannes Hubschmid 1951, der ihn vor allem bekannt gemacht hat, etwas weiter gefasst: "Ich verstehe darunter Wörter, die Geländeformationen, Naturerscheinungen, Tiere und Pflanzen oder mit der menschlichen Tätigkeit zusammenhängende konkrete Begriffe bezeichnen, Wörter, die sich nur oder hauptsächlich in den Alpenmundarten erhalten haben, oder die zwar auf einem größeren Gebiet leben, aber in den Alpen häufig eine speziell 'alpine' Bedeutung zeigen. Alpenwörter können auch germanischen oder romanischen Ursprungs sein" (Hubschmid 1951, 7; vgl. zur Begriffsgeschichte neuerdings auch Rampl 2011, 131 ff.).

Der Ausdruck VerbaAlpina schließt ganz bewusst an diese Kategorie an, die sich als sehr hilfreich für eine Untersuchung der Mehrsprachigkeit erweist. Denn sie erlaubt es, diejenigen lexikalischen Einheiten zu identifizieren, die den alpinen Kulturraum sprachlich charakterisieren und die unterschiedliche Entlehnungsprozesse voraussetzen, ohne dabei jedoch einzelne Sprachen besonders zu fokussieren. Um das Konzept der verba alpina (oder: Alpenwörter) jedoch zu operationalisieren, muss es im Rahmen des Projekts präzisiert werden: Als 'alpin' werden einerseits diejenigen lexikalischen Typen bezeichnet, die eindeutige Entsprechungen in mehr als einer der drei traditionellen Sprachfamilien des Alpenraums haben und andererseits diejenigen, die zwar nur im Romanischen belegt sind, aber die sich nicht auf das Lateinische, sondern auf regionale, vorlateinische Substrate zurückführen lassen. Es ergeben sich nun sieben hybride Gruppen:

Mögliche Entsprechungen eines Alpenworts
Vorlateinisch Romanisch Germanisch Slavisch
x x x x ‘alpin’ im engeren Sinn
x x x ‘alpin’ im weiteren Sinn
x x x
x x
x x
x x
x x


(auct. Thomas Krefeld)

Tags: Linguistik



Analoge Sprachgeographie (Zitieren)

Die Wissensdimensionen, die im inhaltlichen Horizont von VerbaAlpina liegen, d.h. SACHEN, KONZEPTE und WÖRTER, werden in der analogen Präsentationsweise der traditionellen Sprachgeographie in der Regel sehr eng und oft in ganz unklarer Weise miteinander verquickt. Exemplarisch ist AIS 1192a LA CASCINA DI MONTAGNA (die Karte ist Bestandteil dieser VA-Karte). Der Kartentitel hat zunächst den Status eines Konzepts, nämlich GEBÄUDE, “wo ein gut ausgebildeter Käser (‘Senn’) mit Hilfspersonal die Milch sachgemäss zu Käse, Butter, Zieger verarbeitet”. Weiterhin erfährt man, dass es sich um einen Oberbegriff handelt, denn manche Sennhütten dienen gleichzeitig als Lagerraum für Milch und Käse, während in anderen Fällen dafür spezielle Milch- und Käsekeller zur Verfügung stehen, die wiederum angebaut oder freistehend sein können und häufig von einem Wasserlauf durchflossen werden. Ausserdem ist die “meist massive steinerne Sennhütte” von hölzernen zu unterscheiden usw. Es gibt, mit anderen Worten, eine ganze Typologie untergeordneter und spezifischerer Konzepte, ohne dass im einzelnen immer klar ist, welche Hütte mit dem jeweils auf der Karte belegten Wort gemeint ist. Das Konzept im Kartentitel ist also häufig unterspezifiziert, und an keinem Ort kann die Existenz anderer Bezeichnungen für spezifischere Hütten ausgeschlossen werden; Dialektwörterbücher bestätigen diesen Eindruck mit großer Regelmäßigkeit. Gleichzeitig kommen mit dem MILCH- und KÄSEKELLER andere Konzepte ins Spiel, die keine Unterbegriffe von SENNHÜTTE sind; ferner wird in derselben Legende auf das häufige Vorkommen von Ställen (für unterschiedliche Tiere, auch für Schweine) hingewiesen, auf ein drittes Konzept also. Bezeichnungen für diese weiteren Konzepte werden in der Regel nicht auf der topographischen Karte eingetragen, sondern am Rand in Form von Listen, die meist nur Belege für wenige Orte zeigen. Gleichzeitig kommt es nicht selten vor, dass auf den Listen polyseme Wörtern auftauchen, die in einzelnen Orten ganz andere Konzepte bezeichnen. Man vergleiche den Typ kort, der auf der Liste zum Konzept ALPSTALL in den AIS_Orten 107 und 109 belegt ist, obwohl er in einem der beiden Belege (Punkt 109) ein ganz anderes Konzept, nämlich den offenen LAGER- UND MELKPLATZ FÜR VIEH BEI DER ALMHÜTTE bezeichnet.





Dergleichen Inkonsistenzen müssen bei der digitalen Datenaufnahme unbedingt beseitigt werden; oberstes Gebot ist hier die scharfe Trennung der genannten inhaltlichen Dimension, sozusagen die systematische Dekonstruktion der gebotenen Information.





Im Zuge einer solchen Dekonstruktion ergibt die oben als Beispiel genannte Karte folgende Datensätze:

AIS 1192a, Stimulus LA CASCINA DI MONTAGNA; SENNHÜTTE
weitere Stimuli (= onomasiologisch eindeutige KONZEPTE): 8 (MILCHKELLER, KÄSEKELLER, LA CANTINA DA LATTE, MAIENSÄSSE, ALMSTALL, SCHLAFRAUM IN DER SENNHÜTTE, ANDERE ÖKONOMIEGEBÄUDE, DIE ALP WECHSELN)
mögliche untergeordnete KONZEPTE: 120
sprachliche Einzelbelege: 1032
Erhebungsorte: 134

Im Anschluss können dann alle Informationen in konsistenten Kategorien und quasi beliebiger Kombination aus der Datenbank abgerufen und visualisiert werden.

(auct. Thomas Krefeld)

Tags: Linguistik



API (Zitieren)

API steht für "application programming interface", zu Deutsch ‚Anwendungsprogrammierschnittstelle'. Eine solche stellt VerbaAlpina unter der Adresse https://www.verba-alpina.gwi.uni-muenchen.de/?api=1 zur Verfügung. Eine ausführliche Dokumentation der dort zu verwendenden Syntax findet sich in folgendem Beitrag: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=8844. Die API erlaubt es, gezielt bestimmte Inhalte aus der VA-Datenbank (VA_DB) in definierten Formaten über einen Browser abzurufen. Die Auswahl der Daten und das Ausgabeformat werden dabei durch URL-Parameter gesteuert.

(auct. Stephan Lücke)



Autorenschaft (Zitieren)

Alle verbalen Beiträge der VerbaAlpina-Seite sind namentlich gekennzeichnet; Autoren werden mit dem Kürzel "auct." markiert, Übersetzer eines Beitrags mit dem Kürzel "trad.". Bei mehreren Autoren bzw. Übersetzern werden die Namen grundsätzlich in alphabetischer Sortierung angezeigt.
Die Software wird im Wesentlichen von Florian Zacherl, David Englmeier (seit 1.10.2016) und Filip Hristov (seit 1.10.2016) entwickelt.

(auct. Thomas Krefeld | Susanne Oberholzer | Florian Zacherl)

Tags: Webseite



Autorensignaturen (Zitieren)

Für die Autorensignatur gelten folgende Regeln:
- Einfache Siglen, z.b. SO = 'in Arbeit'
- Siglen in runden Klammern, z.B. (SO) = 'fertig'
- Siglen in geschweiften Klammern, z.B. {SO} = 'Veränderungen vorgenommen'

Analog für mehrere Autoren. Übersetzer werden wie weitere Autoren behandelt: SO/SL, ebenfalls mit den o.g. Klammerregeln. Aus den Signaturen geht hervor, wer Erstautor (= auct.) und wer Übersetzer (= trad.) ist. Jeder Übersetzer sollte unbedingt auch unklare Stellen im Original nach Rücksprache mit dem Originalautor verbessern.

Die genannten Auszeichnungskonventionen gelten nur für VA_XXX; in abgeschlossenen Versionen werden alle Signaturen auf (nn) bzw. (nn | nn) gesetzt.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Webseite



Belegorte (Zitieren)

Die Namen der Belegorte werden quellentreu übernommen (inklusiv einer abweichenden Rechtschreibung). Sollten zwei oder mehr Belegorte denselben Namen haben, so wird sofern vorhanden und notwendig der offizielle Lokalzusatz angehängt, z.B. Brixen im Thale, St. Johann in Tirol. Besonders in Österreich sind diese Zusätze zahlreich vorhanden und erleichtern die Unterscheidung der Aufnahmeorte.
Die Namen kleinerer Weiler haben jedoch oft keine Lokalzusätze. Hier wird die Gemeinde, der der Belegort angehört, in Klammern dahinter gesetzt, z.B. St. Magdalena (Gries), St. Magdalena (Villnöss).

(auct. Mona Neumeier)

Tags: Linguistik



Betacode (Zitieren)

In Anlehnung an die Terminologie des Thesaurus Linguae Graecae (TLG), der das entsprechende Konzept Anfang der 1970er Jahre für die elektronische Erfassung altgriechischer Texte mit den damaligen computertechnischen Mitteln entwickelt hatte, wird im Rahmen von VerbaAlpina die Transkription komplexer Schriftsysteme unter ausschließlicher Verwendung von ASCII-Zeichen als "Betacode" bezeichnet.
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):





Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel das Häkchen unterhalb des u im Wort tu durch eine öffnende runde Klammer wiedergegeben: tu(. Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Beta-Kodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Linguistik Informationstechnologie



Bezeichnung (Zitieren)

Unter 'Bezeichnung' versteht VerbaAlpina die idealisierte Instanz eines geschriebenen, gesprochenen oder gedachten Wortes, das ein oder mehrere Konzepte benennt und womöglich auf konkrete Dinge referiert. Anstelle eines einzelnen Wortes kann auch die spezifische Abfolge mehrerer Wörter diese Funktionen übernehmen (sogenannte Mehrwortlexie). Im Hinblick auf die Kategorie 'Konzept' ergibt sich, informatisch gesprochen, eine sogenannte m:n-Beziehung: Eine polyseme Bezeichnung kann mehrere Konzepte benennen, umgekehrt kann ein Konzept durch eine Vielzahl von synonymen Bezeichnungen benannt werden.





(auct. Stephan Lücke)

Tags: Linguistik



Chronoreferenzierung (Zitieren)

Neben dem für VerbaAlpina grundlegenden Prinzip der Georeferenzierung ist im Gesamtkonzept, gleichsam als zusätzliche Dimension, die Möglichkeit der Chronoreferenzierung vorgesehen, die auch diachron angelegte Datenanalysen ermöglicht. Eine Chronoreferenzierung ist sowohl für das von VA gesammelte Sprachmaterial wie auch für das Material des außersprachlichen Datensektors möglich. Die Präzision der Chronoreferenzierung ist unterschiedlich. Im Fall der Sprachdaten aus Atlanten und Wörterbüchern liegt eine implizite Chronoreferenzierung über das Datum der Erhebung bzw. der Publikation vor. Daten aus dem Crowdsourcing können unter Umständen sogar auf den Tag genau zeitlich fixiert werden. Die Chronoreferenzierung ist z. B. dort relevant, wo Daten aus unterschiedlichen Atlasgenerationen, also etwa sowohl aus dem AIS (1928-1940) als auch aus dem ALD (1998-2012), vorliegen. Die Chronoreferenzierung ist noch nicht als Suchfilter an der Nutzeroberfläche implementiert. Die Chronoreferenzierung orientiert sich nach Möglichkeit an bestehenden Standards wie z. B. ISO 8601 oder TimeML und wird in VA_DB als eigenes Datenattribut mitgeführt.

Ein besonderes Beispiel liefert der ASLEF, bei welchem die Chronoreferenzierung besonders deutlich zum Ausdruck kommt, da neben den selbsterhobenen Daten für dieselben Ortschaften auch Belege der Sprachatlanten ALI und AIS aufgenommen wurden. In diesem Sinne entsteht eine diachrone Perspektive, da die vom AIS erhobenen Sprachdaten aus den Jahren 1921-1922 und die Daten des ALI aus den Jahren 1925-1943 neben die Daten vom ASLEF selbst aus den Jahren 1974 bis 1986 gestellt werden. Auf den Karten vom ASLEF wird dies durch diverse Symbole zu Kenntnis gebracht:





Das „P“ bezieht sich dabei auf die vom ALI erhobenen Daten, während das „S“ symbolisch für die vermerkten Daten des AIS steht. Diese beiden Buchstaben referieren auf die Exploratoren der Sprachatlanten. So steht "P" für Ugo Pellis, den Explorator des Sprachatlanten ALI. "S" bezieht sich hingegen auf den Explorator vom AIS, Paul Scheuermeier.
Diese Buchstaben sind auf den ASLEF-Karten vermerkt, wenn keine eigenen Belege vorliegen. Es wird also darauf hingewiesen, dass an diesen Ortschaften die Belege nur vom AIS bzw. ALI übernommen wurden. Wurden jedoch zusätzlich auch vom ASLEF Daten erhoben, die zudem mit denen der anderen beiden Sprachatlanten übereinstimmen, stehen die Buchstaben dem jeweiligen Sprachatlas entsprechend in einem Rechteck (AIS) bzw. in einem Kreis (ALI) hinter den auf den Karten des ASLEF verzeichneten Belegen. Bei denjenigen Belegen, bei welchen vom ASLEF divergierende Daten gegenüber den Daten eines der anderen beiden Sprachatlanten erhoben worden sind, wird dies durch ein Rechteck ohne "S" (AIS) bzw. einen Kreis ohne "P" (ALI), die bei den vom ASLEF erhobenen Belegen stehen, vermerkt.

Eine Berücksichtigung dieser Abkürzungen ist bei der Transkription für VerbaAlpina allerdings nicht vonnöten, da die damit verbundene Chronoreferenzierung, automatisch in den digitalen Karten von VerbaAlpina zu tragen kommt, wenn Belege aller Sprachatlanten eingespeist werden und alle Belege ein- und derselben Ortschaft einen Hinweis auf ihre Quelle geben. Dadurch entsteht eine diachrone Perspektive, die in bestimmten Fällen den Vergleich von diversen Belegen aus den jeweils unterschiedlichen Erhebungsjahren der Sprachatlanten zulässt. Folglich kann hier von einer Chronoreferenzierung, die in den Karten von VerbaAlpina zum Vorschein kommt, gesprochen werden.

(auct. Katharina Knapp | Thomas Krefeld | Stephan Lücke)

Tags: Webseite



Codepage (Zitieren)

VerbaAlpina vereinigt Daten aus verschiedenen Arten von Quellen: Daten aus gedruckten Sprachatlanten und Wörterbüchern, die zunächst noch digitalisiert werden müssen, sowie bereits elektronisch vorliegende Daten aus einer Reihe von Partnerprojekten. Jede dieser unterschiedlichen Quellen verwendet mehr oder weniger individuelle Systeme zur Transkription. Um die erforderliche Vereinheitlichung zu realisieren, sind Listen nötig, in denen festgelegt ist, welches Schriftzeichen im Transkriptionssystem der einen Quelle welche Entsprechung im Transkriptionssystem der anderen Quelle besitzt. Hauptsächlich geht es darum, die unterschiedlichen Transkriptionssysteme auf das Internationale Phonetische Alphabet (IPA) abzubilden, das innerhalb von VerbaAlpina als Referenztranskription fungiert. Zur Überführung eines quellenspezifischen Transkriptionssystems in das IPA-System ist die Anlage einer vollständigen Liste in Tabellengestalt mit Schriftzeichenentsprechungen erforderlich. Eine solche Tabelle wird als "Codepage" bezeichnet.
Nachfolgend ein Auszug aus der für die Konvertierung des AIS-Transkriptionssystems in IPA grundlegenden Codepage. Insgesamt umfasst diese Codepage rund 4500 Zeilen/Zuordnungen:


Die Kolumne `BETA` enthält die im AIS verwendeten Zeichen in nach dem Prinzip des Betacodes transkribierter Form, die Kolumne `IPA` das jeweils entsprechende IPA-Zeichen und die Kolumne `HEX` den oder die Zahlenwerte der Unicodetabelle, die dem jeweiligen IPA-Zeichen entsprechen.

Eine vollständige Übersicht über die Codepages für alle Quellen von VerbaAlpina findet sich hier.

(auct. Stephan Lücke)

Tags: Linguistik Informationstechnologie



Crowdsourcing (Zitieren)

Obwohl bereits viele relevante Sprachdaten zu den Gegenstandsbereichen von VerbaAlpina vorliegen (vor allem in Atlanten und Wörterbüchern), ist es vorgesehen, neue Daten zu erheben. Damit sollen (1) Inkonsistenzen zwischen den bereits vorliegenden Quellen ausgeglichen, (2) Lücken bzw. Ungenauigkeiten beseitigt und (3) überkommene Bezeichnungen bzw. Geräte als solche gekennzeichnet werden. Die Neuerhebungen werden aber nicht mit den klassischen Verfahren der Feldforschung durchgeführt, sondern mit den Mitteln, die uns die sozialen Medien inzwischen zur Verfügung stellen. Entsprechende Verfahren werden oft unter dem Ausdruck crowdsourcing zusammengefasst.
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008).
Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.

In VerbaAlpina geht es konkret darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen. Sehr interessiert ist VerbaAlpina darüber hinaus an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wer immer also Kenntnisse eines im Alpenraum gesprochenen Dialekts hat, ist eingeladen, spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina einzutragen. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z. B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich am Projekt in dieser Weise beteiligen. – Außerdem sind Bilder von alpentypischen Objekten, aber auch von Almen, Hütten, Flora, Fauna, Bergen und Landschaftsformen mitsamt ihren Bezeichnungen willkommen. Sie können in der Mediathek gespeichert werden.

Parallel zur gezielten Mitarbeit bei VerbaAlpina erhält jeder Nutzer die Möglichkeit, sich in unserem System eine eigene Forschungsumgebung einzurichten, die für die Sammlung von hauptsächlich Sprachdaten, jedoch durchaus auch von anderen Daten verwendet werden kann. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Er hat die Möglichkeit, diese Daten gleichsam ausschließlich für die persönliche Verwendung unter Verschluss zu halten oder aber den Zugriff anderen Nutzern freizugeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Nur wenn möglichst viel Daten der Allgemeinheit zur Verfügung gestellt werden, kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Funktionsbereiche



Datenformat (Zitieren)

s. Datenmodellierung

Tags: Informationstechnologie



Datenmodellierung (Zitieren)

Unter Datenmodellierung versteht VerbaAlpina die theoretische Entwicklung einer Gliederung von zunächst unstrukturiertem Datenmaterial. Im Wesentlichen geht es dabei um die Definition von sog. Entitäten, also einer Klasse von digitalen Einzelobjekten, denen eine bestimmte Art und Anzahl von Attributen (= Eigenschaften) gemeinsam ist. Ausschließlich diese Attribute sind für die inhaltliche und funktionale Bestimmung der Objekte relevant. Im Zuge der Datenmodellierung erfolgt auch die Festlegung der Beziehungen zwischen den unterschiedlichen Entitäten.
Von der Datenmodellierung sind zu unterscheiden die Datenstrukturierung und das Datenformat. Mit Datenstrukturierung ist die konkrete Anwendung des theoretischen Datenmodells auf einen Datenbestand gemeint, als deren Ergebnis eine strukturierte Repräsentation der Daten etwa in Gestalt einer oder mehrerer Tabellen vorliegt. Ein strukturierter Datenbestand kann wiederum in unterschiedlichen Datenformaten abgebildet werden (z.B. in Tabellenform = relationales Datenformat, XML-Format usw.), wobei häufig eine Transformation von einem in ein anderes Format möglich ist.

s. auch Relationales Datenmodell

(auct. Stephan Lücke)

Tags: Informationstechnologie



Datenstrukturierung (Zitieren)

s. Datenmodellierung



Digital Humanities (Zitieren)

Das Projekt VerbaAlpina wurde von vornherein mit Blick auf Webtauglichkeit konzipiert, denn es will ganz entschieden zur Überführung der etablierten geisteswissenschaftlichen Traditionen, genauer: der Geolinguistik, in die Digital Humanities beitragen . Dieser Ausdruck ist zwar mittlerweile fest etabliert; seine beiden Konstituenten sind jedoch keineswegs selbsterklärend und verdienen jeweils eine methodologische Bemerkung.

(1) Digital hat eine Reihe komplexer Implikate:
  • Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
  • Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
  • Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
  • Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.
(2) Hinter Humanities steht eine spezifische Konzeption des Forschungsfachs, die sich mit dem überkommenen Begriff der Philologie nur ganz unzulänglich erfassen lässt. Diese genuin textorientierte Tradition wurde de facto bereits durch die mit gesprochener Sprache arbeitenden Bereiche der Linguistik überholt. In Bezug auf VerbaAlpina wäre indes auch die Rede von digital linguistics zu eng, denn obwohl sprachliche Daten im Zentrum stehen, werden ganz bewusst auch außersprachliche Daten einbezogen, die für das historische Verständnis geolinguistischer Verhältnisse unabdingbar sind.

(auct. Thomas Krefeld)

Tags: Informationstechnologie



Digital Object Identifier (DOI) (Zitieren)

Ein Digital Object Identifier (DOI) ist eine weltweit eindeutige und unveränderliche Adresse, über die elektronische Ressourcen wie z. B. Websites erreichbar sind. Die Erreichbarkeit ist auch dann gewährleistet, wenn sich z. B. der sogenannte "Uniform Resource Locator" (URL) einer Ressource ändert. Der wesentliche Nutzen des DOI-Systems besteht demnach in der nachhaltigen Zitierbarkeit elektronischer Ressourcen. Dies wird durch einfaches Mapping erreicht: Die DOI-Stiftung führt ein Register, in dem jedem DOI die jeweils aktuelle URL einer Ressource zugeordnet ist. Bei Änderung einer URL muss entsprechend die Änderung im Register der DOI-Stiftung erfolgen. URL-Änderungen müssen der DOI-Stiftung durch die DOI-Registrierungsagentur mitgeteilt werden, die den betreffenden DOI hatte registrieren lassen. Die Eintragung der Webressource von VerbaAlpina im DOI-Register erfolgt über das "Referat Elektronisches Publizieren" der Universitätsbibliothek der LMU, das seinerseits die Registrierung nicht direkt bei der DOI-Stiftung, sondern beim DataCite-Konsortium vornimmt, das Mitglied der DOI-Stiftung ist.

Voraussetzung für das zuverlässige Funktionieren des Konzepts der DOI ist neben dem verantwortungsbewussten Handeln des Domainbetreibers auch die Verlässlichkeit der mit der Pflege der entsprechenden Zuordnungstabellen beauftragten Institution, also der zuständigen DOI-Registrierungsagentur. Diese sollte eine möglichst unbegrenzte Existenzperspektive besitzen, so wie dies etwa bei den Universitäts-, Staats- und Nationalbibliotheken gegeben ist. In jedem Fall sollte der Domainbetreiber allfällige Änderungen der Adresse eines digitalen Objekts an die Registrierungsagentur melden, damit diese die entsprechenden Einträge im DOI-Register anpassen kann. Umgekehrt sind auch regelmäßige Überprüfungen von Seiten der DOI-Registrierungsagentur(en) vorstellbar, in etwa vergleichbar mit den traditionellen "Revisionen" in Bibliotheken.

Der DOI von VerbaAlpina lautet doi:10.5282/verba-alpina. Die Zahl vor dem Schrägstrich (10.5282) wird als Präfix, die sich anschließende Zeichenfolge als Suffix bezeichnet. Das Präfix ist der zuständigen DOI-Registrierungsagentur – in diesem Fall der Universitätsbibliothek der LMU – zugeordnet. Damit ein Zitat beispielsweise in einem wissenschaftlichen Aufsatz direkt auf das Portal von VerbaAlpina führt, muss dem DOI die URL der DOI-Stiftung vorangestellt werden: http://dx.doi.org/10.5282/verba-alpina.
Nahezu demselben Zweck wie der DOI dient der sogenannte Uniform Resource Name (URN), und auch die Funktionsweise ist in etwa die gleiche. Anders als beim DOI ist beim URN jedoch die Registrierung mehrerer URLs für eine Ressource möglich. Dies kann etwa dann von Interesse sein, wenn Ressourcen im Sinne der Ausfallsicherheit oder Nachhaltigkeit auf verschiedenen Servern mit entsprechend unterschiedlichen URLs abgelegt werden. Anders als beim DOI wird das URN-Register nicht von einer einzigen Institution, sondern dezentral von verschiedenen nationalen Organisationen betrieben. Das Auffinden einer Webressource kann nur über den Registrierungsserver ("Resolver") der Institution erfolgen, bei der der URN registriert worden war. Für Deutschland übernimmt diese Aufgabe die Deutsche Nationalbibliothek (DNB). Die URN von VerbaAlpina lautet urn:nbn:de:bvb:19-verba-alpina-8. Das Portal von VerbaAlpina ist unter Einbindung des DNB-Resolvers unter der URL http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8 erreichbar.

Grundsätzlich ist es möglich, DOIs und URNs auch für Teilressourcen einer Domain (z.B. einzelne Webseiten oder Mediendateien) registrieren zu lassen. Alternativ können Teilressourcen einer Domain auch über die Einbindung der URL-Parameter in den DOI angesprochen werden. Dafür muss eine spezielle Syntax verwendet werden, die durch das folgende Beispiel illustriert wird: Der auf die URL des Eintrags Forschungsdatenmanagement (https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=493&db=xxx&letter=F#112 ) verweisende DOI sieht folgendermaßen aus:

http://dx.doi.org/10.5282/verba-alpina?urlappend=/%3fpage_id=493%26db=xxx%26letter=F#112

Das Beispiel zeigt, dass das Fragezeichen sowie die sog. "Ampersands" (&) durch den jeweiligen Hexadezimalwert des Zeichens in der Unicode-Tabelle (? = 3f, & = 26) ersetzt werden müssen.

Literatur: Dreyer 2012

(auct. Stephan Lücke | Julian Schulz [ITG])

Tags: Informationstechnologie



Digitalisierung (Zitieren)

Mit Digitalisierung wird im Kontext von VerbaAlpina nicht der schlichte Einsatz von Computern zur elektronischen Datenverarbeitung, sondern vielmehr und wesentlich die digitale Tiefenerschließung des Materials durch systematische und transparente *Strukturierung* und Kategorisierung verstanden.





Dabei kommt quasi ausschließlich das relationale Datenmodell zum Einsatz, bei dem das Datenmaterial grundsätzlich in Tabellengestalt organisiert wird. Die Tabellen bestehen aus Zeilen (= Datensätze, Tupel) und Spalten (= Attribute, Felder, Eigenschaften), wobei jede Tabelle in jede Richtung um zusätzliche Zeilen und Spalten erweitert werden kann. Zwischen den Tabellen bestehen logische Zusammenhänge, die sinnvolle Verknüpfungen und entsprechende synoptische Darstellungen (sog. "Joins") von zwei und mehr Tabellen erlauben. Für die Verwaltung der Tabellen setzt VerbaAlpina derzeit das Datenbankmanagementsystem MySQL ein, die Tabellen sind jedoch nicht an dieses System gebunden, sondern können jederzeit z.B. in Textgestalt mit eindeutig zu definierenden Trennzeichen für Feld- und Datensatzgrenzen (sog. Separatoren) zusammen mit den Spaltennamen und der Dokumentation der logischen Zusammenhänge (Entity-Relationship-Modell) exportiert werden. Die derzeit vielfach verwendete XML-Struktur wird im operativen Bereich von VerbaAlpina nicht eingesetzt. Im Rahmen des Schnittstellenkonzepts ist XML jedoch als Exportformat verankert.

Neben der logischen Strukturierung der Daten spielt im Zusammenhang mit dem Stichwort "Digitalisierung" die Kodierung der Schriftzeichen die zweite zentrale Rolle. Gerade im Hinblick auf die Langzeitarchivierung des Datenmaterials ist der richtige Umgang mit dieser Thematik von großer Bedeutung. Soweit möglich, orientiert VerbaAlpina sich dabei an der Kodierungstabelle und den Vorgaben des Unicode-Konsortiums. Im Fall der Digitalisierung von Schriftzeichen, die bislang noch nicht in die Unicodetabelle aufgenommen sind, erfolgt die digitale Datenerfassung eines Einzelzeichens vorzugsweise durch Serialisierung in Gestalt einer Abfolge von Zeichen aus dem Unicode-Bereich x21 bis x7E (innerhalb des ASCII-Bereichs). Die entsprechenden Zuordnungen werden in speziellen Tabellen dokumentiert, wodurch eine spätere Konvertierung in dann möglicherweise vorhandene Unicodewerte stets möglich ist.

(auct. Stephan Lücke)

Tags: Linguistik Informationstechnologie



Dokumentation (Zitieren)

VerbaAlpina dokumentiert die dialektale Variation innerhalb eines ethnographisch definierten Raums; der onomasiologische Rahmen wird durch kulturelle Techniken und Lebensformen abgesteckt, die sich unter den jeweils spezifischen, auch kulturunabhängigen Umweltbedingungen konventionalisiert haben. Dergleichen Räume, die durch die Alpen in prototypischer Weise repräsentiert werden, konnten die sprachwissenschaftlichen Forschungstraditionen nicht angemessen erfassen, da sich die Teildisziplinen, die sich systematisch mit der Konstitution von Räumen beschäftigen – also die Sprachgeographie bzw. Dialektologie oder auch Geolinguistik – beinahe ausnahmslos an vorgegebenen politischen und/oder (einzel)sprachlichen Grenzen orientieren. Der räumliche Zuschnitt zentraler und in mancher Hinsicht bis heute maßgeblicher Unternehmungen ist zwar nachzuvollziehen (vgl. etwa den AIS und das FEW) – zustimmen mag man jedoch oft nicht. Gerade die besonders faszinierenden mehrsprachigen Kulturräume, also z. B. das Gebiet zwischen der montenegrinisch-albanischen Adriaküste und der Donau, fallen daher durch das Raster der etablierten, durch nationalphilologische Voreinstellungen gesteuerten Forschung. Der ambitioniert geplante Atlante linguistico mediterraneo hätte ein richtungweisendes Großprojekt werden können; er ist jedoch über Ansätze niemals hinausgekommen.
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).

Perspektive

Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Hinblick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.

Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als Ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.

Kartographie

Den Zugang zur Dokumentation vermittelt vor allem ein interaktive Karte. Bislang werden zur Visualisierung nur Punktsymbolkarten mit interaktiven Symbolen eingesetzt. Komplementär wird eine interaktive Flächensymbolisierung auf Basis der Gemeindeflächen vorbereitet, um eine bessere Visualisierung quantitativer Verhältnisse zu erzielen. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern.

Linguistische Datenaufbereitung

Bei Aktivierung ('Klick') eines Punktsymbols öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten; das folgende Beispiel zeigt die Bezeichnung des Konzepts BUTTER in Ramosch (Unterengadin): Vgl. Karte Konzept BUTTER

Die Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Demnächst kommen – wenn möglich – Verweise auf Referenzwörterbücher hinzu.

Filter

Mehrere Filter erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen. Der oben gezeigte Kartenausschnitt stammt aus der Karte, die bei Auswahl des 'Konzepts' BUTTER erscheint:



Filter zu Steuerung der interaktiven Karte

Gruppieren und Sortieren

Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) führt zu 1448 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:



Die Sortierfunktion der interaktiven Karte: Konzepte

Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen oder Basistypen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:





Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen.
Polysemie des morpho-lexikalischen Typs malga: Vgl. Karte morpho-lexikalischen Typs malga


Quellen

Bislang wurden einige georeferenzierbare Wörterbücher, vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:
  1. Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.).


  2. Das von VA entwickelte Transkriptionstool

  3. Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD-II und den ALTR praktiziert.
  4. Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; dies gilt bislang vor allem für SAO-Daten.

Multidimensionalität

Für ein umfassendes Verständnis der historischen Prozesse ist es unbedingt wünschenswert, die sprachliche Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die
  • Orte mit lateinischen Inschriften in der Provinz Noricum ;
  • Orte mit lateinischen Inschriften aus Raetien ;
  • aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae .
Andererseits wurden die Reflexe von drei lateinischen, genauer: zwei lateinischen und einem latinisierten aber mutmaßlich vorrömischen Basistypen aufgerufen:
  • Basistyp lat. casearia in der Bedeutung 'Hütte'  in Nord-, Süd- und besonders prägnant in Osttirol;
  • den Basistyp vorrömisch baita in der Bedeutung 'Haus'   in Slowenien südlich von Ljubljana;
  • den Basistyp lat. cellarium in der Bedeutung 'Hütte'  in Oberösterreich.
Synoptische Karte zur lateinischen Epigraphik: Vgl. Karte zur lateinischen Epigraphik, den Tabula Peutingeriana-Orten und den Basistypen cellarium und baita in einem Teil des deutschen und slowenischen Raums (vgl. die Legende oberhalb des Links)

Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Entity Relationship (Zitieren)

Daten können grundsätzlich zu sogenannten "Entitäten" zusammengefasst werden. Dabei handelt es sich um Klassen von Daten, die jeweils eine bestimmte Art und Anzahl spezifischer Merkmale aufweisen. So können beispielsweise die Städte Trento, Innsbruck und Luzern eine Klasse "Orte" bilden, der die Merkmale "Ortsname", "Längengrad", "Breitengrad", "Staat" und "Einwohnerzahl" zu eigen ist. Die einzelnen Mitglieder einer solchen Klasse unterscheiden sich durch die unterschiedlichen Werte der die Klasse ausmachenden Merkmale.
In einer relationalen Datenbank werden Entitäten idealerweise in jeweils eigenen Tabellen gespeichert, wobei jede Tabellenspalte die Werte jeweils eines spezifischen Merkmals aufnimmt. Die Tabellenzeilen enthalten die individuellen, durch ihre Merkmalswerte von einander unterschiedenen Mitglieder der Datenklasse (Entität). In den allermeisten Fällen – und so auch bei VerbaAlpina – stellt eine relationale Datenbank eine Sammlung verschiedener Entitäten (und somit Tabellen) dar, zwischen denen logische Beziehungen bestehen. So wäre etwa die Entität "Informant", die durch die Merkmale "Alter", "Geschlecht", "Geburtsort" und "Wohnort" definiert ist, mit der Entität "Orte" in der Weise logisch verbunden, dass die Werte der Merkmale "Geburtsort" und "Wohnort" Entsprechungen in der Entität "Orte" besitzen. Beziehungen zwischen Mitgliedern dieser beiden Entitäten ergeben sich aus Übereinstimmungen der Werte eines oder mehrerer, ihrem Wesen nach kongruenter, Merkmale der jeweiligen Entitäten. Im gegebenen Fall könnte sich theoretisch eine Zuordnung aus identischen Werten der Merkmale "Geburtsort" und "Ortsname" ergeben, wodurch mittelbar einem Informanten die Geokoordinaten seines Geburtsortes zugeordnet werden könnten. Es ist leicht zu erkennen, dass in diesem Beispiel Probleme aufgrund von Homonymen auftreten könnten. Um dergleichen zu vermeiden, ist es üblich, Ganzzahlen als Identifikatoren (kurz: "ID") zu verwenden, die die Mitglieder einer Entität eindeutig bezeichnen.
Das skizzierte System der Entitäten und ihrer logischen Zusammenhänge wird als Entity Relationship bezeichnet. Der in einer relationalen Datenbank gesammelte Datenbestand ist ohne eine Erläuterung dieser dort bestehenden Abhängigkeiten nur schwer versteh- und nutzbar. Üblicherweise erfolgt die Abbildung der Entity Relationship in Gestalt eines graphischen Schemas.
Die Entity Relationship unterliegt während der zyklischen Entwicklungsphasen von VerbaAlpina (s. Versionierung) ständigen Anpassungen und somit Veränderungen. Jeder archivierten Version von VerbaAlpina wird das Entity Relationship Modell der jeweils zugrundeliegenden Datenbankversion in Form eines ER-Diagramms beigegeben, das mit dem Programm yEd erzeugt und als GraphML abgespeichert wird. Die mit automatischen Tools erzeugten Diagramme werden wegen des damit verbundenen erheblichen Arbeitsaufwands nicht nachträglich graphisch aufbereitet. Aus diesem Grund und wegen der hohen Komplexität der abgebildeten Strukturen sind sie daher in aller Regel für Außenstehende nicht auf Anhieb zu verstehen. Sie enthalten jedoch alle für das Verständnis der Struktur von VA_DB nötigen Informationen und stellen somit eine wichtige Voraussetzung für die Nutzung der Datenbank auch nach dem Ende der Projektförderung dar. Folgende Graphik basiert auf den Entitäten und Verknüpfungen der Datenbank VA_XXX in ihrem aktuellen Zustand (30.11.2017), bildet diese jedoch nicht vollständig ab und ist nur als illustrierendes Beispiel zu verstehen:





(auct. Stephan Lücke)

Tags: Informationstechnologie



Ergänzende Daten (Zitieren)

Für die induktive Kulturraumforschung sind demographische und institutionelle Daten immer dann interessant, wenn sie sich als georeferenzierbar erweisen. Dazu zählen siedlungsgeschichtliche Informationen, insbesondere im Hinblick auf die Zugehörigkeit zu kirchlichen und staatlichen Institutionen. Aber auch Verkehrswege, insbesondere Passverbindungen, sind von grundlegender Bedeutung (vgl. Karte).
Ökologische und geophysikalische Daten sind immer dann relevant, wenn sie einen klaren Bezug zur Siedlungsgeschichte haben. Das ist zum Beispiel evident im Hinblick auf die Vegetationszonen, die bestimmte Nutzungen gestatten oder verlangen (z. B. die Almwirtschaft setzt Höhenlagen über der Baumgrenze voraus (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_DE).

(auct. Thomas Krefeld)

Tags: Außersprachlicher Kontext



Erklärungssprache (Zitieren)

Die Oberfläche dieses Portals wird in mehreren Standardsprachen aufrufbar sein, nämlich (in alphabetischer Reihenfolge) auf Deutsch, Englisch, Französisch, Italienisch, Rätoromanisch (Rumantsch Grischun) und Slowenisch, dabei ist im Fall des Deutschen je nach Autor/in gelegentlich mit schweizerischen und österreichischen Standardvarianten zu rechnen. Unabhängig von der gewählten Erklärungssprache hat der Nutzer jedoch stets Zugriff auf sämtliche objektsprachlichen Materialien aller erfassten Dialekte und Sprachen.

(auct. Thomas Krefeld)

Tags: Webseite



Ethnolinguistik (Zitieren)

"On ne peut pas faire l'histoire des mots sans faire l'histoire des choses" (Jaberg 1936, 23).
In der romanistischen, aber vor allem italianistischen Forschungstradition war die Dialektologie von Beginn an, d.h. in Italien mindestens seit Giuseppe Pitré, immer sehr eng mit den Sozialwissenschaften, genauer gesagt mit der Soziologie und der Ethnologie verbunden. In dieser Perspektive lässt sich die gesamte Geolinguistik sogar als Teildisziplin einer übergeordneten 'Ethnowissenschaft' verstehen. Dieser Ausdruck, der hier als Übersetzung von ita. etnoscienza (aus eng. ethnoscience) gesetzt wird, hat allerdings weder in Italien, noch in Deutschland etablieren können. In dem sehr scharfsinnigen und informativen Manuale di etnoscienza von Giorgio Raimondo Cardona (Cardona 1995) heißt es:

"[...] il prefissoide etno- permette un'immediata 'etnologizzazione' di qualunque sottodisciplina [...]. L'inglese offre ancora un altro tipo di formazione, quella con folk- (folk-taxonomy), che ha però lo svantaggio di non essere atrettanto facilmente esportabile quanto il suo concorrente grecizzante.
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 f.; Hervorhebung durch fette Schrift: TK)  

Die so skizzierte etnoscienza wird in der US-amerikanischen Tradition auch als cultural anthropology (deu. Kulturanthropologie) bezeichnet. Speziell im deutschsprachigen Raum wurde darüber hinaus zwischen Volkskunde für die Erforschung einheimischer Kultur(en) und Völkerkunde für die Erforschung fremder, insbesondere nichteuropäischer Kulturen unterschieden. In der Gegenwart wird stattdessen meist allgemein von Ethnologie mit dem besonderen Teilgebiet der Europäischen Ethnologie (im Sinne der Volkskunde) gesprochen. Die Bezeichnung Ethnolinguistik ist daher auch nicht eindeutig, da sie oft auf die sprachwissenschaftliche Untersuchung nichteuropäischer Kulturen eingeschränkt wird (vgl. Senft 2003), obwohl sie die europäischen nicht ausschließen sollte; die kategorische Trennung erweist sich im Hinblick auf die massenhaften und weiträumigen Migrationsströme ohnehin in rapide zunehmendem Maße als sinnlos.

Eine Unschärfe im zitierten Passus von Cardona bleibt zu klären; sie betrifft das 'Präfixoid' ethno-, das einerseits als Synonym des en. folk und andererseits mit Bezug auf etnia verwendet wird. Mit folk (in folk-taxonomy usw.) wird auf die alltags- oder lebensweltlichen Wissensbestände und Konventionen der Laien bzw. Nicht-Wissenschaftler verwiesen und genau in diesem Sinne sollte auch Ethnie (bzw. ethno-) auf alltagsweltliche Kulturgemeinschaften bezogen werden, ohne jedoch idealisierte Vorstellungen von Homogenität, Archaizität, sozialer Abgeschlossenheit usw. zu implizieren. Die Unterscheidung Cardonas (a vs. b) verweist weiterhin auf zwei komplementäre Forschungsperspektiven in den Kultur- und Sozialwissenschaften.

Zusammenfassend darf man dialektologische Forschungen im Sinn von Cardona (auch im Nachhinein) als 'ethnolinguistisch' bezeichnen, wenn sie ihre sprachlichen Daten im engen Zusammenhang mit der Alltagskultur der Sprecher erheben und analysieren.
In der romanistischen Tradition wurde diese Ausrichtung durch den prototypischen Sprach- und Sachatlas Italiens und der Südschweiz (AIS) etabliert; sie markiert zweifellos den größten Unterschied und Fortschritt zum ALF, wie Karl Jaberg nicht ohne Emphase festhält. Der im Hinblick auf das Selbstverständnis des AIS und die Wissenschaftsgeschichte aufschlussreiche Passus verdient durchaus herausgehoben zu werden:
"L'importance des «choses» n'a pas échappé à l'esprit de Gilliéron [...] Que Gilliéron ait complètement négligé ce point de vue dans la conception de l'Atlas et qu'il n'en ait tenu compte qu'en passant dans ses autres publications, c'est un fait d'autant plus étrange qu'il connaissait fort bien les «choses» et s'y intéressait passionnément. A-t-il approuvé l'enseignement que Ferdinand de Saussure a tiré de ses incursions dans les domaines limitrophes de notre science, à savoir  que la «linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même», principe qui, malgré l'admiration que j'ai pour le grandsavant genevois, m'a toujours semblé singulièrement rétrécir le champ d'action du linguiste." (Jaberg 1936, 27 f.)
Jaberg weist explizit und vollkommen zu Recht darauf hin, dass der Saussuresche Strukturalismus gerade in diesem Punkt junggrammatische Vorstellungen beibehält; aus der Sicht der zeitgenössischen Geolinguistik wird der Versuch, die Sprache als isolierbares 'Modul' zu betrachten, also keineswegs als ein neues Paradigma, sondern geradezu als traditionalistisch wahrgenommen:
"La conception du Petit Atlas phonétique du Valais roman [ebenfalls von Gilliéron; TK] et celle de l'Atlas linguistique de la France remontent à une époque qui était encore sous l'empire des néogrammairiens, et on sait ce que les néogrammairiens doivent aux sciences naturelles. Ce n'est certes pas un hasard que le Cours de linguistique générale s'en ressente également. M. Jud et moi, nous avions pas ces attaches avec les néogrammairiens, Gilliéron lui-même nous avait aidés à les rompre. Nous étions en revanche fortement impressionnés par les brillants articles de Meringer et de Schuchardt. La réalité des choses était autours de nous. Nous avions nous-mêmes parcouru les pays romans ; nous avions recueilli sur le terrain des observations ethnographiques et folkloriques. Comment en rester aux mots? Tout en sauvegardant le caractère essentiellement linguistique de notre ouvrage, nous croyions devoir fournir à l'historien des mots les données nécessaires pour se faire une idée des choses, afin qu'il ne bâtisse pas dans le vide." (Jaberg 1936, 28).
       

Richtungweisend für die ethnolinguistisch orientierte Tradition der italienischen Dialektologie ist die in teilnehmender Beobachtung entstandene Untersuchung von Hugo Plomteux 1980 über die Cultura contadina in Liguria. Ethnolinguistisch sehr gut, im regionalen Vergleich vielleicht am besten erschlossen ist Sizilien. Zu nennen sind vor allem: Fanciullo 1983 und mehrere wichtige Arbeiten, die im Rahmen des Atlante linguistico della Sicilia entstanden sind; die folgenden Titel geben Auskunft über die jeweils untersuchten kulturellen Techniken und Traditionen: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 und Castiglione 1999.

(auct. Thomas Krefeld)

Tags: Linguistik Außersprachlicher Kontext



Ethnolinguistisches Ähnlichkeitsprofil (Zitieren)

Aus der ethnolinguistischen Sicht dieses Projekts bilden die Basistypen das Fundament des mehrsprachigen alpinen Raums. Im Sinne einer synthetischen Darstellung sind zwei unterschiedliche quantitative Kartierungsfunktionen vorgesehen:
  1. Zunächst sind die Alpenwörter von besonderem Interesse; ihre Gesamtheit bildet sozusagen einen fiktiven Idealtyp, dem die einzelnen Ortsdialekte mehr oder weniger nahe kommen. Dem entspricht die Kartierung einer gradueller Ähnlichkeit, die durch die Darstellung des champ gradient de la gasconité im ALG 6 inspiriert wurde.
  2. Sodann wird nach dem Vorbild des ASD die relative Ähnlichkeit aller Aufnahmeorte untereinander kartiert, indem die gemeinsamen Basistypen eines beliebigen Aufnahmeortes und diejenigen eines beliebigen anderen Ortes als Bezugspunkt festgestellt und angezeigt werden.


(auct. Thomas Krefeld)

Tags: Linguistik Außersprachlicher Kontext



Etymologie (Zitieren)

Die Freilegung der sprachlichen Strata, die Stratigraphie, setzt die Etymologisierung voraus. Der etymologische Kommentar geht jeweils vom Basistyp aus und verfolgt ein dreifaches Ziel:
- die Ermittlung der Herkunftssprache der lexematischen Basis;
- die Begründung der Zusammengehörigkeit aller unter dem Basistyp vereinigten Typen; dafür sind die Regularitäten der historischen Phonetik und die semantische Plausibilität der zugrundeliegenden Konzeptrelationen entscheidend;
- die Rekonstruktion der Entlehnungswege, falls der Basistyp in mehreren Sprachgebieten verbreitet ist; sobald die Sprache des Etymons einerseits und des Informanten andererseits nicht übereinstimmen, wird automatisch Sprachkontakt festgestellt.

(auct. Thomas Krefeld)

Tags: Linguistik



FAIR-Prinzipien (Zitieren)

Im Jahr 2016 veröffentlichte eine große Anzahl von Wissenschaftlern aus einer ganzen Reihe von Ländern im Wissenschaftsmagazin Nature einen Artikel, in dem es darum ging, Richtlinien für den Umgang mit Forschungsdaten zu formulieren (Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016). ?). Letztlich gehen die in dieser Publikation vorgetragenen Ideen auf einen Workshop zurück, der im Januar 2014 am Lorentz Center an der Universität Leiden in den Niederlanden stattgefunden hatte. Der Titel des Workshops hatte gelautet: Jointly designing a data FAIRPORT

Zwischenzeitlich haben sich diese Ideen, die im Akronym FAIR fokussiert sind, als ein Orientierungspunkt in der aktuellen Debatte über den richtigen Umgang mit Forschungsdaten etabliert (dies wurde u.a. auf dem Netzwerktreffen des GeRDI-Projekts im Oktober 2018 deutlich; vgl. auch die FAIRGROUP der FORCE11-Community).

Das Akronoym FAIR steht für die folgenden zentralen, sich z.T. wechselseitig bedingenden, Postulate, an denen sich der Umgang mit Forschungsdaten orientieren sollte (?):

  • F — Findable
  • A — Accessible
  • I — Interoperable
  • R — Reusable

Diese Schlagwörter bedingen implizit eine ganze Reihe von Konsequenzen für den Umgang mit digitalen Forschungsdaten.

Damit Daten auffindbar sind, sollte es mindestens ein zentrales Portal geben, über das Suchanfragen gestartet werden können. Es bietet sich an, den Nachweis der Forschungsdaten – gemeint sind im Wesentlichen ihr Inhalt sowie ihr Bewahrungsort – in die seit langem etablierten Bibliothekskataloge zu inkorporieren. Zu vermeiden wären alle Konzepte, die einen Suchvorgang an unterschiedlichen Stellen verlangen würden.

Um gefunden werden können, müssen Daten selbstverständlich auch physisch existent sein. Hierbei geht es weniger um die Frage der technischen Realisierung, die z.B. durch die flächendeckend bestehenden Rechenzentren geleistet werden kann, sondern vielmehr um die Frage nach der institutionellen Zuständigkeit. Auch unter diesem Aspekt bieten sich wiederum die Bibliotheken an, die aufgrund ihrer Geschichte, ihrer genuinen Aufgabe als Wissensbewahrer sowie ihrer langfristigen Bestandsperspektive eigentlich als konkurrenzlose Kandidaten für diese Aufgabe angesehen werden können. Sie sollten die Verantwortung für die nachhaltige Bewahrung der digitalen Daten übernehmen. In welcher Form dies schließlich geschieht, ob die Bibliotheken eigene Repositorien aufbauen und verwalten oder auf Rechenzentren als Dienstleister zurückgreifen, ist von nachrangiger Bedeutung und kann von Fall zu Fall unterschiedlich gehandhabt werden.

Große Bedeutung besitzt die Konzeption und Vergabe von Metadaten, über die die eigentlichen Forschungsdaten auffindbar gemacht werden müssen. Unverzichtbar erscheint die Verwendung mindestens eines verbindlichen, hierarchisch aufgebauten Metadatenschemas, das unter Einbindung ebenfalls verbindlicher kontrollierter Vokabulare eine inhaltliche Kategorisierung der abgelegten Forschungsdaten erlaubt. VerbaAlpina hat sich vorläufig für das weit verbreitete und auch von der UB der LMU gewählte Datacite-Schema entschieden. Der Einsatz mehrerer konkurrierender Metadatenschemata wäre möglich, jedoch nur sinnvoll, wenn sie jeweils konsequent für alle erfassten Forschungsdaten angelegt werden. Untergeordnete fachspezifische Metadatenschemata können eine sinnvolle Ergänzung der übergeordneten Metadatenschemata darstellen.

Mit "accessible" ist vor allem die nicht durch rechtliche Schranken wie etwa das Urheberrecht eingeschränkte Zugänglichkeit von Daten gemeint. Dieser Punkt ist am wenigsten von den Denjenigen zu beeinflussen, die Daten sammeln oder produzieren. Neben dem Urheberrecht ist bei Datensammlungen häufig der Schutz von Persönlichkeitsrechten zu beachten. Die Forderung nach Zugänglichkeit zielt demnach vor allem darauf ab, dass sämtliche Daten, die keiner rechtlichen Beschränkung unterliegen, von den Produzenten dieser Daten nicht eigens mit rechtlichen Zugangsbeschränkungen belegt werden. Konkret bedeutet das in erster Linie den Verzicht auf das Copyright und die Anwendung eines Lizenzmodells, das konform ist mit den Bedingungen des Open Access. Weit verbreitet im wissenschaftlichen Umfeld ist die Verwendung der Creativecommons-Lizenzen (CC), von denen allerdings nicht alle die Kriterien für Open Access erfüllen. Insbesondere verstößt das Verbot kommerzieller Nutzung, das Teil einer CC-Lizenz sein kann, gegen das Konzept von Open Access. Der Grund besteht darin, dass nahezu jede Verwendung von Daten unter Umständen als "kommerzielle Nutzung" angesehen werden kann und eine klare Grenzziehung diesbezüglich aus juristischer Sicht so gut wie unmöglich ist (s. auch dazu den Methodologie-Beitrag "Lizenzierung").

Ebenso wie auch die Auffindbarkeit von Daten besitzt die Interoperabilität zwei, nämlich eine technische und eine theoretisch-organisatorische, Seiten. Um Datenbestände fruchtbringend miteinander verknüpfen und sich aufeinander beziehen zu lassen, bedarf es in vielen Fällen zunächst einer logischen Freingranulierung der Daten, die sich überdies an, zumeist fachspezifischen, Regeln orientiert. Eine ganz zentrale Rolle spielen in diesem Zusammenhang die sog. "Normdaten", bei denen es sich um definierte und, im Idealfall standardisierte, Konzeptkategorien handelt, deren einzelne Instanzen (digitale Objekte) bezogen auf eine klar definierte Art und Anzahl von Eigenschaften "distinct", also singulär sind. Die Belegung der einzelnen Objekte einer Konzeptkategorie mit numerischen oder alphanumerischen Identifikatoren ("ID"s), erlaubt die unzweideutige Referenzierung von Objekten. Die Granulierung von Datenbeständen entlang den Grenzen von Kategorien und deren einzelnen Instanzen/Objekten in Verbindung mit der Verwendung der spezifischen Identifikatoren erlaubt sodann die Verknüpfung von getrennten Datenbeständen mit kongruenten Inhalten. Echter Mehrwert entsteht allerdings erst dann, wenn es auch technisch möglich ist, auf einzelne Objekte direkt zu referenzieren und so mit nur einem Klick von einem Datenbestand zu einem Objekt eines anderen Datenbestands zu gelangen. Dies erscheint nur dann möglich, wenn tatsächlich jedem einzelnen Datenobjekt ("Granum") eine eigene URL zugewiesen wird. Im Sinne der Nachhaltigkeit muss schließlich jeder einzelnen URL auch noch eine DOI zugewiesen werden.

Die Wiederverwendbarkeit von Datenbeständen ergibt sich schließlich aus der sorgfältigen Beachtung und Umsetzung der drei vorangegangenen Postulate.

VerbaAlpina ist bemüht, sämtliche datenbezogenen Verfahren und Regelungen an den FAIR-Prinzipien auszurichten. Thomas Krefeld sieht darin grundsätzlich die Basis einer DH-Forschungsethik (Thomas Krefeld [2018]: Linguistische Theorien im Rahmen der
digital humanities. Korpus im Text. Version 2 (05.11.2018, 11:35).
Absatz 4. url: http://www.kit.gwi.uni-muenchen.de/?p=28010&v=2#p:4.). Der Auffindbarkeit der Daten dient die Kooperation mit der UB der LMU sowie dem DFG-Projekt GeRDI, die derzeit im Rahmen des Projekts e-humanities – interdisziplinär erfolgt. Vor allem der zentrale Datenbestand im Modul VA_DB wird im Zuge dessen versionsweise mit Metadaten versehen und in mehrerlei Gestalt an die UB der LMU übergeben, wo er in jedem Fall im Open-Data-Repositorium abgelegt wird. Wenigstens die Metadaten werden anschließend zusätzlich in den Index inkorporiert, der aktuell im Rahmen des Projekts GeRDI aufgebaut wird. Ziel ist es, die von VerbaAlpina gesammelten und aufbereiteten Daten zentral über den Bibliothekskatalog der UB und darüberhinaus auch über das noch in Entwicklung befindliche Suchportal des GeRDI-Projekts auffindbar zu machen. Sämtliche von VerbaAlpina verwalteten Daten werden, soweit möglich, unter eine Open-Access-konforme Creativecommons-Lizenz gestellt (bis Version 18/1 CC BY SA 3.0 de, ab 18/2 CC BY SA 4.0). Die Interoperabilität wird zum einen durch eine feine Granulierung des Datenbestands erreicht, die sich auch am Konzept der Normdaten orientiert, indem bereits bestehende Normdaten mit dem Datenmaterial von VerbaAlpina verbunden werden. Dies ist z.B. möglich mit geographischen Daten, etwa den politischen Gemeinden, die das zentrale geographische Bezugssystem von VerbaAlpina darstellen. Für die für VerbaAlpina zentralen Datenkategorien "morpholexikalischer Typ" und "Konzept" existieren wenigstens teilweise bislang noch keine Normdaten, auf die die VerbaAlpina-Daten bezogen werden könnten. In diesen Fällen ist VerbaAlpina bemüht, in Kooperation mit prädestinierten Institutionen wie etwa der Deutschen Nationalbibliothek (DNB) entsprechende Normdaten bzw. Normdatenkategorien einzurichten. Zur Bedienung der technischen Erfordernisse für eine effiziente Interoperabilität wird das zentrale lexikalische Datenmaterial datensatzweise in einer Vielzahl kleiner Dateien abgelegt, die schließlich über individuelle DOIs auf Open Data LMU angesprungen werden können. Jeder einzelnen Datei wird außerdem eine Metadaten-Datei im Datacite-Format beigegeben, die schließlich in ihrer Gesamtheit das gezielte Auffinden einzelner Dateien über den Bibliothekskatalog ermöglichen.

(auct. Stephan Lücke)

Tags: Informationstechnologie



Forschungsdatenmanagement (Zitieren)

Im Zuge der Verbreitung digitaler Methoden rückt in jüngster Zeit die Frage ins Blickfeld, wie mit sog. "Forschungsdaten" umzugehen sei. Es scheint so, als gingen die damit verbundenen Vorstellungen auf die Verhältnisse in den Naturwissenschaften zurück. Dort liegt häufig das Szenario vor, dass z. B. große Mengen von Messdaten zunächst erhoben und anschließend in interpretierenden Texten ausgewertet werden. Dabei ergibt sich eine scheinbar klare Zweiteilung, bei der ausschließlich die Messdaten als "Forschungsdaten" bezeichnet werden. Es mag sein, dass es bisweilen Usus war oder auch immer noch ist, die Forschungsdaten als ephemer und nicht dauerhaft bewahrenswert zu erachten. Das Forschungsdatenmanagement hat sich zum Ziel gesetzt, nicht nur die interpretierenden Texte, sondern auch eben jene als "Forschungsdaten" bezeichnete Daten, die die Grundlage für die Interpretation darstellen, langfristig zu bewahren und nachnutzbar zu machen.

Das Thema "Forschungsdatenmanagement" (FDM) wird derzeit (2018) in Deutschland sowohl auf Bundes- wie auch auf Länderebene stark gefördert, und es ist bereits mit einer Reihe einschlägiger Unternehmungen begonnen worden. Die entsprechenden Aktivitäten sind vor dem Hintergrund der Bestrebungen zur Errichtung einer European Open Science Cloud (EOSC) auf EU-Ebene zu sehen. Für Deutschland sind auf überregionaler, bundesweiter Ebene in diesem Zusammenhang etwa die vom "Rat für Informationsinfrastrukturen" (RfII) ausgesprochene Empfehlung zur Einrichtung einer "Nationalen Forschungsdateninfrastruktur" (NFDI), die sich daran orientierende NFDI-Arbeitsgruppe der Akademienunion (mit Schwerpunkt auf den Geisteswissenschaften) oder auch das seit 2016 von der DFG geförderte und interdisziplinär ausgerichtete Projekt "Generic Research Data Infrastructure" (GeRDI) zu nennen. Die Projekte HeFDI ("Hessische Forschungsdateninfrastrukturen") in Hessen und das vom bayerischen Wissenschaftsministerium geförderte Projekt "eHumanities – interdisziplinär" seien an dieser Stelle stellvertretend für FDM-Initiativen auf Landesebene genannt.

Aus der Perspektive der Geisteswissenschaften ist die vermeintlich klare Trennung zwischen Forschungs- und Interpretationsdaten bzw. -texten, so wie sie im Bereich der Naturwissenschaften vereinzelt vielleicht möglich sein mag, ausgesprochen problematisch bzw. fragwürdig. VerbaAlpina jedenfalls unternimmt keine entsprechende Unterscheidung, sondern betrachtet sämtliche vom Projekt gesammelten und erzeugten Daten als ein untrennbar verwobenes Ganzes, dessen Einzelteile in vielfältiger Weise aufeinander bezogen sind. Im Sinne des "Forschungsdatenmanagements" deklariert VerbaAlpina demnach die Gesamtheit seiner auf die Module VA_DB, VA_WEB und VA_MT verteilten digitalen Daten (also Sprachdaten, Kommentare, Glossareinträge, Computercode, Mediendaten etc.) als Forschungsdatum, das getreu den FAIR-Prinzipien und orientiert an den einschlägigen Empfehlungen des RfII (RfII 2016, Anhang A, S. A-13) bewahrt werden muss. VerbaAlpina ist mit dem Status eines Pilotprojekts eingebunden in die bereits erwähnten Projekte GeRDI und "eHumanities – interdisziplinär".

Ein wesentlicher Aspekt des Forschungsdatenmanagements ist die Gewährleistung von Interoperabilität in dem Sinn, dass persistente projekt- bzw. datenbestandsübergreifende Verknüpfungen zwischen Teilmengen der jeweiligen Datenbestände möglich sind. Eine wichtige Rolle spielen dabei die sog. DOIs, "Digital Object Identifier". Diese stellen die technische Voraussetzung für die dauerhafte, URL-unabhängige Adressierbarkeit "digitaler Objekte" dar und sind für alle elektronischen Inhalte erzeugbar, die über eine URL erreichbar sind. Im Umfeld des Bibliothekswesens wurden DOIs zunächst zur persistenten Identifizierung von elektronischen Buchpublikationen (z.B. https://doi.org/10.5282/ubm/epub.25627) oder auch ganzen Websites (z.B. http://dx.doi.org.emedien.ub.uni-muenchen.de/10.5282/asica) verwendet. Abweichend von dieser Praxis verlangt das Erfordernis der Interoperabilität zwischen getrennt erarbeiteten und verwalteten Datenbeständen eine wesentlich feinere Granulierung. VA erzeugt zu diesem Zweck eine Reihe von im Internet über URLs erreichbaren Dateien, die das gesammelte Sprachmaterial gruppiert nach morpholexikalischen Typen, Konzepten, Herkunftsgemeinden und Einzelbelegen enthalten. Die Dateien sind mit den jeweils von VA vergebenen IDs der jeweiligen Datenkategorie benannt. Dateien der Kategorie "Gemeinde" tragen am Anfang des Dateinamens ein "A", "C" markiert Konzepte und "L" morpholexikalische Typen. Die jeweils nachfolgende Nummer ist die von VA vergebene ID. Der Zugriff auf diese Daten ist über die Adresse https://www.verba-alpina.gwi.uni-muenchen.de/export möglich. Die Zuweisung der DOIs erfolgt zunächst im Rahmen des Projekts "eHumanities – interdisziplinär" durch die UB der LMU, die überdies die Daten in ihren eigenen Datenbestand übernimmt und dort durch noch zu entwickelnde Verfahren und unter Anwendung eines geeigneten Metadatenschemas zusätzlich in der Tiefe inhaltlich erschließt. Ziel ist neben der Bereitstellung der Forschungsdaten im Repositorium die Integration und Auffindbarkeit der feingranulierten VA-Daten in den Bibliothekskatalogen. Aus dem Bestand der UB der LMU werden die VA-Daten außerdem in den Index des DFG-Projekts GeRDI übernommen und damit einer Nachnutzung in interdisziplinären Kontexten zugeführt.

s. auch Normdaten

(auct. Sonja Kümmet [UB der LMU] | Stephan Lücke | Julian Schulz [ITG] | Florian Zacherl)

Tags: Informationstechnologie



Forschungsumgebung (Zitieren)

Die Aufgaben und Leistungen von VerbaAlpina können den folgenden Bereichen zugeordnet werden:
(1) Dokumentation und sprachgeschichtliche Analyse des dialektalen Wortschatzes, der nach Maßgabe des onomasiologischen Rahmes als charakteristisch eingeschätzt wird;
(2) Kooperation mit Projektpartnern zum gegenseitigen Datenaustausch und zur Datenanalyse;
(3) Publikation des Datenbestandes, analytischer Texte und unterschiedlicher, projektbezogener Materialien, die sich teils an die fachliche, teils an die breite Öffentlichkeit richten.
Die Funktionen (1) bis (3) wurden mit der ersten Version 15/1 bereits aktiviert ; ergänzt wurden sie mit Version 17/1 um:
(4) Datenerhebung durch Crowdsourcing.
Alle aktiven Funktionen werden kontinuierlich ausgebaut. In der Vorbereitung befindet sich schließlich: (5) die Einrichtung eines Forschungslabors.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Fotos (Zitieren)

Die Mediathek von VerbaAlpina enthält eine umfangreiche, ständig wachsende Sammlung georeferenzierter Fotos; diese Aufnahmen erfüllen einen doppelten Zweck: Einerseits verweisen sie auf konkrete Referenten mit all ihren idiosynkratischen Besonderheiten, die vor allem bei Gebäuden sehr ausgeprägt sein können; andererseits sollen die Fotos in möglichst anschaulicher Weise ein Konzept illustrieren und so zur Grundlage für die Erhebung weiterer Bezeichnungen des Konzepts werden. In dieser Funktion geht es also nicht darum, den spezifischen Referenten, also eine ganz bestimmte Almhütte, wiederzuerkennen. Das wäre sogar eher störend, denn in diesem Fall neigen Informanten dazu, den Eigennamen der Alm zu liefern, und nicht die Bezeichnungen des Konzepts. Das Risiko ist allerdings überschaubar; ein grundsätzliches Missverständnis ergibt sich eigentlich nur beim Wiederkennen bekannter Personen; hier ziehen die individuellen Merkmale die gesamte Konzentration des Betrachters auf sich, so dass der Abgebildete spontan und unwillkürlich mit dem Namen genannt wird ("das ist doch der Willi!") – und nicht in der Funktion, die er auf dem Foto ausübt (SENN). Strenggenommen wäre daher zur Erhebung von Bezeichnungen die Verwendung idealisierter Zeichnungen anstelle von Fotos konkreter Objekte vorzuziehen; das scheitert jedoch am Fehlen entsprechender Vorlagen. Alle Abbildungen von Referenten sind über die Datenbank mit den Kategorien "Konzept" und "Bezeichnung" verbunden.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Außersprachlicher Kontext



Georeferenzierung (Zitieren)

Ein wesentliches Ordnungskriterium der in VerbaAlpina verwalteten Daten ist die Georeferenzierung unter Verwendung von Breiten- und Längengraden. Die Genauigkeit dieser Referenzierung variiert je nach Datentyp, wobei grundsätzlich eine möglichst exakte, metergenaue Referenzierung angestrebt wird. Im Fall der Sprachdaten aus Atlanten und Wörterbüchern ist in aller Regel lediglich eine vergleichsweise ungefähre Referenzierung nach Maßgabe eines Ortsnamens möglich, im Fall von z. B. archäologischen Daten hingegen sind tatsächlich metergenaue Georeferenzierungen möglich. Es können Punkte, Linien (etwa Straßen, Flüsse u. Ä.) und Flächen gespeichert werden. Aus technischer Perspektive findet hauptsächlich das sogenannte WKT-Format (https://en.wikipedia.org/wiki/Well-known_text) Verwendung, das in der VA-Datenbank mit der Funktion geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html in ein spezifisches MySQL-Format überführt und so gespeichert wird. Die Ausgabe im WKT-Format erfolgt durch die MySQL-Funktion astext().
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts. Die Ermittlung der Geoinformantionen zu den jeweiligen Erhebungspunkten erfolgte mittels eines Online Tools. Bedingt durch nicht eindeutige Benennung der Ortschaften, sowie nicht Erkenbarkeit der Namen, war eine manuelle Korrektur der Angaben nötig. Leider ist die Ermittlung der Geokoordianten seit einiger Zeitaus rechtlichen Gründen nicht mehr möglich.


(auct. Thomas Krefeld | Stephan Lücke)

Tags: Linguistik Informationstechnologie Außersprachlicher Kontext



Gruppieren und Sortieren (Zitieren)

Nicht selten sind in den Kategorien, die in der 'interaktiven Karte' ausgewählt werden können, bereits zahlreiche sprachliche Ausdrücke verfügbar; so führt die Suche nach dem 'Konzept' BUTTER zum Beispiel zu 1748 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren: vgl. Konzept BUTTER

Eine Sortierung nach Basistypen zeigt die sprachgrenzüberschreitenden Verbreitungsareale, hier den romanischen Typen butyru(m) im deutschen Sprachgebiet und den deutschen Typ Schmalz im romanischen: Vgl. Karte.

Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt (vgl. morpho-lexikalischer Typ malga).
Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen: Vgl. Karte Polysemie des morpho-lexikalischen Typs.


(auct. Thomas Krefeld)

Tags: Webseite



Induktive Kulturraumforschung (Zitieren)

Das Projekt fokussiert die Alpen als einen einzigen kulturräumlichen Komplex, da es von der Erwartung gemeinsamer kultureller Techniken im gesamten Alpenraum ausgeht. Die Grundlage dafür liegt in der Adaptation an identische oder zumindest sehr ähnliche Lebensbedingungen im Hochgebirge und in der damit verbundenen, selbstverständlichen Verbreitung entsprechender Fertigkeiten und Traditionen. Da sich diese Gemeinsamkeiten in entsprechenden Bezeichnungen sprachlich deutlich manifestieren, ist es nicht angemessen, alpine Sachkultur sozusagen top down im verengten Rahmen einzelner Sprachgemeinschaften, d.h. über ein festes Netz von Erhebungspunkten in a priori festgelegten Sprach- oder Dialektregionen zu beschreiben; dies entspricht meist den Absichten der Dialektologie, die auf möglichst vollständige Beschreibung einzelner Gebiete und idealerweise spezifischer Varietäten zielt. In der hier eingenommenen sprachgrenzüberschreitenden Perspektive einer interlingualen Geolinguistik sollen die Verbreitungsgebiete kultureller Traditionen und ihrer sprachlichen Bezeichnungen dagegen bottom up, d.h. aus der Akkumulation möglichst zahlreicher lokaler Befunde induktiv freigelegt werden.
Das Grundprinzip besteht darin, ausschließlich mit georeferenzierbaren Daten zu operieren und – abgesehen von der Zugehörigkeit der Orte zur Alpenkonvention – keinerlei großräumige Kategorien vorzugeben. Zur kulturräumlichen Profilierung des Alpenraums können die ergänzenden Daten beitragen, die aktuelle oder historische Informationen über die soziale Organisation der Einwohner und/oder über deren infrastrukturelle Erschließung und Bewirtschaftung des Raums liefern. Im Hinblick auf die historische Rekonstruktion des alpinen Kulturraums ist es erstrebenswert, die Gebiete archäologischer Persistenz mit den Arealen sprachlicher Relikte abzugleichen und quantitativ in Gestalt einer kombinierter Sach- und Sprachschichtenkartographie zu visualisieren; vgl. dazu aus archäologischer Sicht allgemein Häuber/Schütz 2004a sowie den modellhaften Kölner Stadtschichtenatlas (vgl. Häuber/Schütz/Spiegel 1999 und Häuber u.a. 2004).

(auct. Thomas Krefeld)

Tags: Linguistik



Informant (Zitieren)

Der Ausdruck wird in VerbaAlpina technisch verstanden, denn er fasst je nach Quelle zwei unterschiedliche Dinge zusammen: In den Atlanten sind alle Sprachdaten in der Regel bis ‘hinunter’ zum Sprecher transparent; in der Datenbank sind diese Informanten über eine individuelle Nummer identifizierbar (ID). Sie sind weiterhin über das Jahr der Erhebung chronoreferenziert und über den Ort der Erhebung georeferenziert. In georeferenzierbaren Wörterbücher ist es dagegen in aller Regel unmöglich, konkrete Sprecher zu identifizieren. Aus datenbanktechnischen Gründen werden aber auch den Quellen dieser Gattung fiktive Informanten zugeschrieben. Jeder Informant ist einer Sprachfamilie zugeordnet; diese Sprachzuweisung wird an alle auf ihn zurückgehenden Sprachdaten ‘vererbt’.

(auct. Thomas Krefeld)

Tags: Webseite



Inputdaten (Zitieren)

In VerbaAlpina werden ausschließlich Daten verwandt, die mindestens im Gebiet einer politischen Gemeinde, wenn möglich aber noch genauer (wie z. B. Photos von Almen) georeferenziert sind. Im Blick auf die besonders wichtigen sprachlichen Daten sind zwei Typen zu unterscheiden: einerseits solche, die unmittelbar auf Äußerungen einzelner Informanten zurückgehen – wie etwa die Belege mancher, insbesondere romanischer Sprachatlanten oder auch der Bayerischen Dialektdatenbank (BayDat); diese Äußerungen werden in ihre konstitutiven Bestandteile, die so genannten Tokens zerlegt. Andererseits liefern manche Atlanten, wie etwa der SDS oder der VALTS, sowie alle Wörterbücher keine Sprecheräußerungen, sondern Formen, die von den Herausgebern bereits typisiert wurden, so dass es nicht möglich ist, bis auf die Tokens zurückzugehen.

(auct. Thomas Krefeld)

Tags: Linguistik



Interlinguale Geolinguistik (Zitieren)

Zu den Zielen dieses Portals gehört es, die prägende Kraft des Sprachkontakts und speziell seine ethnolinguistische Konditionierung bei der Entwicklung des alpinen Sprachraums herauszuarbeiten. Die Konzeption der Datenbank wird es erlauben, die erfassten Entlehnungen auch quantitativ in ihrer lokalen Kumulation abzubilden, denn sie ergeben sich automatisch dann, wenn die Zugehörigkeit des Informanten zu einer der drei Sprachfamilien nicht mit derjenigen des Etymons übereinstimmt.
Es sind, genauer gesagt, drei Sprachfamilien, die den neuzeitlichen Alpenraum in Gestalt unterschiedlich großer und vor allem unterschiedlich stark differenzierter Dialektkontinua prägen; die Verbreitungszonen der drei Sprachfamilien lassen sich übrigens nicht auf spezifische Staaten abbilden vgl. aktuelle Sprachgebiete. Das Germanische ist durch alemannische und bairische Varietäten vertreten, die der plurizentrischen deutschen Sprache zugerechnet werden; allerdings ist der gemeinsame Bezug auf die schweizerische, deutsche und österreichische Standardvarietät, der die Zugehörigkeit zu ein und derselben Sprachgemeinschaft überhaupt erst stiftet, bei manchen walserischen und altbairischen (zimbrischen) Sprachinseln auf der Alpensüdseite eigentlich nicht mehr gegeben.
Im Unterschied zum germanischsprachigen Teilgebiet kann man die Varietäten des romanischen Kontinuums mehreren Sprachen zuordnen; neben dem Französischen und Italienischen handelt es sich dabei nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien um Okzitanisch, Frankoprovenzalisch, Rätoromanisch (im Sinne von Bündnerromanisch), Dolomitenladinisch und Friaulisch.
Das Slawische ist durch slowenische Dialekte vertreten, die außer in Slowenien auch in etlichen italienischen und österreichischen Gemeinden gesprochen werden. Zu den Zielen von VerbaAlpina gehört es jedoch nicht, die Dialekte des Alpenraums möglichst vollständig zu beschreiben, die lokalen oder regionalen Dialektgrenzen herauszuarbeiten und den Raum so gewissermaßen als Mosaik von Varietäten darzustellen. Vielmehr sollen durch die großräumige Anlage gerade die (vor allem lexikalischen) Merkmale hervortreten, die über die einzelnen Dialekt- und Sprachgrenzen hinweg verbreitet sind und so die ethnolinguistischen Gemeinsamkeiten hervortreten lassen.





Da Dialekte in sich vollständige sprachliche Systeme bilden, darf man im Hinblick auf die gemeinsame Untersuchung der drei 'genetisch' verschiedenen Kontinua sagen, dass der Sprachkontakt hier in Gestalt einer interlingualen Geolinguistik untersucht wird (vgl. ausführlicher Krefeld 2018d).

(auct. Thomas Krefeld)

Tags: Linguistik



Kartographie (Zitieren)

Die Kartographie ist ein vielleicht nicht ganz unumstrittenes, aber gut bewährtes Verfahren der Sprachgeographie, denn sie dient gleichermaßen der Dokumentation wie der Visualisierung räumlicher Relationen (vgl. die Beiträge in Lameli 2010). Die üblichen Verfahren unterscheiden sich deutlich in ihrer Prägnanz; im Fall so genannter ‘analytischer’ Karten werden sprachliche (Teil-)Äußerungen wiedergeben, so dass die Dokumentation stark im Vordergrund steht und die Aufdeckung der eigentlich räumlichen Beziehungen zwischen den dokumentierten Formen dem Leser überlassen bleibt. Bei den so genannten Punktsymbolkarten werden dagegen durch die ‘synthetische’ Symbolvergabe direkt die räumlichen Relationen zwischen einzelnen Äußerungsaspekten zum Ausdruck gebracht. Quantitative Verhältnisse lassen sich nur so wiedergegeben. Die Online-Kartierung von VerbaAlpina erfolgt auf georeferenzierter Grundlage und kombiniert beide Verfahren, insofern sie zwar auf den ersten Blick ‘synthetische’ Karten anzeigt, auf den zweiten Blick, nach Klick auf das Symbol, jedoch Zugriff auf die (Teil-)Äußerung gibt.
Das heuristisches Potential der Kartographie ist beachtlich; daher wird dem Nutzer von VerbaAlpina die Option angeboten, unterschiedliche Datenklassen aus einer Kategorie (z. B. mehrere Basistypen) oder aus den unterschiedlichen Kategorien (z. B. außersprachliche und sprachliche Daten) auf synoptischen Karten zu kombinieren und zu kumulieren.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist.

Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Thomas Krefeld)

Tags: Linguistik Webseite Außersprachlicher Kontext



Kontinuität (Zitieren)

Der Frage nach der Überlieferungskontinuität kommt bei der Rekonstruktion mehrsprachiger Kommunikationsräume eine zentrale Bedeutung zu; sie muss im Sinne einer datengeleiteten, induktiven Vorgehensweise interdisziplinär bearbeitet werden. Selbst mit vereinten Kräften mehrerer Disziplinen sind allerdings im Blick auf die vorrömischen Substrate des Alpenraums kaum Antworten zu erwarten. Viel besser ist die Ausgangslage in Bezug auf das romanische Substrat des mittlerweile deutsch- und slowenischsprachigen Teilgebiete. Der Sprachwechsel vom Romanischen zum Deutschen ist ja geradezu eine historische Konstante, die sich in Graubünden sogar aktuell noch beobachten lässt. #Karte der Germanisierungsphasen des ganzen Alpengebiets?# Die Prozess beginnt bereits mit dem Zusammenbruch der römischen Infrastruktur (im Jahre 476); die unmittelbar folgende Periode ist für die Sprachgeschichte von größtem Interesse; sie ist allerdings schriftlich äußerst spärlich dokumentiert, so dass die Kooperation mit anderen historischen Fächern, insbesondere mit der Archäologie, unerlässlich ist. Hier klaffen zwar noch große Forschungslücken, aber mit Weindauer 2014 liegt immerhin eine Aufarbeitung der archäologischen und onomastischen Quellen (6.-8. Jh.) des südlichen Oberbayern, des Salzburger Raums sowie des Tiroler Inntals vor. Demnach kann man "eine längere, grundlegende Siedlungsunterbrechung zwischen Römer- und Bajuwarenzeit" ausschließen, denn alles spricht für "einen fließenden Übergang der Besiedlungsstruktur von der Spätantike zum Frühmittelalter" (Weindauer 2014, 248). Gleichwohl bleibt im Hinblick auf die empirische Absicherung ein gradueller Unterschied zwischen den genannten Gebieten: "Was bezüglich des Zusammenhangs spätantiker und frühmittelalterlicher Fundstellen für das oberbayerische Alpenvorland noch überwiegend theoretisch galt {...}, findet in den österreichischen Gebieten seine nachweisliche Bestätigung: Die frühmittelalterlichen Ortsgründungen des 6. Jhs. orientieren sich fast ausschließlich an spätrömischer Infrastruktur bzw. – soweit noch vorhanden – an der romanischen Siedlungsstruktur." (Weindauer 2014, 257)

(auct. Thomas Krefeld)

Tags: Linguistik



Konzept (Zitieren)

Der Bereich der Konzepte (oder: Onomasiologie) ist vielfältig; vorgegeben sind die drei thematischen Domänen:
- Traditionelle Alltagswelt,
- Natürliche Umwelt,
- Moderne Alltagswelt,
die jedoch für die Organisation der Daten nur eine sehr allgemeine Bedeutung haben. Auf der Ebene der Datenbank sind vielmehr solche Ordnungsprinzipien relevant, die es erlauben Relationen zwischen den einzelnen Konzepten festzulegen. Zunächst lassen sich alltagsweltliche Kategorien durch Konzepte sehr unterschiedlichen Abstraktions-, bzw. Spezifikationsgrads erfassen, so dass sich taxonomische Hierarchien ergeben. Zwischen Konzepten, die auf unterschiedlichen hierarchischen Ebenen liegen, bestehen strenge
(1) Inklusionsrelationen
in der Weise, dass jede Definition eines Unterbegriffs die Definition ihres Oberbegriffs enthält und spezifiziert. Dazu das Beispiel einer konzeptuellen Kategorie:
- Oberbegriff: GEBÄUDE
- Unterbegriff der 1. Ebene: SENNHÜTTE, STALL, KÄSEKELLER usw.
- Unterbegriff der 2. Ebene: SENNHÜTTE AUS STEIN, SENNHÜTTE AUS HOLZ, SENNHÜTTE AUS HOLZ MIT UNTERBAU AUS STEIN usw.
Während jede Sennhütte usw. auch ein Gebäude ist, gilt das Umgekehrte selbstverständlich nicht. Das jeweils inkludierte Konzept ist abstrakter und insofern bei Darstellung in Gestalt von Baumgraphen auch übergeordnet.
Zwischen den hierarchisch gleichgeordneten Konzepten auf ein- und derselben Ebene bestehen dagegen stets:
(2) Exklusionsrelationen
Eine Sennhütte ist weder ein Stall, noch ein Käsekeller.
Ganz anders ist dagegen die Hierarchie, die sich ergibt, wenn komplementäre Konzepte einen komplexen Funktionszusammenhang bilden, der ebenfalls als Konzept gefasst werden muss. Hier spricht man von
(3) Teil-Ganzes-Relationen.
So gehören zum umfassenden Konzept ALM (als Ganzes) unterschiedliche Sektionen, das GELÄNDE, das VIEH, die GEBÄUDE, das PERSONAL und die TÄTIGKEITEN, insbesondere die MILCHVERARBEITUNG (Teile). Teil-Ganzes-Relationen sind einerseits hierarchisch (wie die Inklusionsrelationen), aber andererseits beruhen sie gerade nicht auf definitorischer Inklusion, sondern auf Exklusion. Baumgraphen sind für ihre Darstellung nicht geeignet.
Man vergleiche exemplarisch das Schema zur begrifflichen Sektionierung des Feldes ALMWESEN.





Im Bereich der Sektionen lassen sich wiederum Ganze und deren konstitutive Teile erkennen. So gehören zur PRODUKTION VON KÄSE (Ganzes) diverse TÄTIGKEITEN, PROZESSE, GERÄTE, GEFÄSSE, PERSONEN und GEBÄUDE (Teile).






(auct. Thomas Krefeld)

Tags: Linguistik



Konzeptbeschreibung (Zitieren)

Die Konzepte werden in der Tabelle KONZEPTE der Datenbank am Beispiel des Deutschen wie folgt erfasst: Existiert eine lexikalisierte Bezeichnung für ein Konzept, so wird diese im Datenbankfeld 'Name_D' eingetragen. Bei fehlender Lexikalisierung bleibt dieses Feld leer. Unabhängig davon wird im Feld 'Beschreibung_D' das Konzept genauer spezifiziert bzw. definiert. Dies erfolgt nach einer festgelegten Vorgehensweise, die am Beispiel des Konzepts 'MILCHKANNE' (ID_Konzept 610) demonstriert wird: Das eben genannte Konzept wird mit einem spezifischen Lexem bezeichnet, daher wird MILCHKANNE in 'Name_D' eingetragen. Die Beschreibung sieht folgende hierarchische Reihenfolge vor: Gerät, Zweck, Material, Form (evtl.). Angewendet auf das Konzept ergibt sich also die Beschreibung: GEFÄSS, ZUM AUFBEWAHREN VON MILCH, AUS METALL. Falls möglich bzw. nötig sollen weiterhin diese zusätzlichen Regeln befolgt werden: Zahlen von 1-10 werden ausgeschrieben, zum Wiedergeben eines Prozesses, einer Handlung usw. kann entweder 'zu+Artikel+Infinitiv (substantiviertes Verb)' oder 'für+Substantiv' verwendet werden. Das Einhalten dieser Muster ermöglicht analoge Übersetzungen, die Bildung sprachunabhängiger Kategorien auf unterschiedlichen Abstraktionsebenen (-> GEFÄSSE -> GEFÄSSE ZUR AUFBEWAHRUNG -> GEFÄSSE AUS METALL usw.), automatisierte Korrekturen bzw. Änderungen und eine transparente Suche. Alle Konzepte werden auf diese Weise auf Deutsch, Italienisch, Französisch, Slowenisch und Rätoromanisch erfasst.

(auct. Giorgia Grimaldi | Thomas Krefeld)

Tags: Informationstechnologie



Kooperation (Zitieren)

Zusammenarbeit mit anderen Projekten ist für die Konzeption von VerbaAlpina grundlegend; sie spiegelt sich in zahlreichen Kooperationsvereinbarungen mit Projektpartnern wider. Ihre Umsetzung ist de facto jedoch nicht immer einfach; sie wird durch praktische, d.h. vor allem informationstechnische und damit verbundene datenrechtliche Probleme, aber am Rande auch ein wenig durch ideologische Vorbehalte gegenüber der open source-Ausrichtung behindert. Jede Kooperation stützt sich auf eine formale Vereinbarung, die den Partnern (PVA) eine exklusiv nutzbare Datenbank zum Upload zusichert. Jede Partner-Datenbank steht allen Partnern zum Download zur Verfügung. Aber die Kooperation soll selbstverständlich nicht auf Datenaustausch beschränkt bleiben; vielmehr sind alle Partner eingeladen (und aufgefordert), alle Funktionsbereiche zu nützen.


(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Langzeitarchivierung (Zitieren)

Sämtliche VerbaAlpina-Projektdaten werden so verwaltet, dass diese über einen möglichst langen Zeitraum les- und verwendbar bleiben. Die ins Auge gefasste Perspektive umfasst dabei wenigstens mehrere Jahrzehnte, das zugrundeliegende Konzept ist letztlich jedoch auf eine Konservierung ohne zeitliche Befristung ausgerichtet.

Im einzelnen werden die folgenden Aspekte berücksichtigt:
1. Welche Institution(en) wird(/werden) mit der Bewahrung der Daten bzw. der betreffenden Datenträger betraut?
2. Dokumentation der Datenstrukturierung sowie der logischen Zusammenhänge zwischen Daten und Datenkategorien (Entity Relationship)
3. Dokumentation der verwendeten Zeichenkodierung(en)

Mehrere Kopien der Projektdaten sollen bei mehreren verschiedenen Institutionen archiviert werden. Derzeit sind dafür die IT-Gruppe Geisteswissenschaften der Ludwig-Maximilians-Universität München (ITG) mit deren Anbindung an die Archivierungsserver des Leibniz-Rechenzentrums sowie das BAS Clarin Repository vorgesehen. Es ist geplant, zusätzliche Sicherungskopien bei weiteren geeigneten Institutionen zu deponieren. Die Archivierung findet im Rhythmus der Versionierungen statt. Archiviert werden jeweils die Datenbank mit sämtlichen Projektdaten (Modul VA_DB zusammen mit dem Entity-Relationship-Modell) sowie das Web-Framework (VA_WEB), das für die Präsentation der Daten im Internet (inklusive der jeweiligen Funktionalität) zuständig ist, so dass, zumindest theoretisch, ein "Wiedererwecken" jeder einzelnen Version in entsprechenden emulierten Betriebssystem- bzw. Softwareumgebungen möglich ist. Archiviert wird ferner die Medienbibliothek, die hauptsächlich Photos, Filme, Text- und Tondokumente enthält (Modul VA_MT).

In unregelmäßigen Abständen wird die VerbaAlpina-Webseite (VA_WEB) auch im Internetarchiv https://archive.org abgelegt. Unter der Adresse https://web.archive.org/web/*/http://verba-alpina.gwi.uni-muenchen.de/ lassen sich ältere Versionen von VA_WEB abrufen. Die älteste dort erfasste Version stammt vom 10. November 2014. Die Archivierungen erfolgen teils automatisch durch den "Wayback"-Crawler von archive.org, teils aktiv durch VerbaAlpina, seit 2018 regelmäßig im Zuge der halbjährlichen Versionswechsel.

(auct. Stephan Lücke)

Tags: Informationstechnologie



Lizenzierung (Zitieren)

Die Anwendung des Copyright führt gerade im wissenschaftlichen Kontext häufig dazu, dass Inhalte, deren Präsentation für die Nachvollziehbarkeit darauf aufbauender Erkenntnisse eigentlich unverzichtbar ist, in wissenschaftlichen Publikationen nicht oder nur sehr eingeschränkt genutzt werden dürfen. Fast immer steht die Frage im Raum, welche Verwendung noch vom Zitatrecht gedeckt ist. Bisweilen ist auch unklar, ob ein Autor, dessen Werk verwendet werden soll, bereits mehr als 70 Jahre tot ist oder ob seine Rechte nach seinem Tod auf Dritte übergegangen sind. Jeder Autor (nicht nur) wissenschaftlicher Publikationen muss diese Regelung als massive Einschränkung empfinden, die letztlich und gerade in der Summe den Fortschritt der Wissenschaft erheblich behindert. Das Copyright muss daher als für den Wissenschaftsbetrieb ungeeignetes Lizenzmodell betrachtet werden.

VerbaAlpina fühlt sich daher verpflichtet, sämtliche von VerbaAlpina selbst erarbeiteten Inhalte in Übereinstimmung mit den sog. FAIR-Prinzipien und dem damit verbundenen Open Access Gedanken zur Nutzung durch Dritte frei zur Verfügung zu stellen, und steht damit in einer Reihe von Initiativen und Institutionen, die sich derzeit für die Verbreitung und Durchsetzung dieses Ideals einsetzen (vgl. z.B. das Open Science Center der LMU). Hinsichtlich der Inhalte von VerbaAlpina besteht eine Einschränkung nur insofern, als Daten, die VerbaAlpina von Seiten Dritter übernommen hat und die restriktiveren Nutzungsbedingungen wie etwa dem Copyright unterliegen, auch von VerbaAlpina nur unter den entsprechenden Bedingungen weitergegeben werden. So können speziell einzelne Mediendateien im VA-Modul VA_MT, die VA aus externen Datenquellen bekommen oder erworben hat, dem Copyright unterliegen. Betroffene Objekte werden im Modul VA_MT individuell mit entsprechenden Merkmalen versehen. VerbaAlpina ist stets bemüht, die für einzelne Inhalte bestehenden Nutzungsbedingungen jeweils anzugeben, sofern diese nicht im Rahmen einer Open-Access-Lizenz genutzt werden dürfen. Sollten VerbaAlpina in diesem Zusammenhang Irrtümer unterlaufen – und dies gilt besonders für Urheberrechtsverletzungen – wird darum gebeten, VerbaAlpina unverzüglich darauf hinzuweisen. Entsprechende Inhalte werden von VerbaAlpina umgehend entfernt.

Sämtliche aus rechtlicher Perspektive im Sinne von Open Access uneingeschränkt nutzbaren Daten und Inhalte werden von VerbaAlpina unter eine Creative-Commons-Lizenz (CC) gestellt, die lediglich die Nennung des Urhebers sowie die Weitergabe unter den selben Bedingungen verlangt. Dies wird in der Nomenklatur von CC durch die Kürzel "BY" und "SA" ("share alike") zum Ausdruck gebracht. VerbaAlpina verzichtet bewusst auf das Verbot der kommerziellen Nutzung (CC-Kürzel "NC" – "non-commercial"), da dies sogar eine Weiterverwendung zu wissenschaftlichen Zwecken unmöglich machen kann (s. dazu den Vortrag "Offene Lizenzen – ein Werkstattbericht zu den rechtlichen Herausforderungen im Jahr 2015 " [etwa ab Minute 13] von Thomas Hartmann). Insofern ist die NC-Klausel nicht kompatibel mit dem Open-Access-Gedanken (s. https://open-access.net/informationen-zu-open-access/rechtsfragen/lizenzen/, Abschnitt "Das Creative Commons-Modell", konsultiert am 09.10.2018).

Während die CC-Lizenzen der Version 3.0 auch an das deutsche Rechtssystem angepasst worden waren, wird seit der derzeit (2018) jüngsten Version 4.0 darauf verzichtet. Die daraus folgenden Konsequenzen sind für VerbaAlpina schwer einzuschätzen. Das von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen betriebene Portal https://open-access.net/ meint dazu: "Derzeit noch unklar ist, wie es sich auswirkt, wenn die Standardlizenz in einer ausländischen Sprache zur Verfügung gestellt wird, die der Lizenznehmer nicht oder nicht sicher beherrscht" (https://open-access.net/informationen-zu-open-access/rechtsfragen/lizenzen/, konsultiert am 09.10.2018). VerbaAlpina folgt daher der Praxis der Universitätsbibliothek der LMU und stellt ab der VA-Version 18_2 (Dezember 2018) sämtliche Inhalte, die nicht unter die oben genannten Ausnahmen fallen, unter die CC-Lizenz BY-SA 4.0 (https://creativecommons.org/licenses/by-sa/4.0/). Alle älteren Versionen stehen in analogem Sinn unter der CC-Lizenz BY-SA 3.0 de (http://creativecommons.org/licenses/by-sa/3.0/de/).
Für den von VerbaAlpina entwickelten Softwarecode findet die im Umfeld der Softwareentwicklung übliche MIT-Lizenz Anwendung, die die freie Nachnutzung des Softwarecodes erlaubt.

Das Lizenzierungssystem sowie die Zugriffsrechte der verschiedenen VA-Benutzergruppen werden durch die folgende Graphik dokumentiert:





(auct. Stephan Lücke)

Tags: Informationstechnologie Webseite



Mehrwortlexie (Zitieren)

Unter einer Mehrwortlexie versteht VerbaAlpina eine spezifische Abfolge von Einzelwörtern (Tokens), die gemeinsam ein bestimmtes oder auch unterschiedliche Konzepte bezeichnen. So wird beispielsweise unter anderem im Grödnertal (AIS 1192_1, 312) das Konzept ALMHÜTTE als casa da fuoco (ʧˌaz dɑ fˈuɑk), wörtlich 'Feuerhaus' bezeichnet; in anderen Dialekten (Engadin, Tessin u.a.) bezeichnet dieselbe Zusammensetzung das Konzept KÜCHE.

Aus informatischer Perspektive ergibt sich dabei das Problem einer mehrschichtigen Konzeptzuordnung, die im relationalen Datenmodell abgebildet werden muss: Neben der Bedeutung der Mehrwortlexie als ganzer besitzen die Einzelwörter eigene Bedeutungen, die ein Licht auf die Motivation der Bildung der Mehrwortlexie werfen. Um diese Besonderheit zu berücksichtigen, werden in der Datenbank von VerbaAlpina sogenannte Tokengruppen verwendet. Ein Beleg, der aus mehreren Einzelwörtern besteht, wird hierbei in seine Bestandteile aufgespalten und diese werden in der Tabelle `tokens` abgelegt. Jedes dieser Tokens verweist dabei auf ein und denselben Eintrag in der Tabelle `tokengruppen` und speichert zusätzlich seine Position in der Tokengruppe (1., 2. usw. Stelle), so dass die Mehrwortlexie aus den Einzeltokens rekonstruiert werden kann. Ein explizites Speichern der Mehrwortlexie ist somit nicht nötig; in der Tabelle `tokengruppen` werden also (außer der ID der Tokengruppe) nur zusätzliche Informationen abgelegt, die aus den Einzeltokens nicht hervorgehen können, wie beispielsweise das Genus der Tokengruppe.

Eine Zuordnung von Konzepten findet sowohl auf Ebene der Tokens als auch auf Ebene der Tokengruppen statt. Für das obige Beispiel gibt es damit drei Einträge in der Tabelle Tokens, denen jeweils unterschiedliche Konzepte zugeordnet sind:



Die Zuweisung von Konzepten zu den Bestandteilen erfolgt mit Hilfe der Wörterbücher. Für das jeweilige Teilkonzept wird der häufigste Eintrag aus dem Lexikon übernommen. Da die Teilkonzepte nicht abgefragt wurden, ist möglich, dass sie teilweise der Realität nicht entsprechen.
Zusätzlich gibt es einen Eintrag in der Tabelle `Tokengruppen` mit einer eigenen Konzeptzuordnung:



Bei der kartographischen Darstellung an der Oberfläche von VerbaAlpina werden Tokens und Tokengruppen gleichberechtigt behandelt, das heißt, eine Suche nach dem Konzept ALMHÜTTE liefert sowohl Tokengruppen also auch Tokens, die mit diesem Konzept verbunden sind. Einzelwörter, die nur als Bestandteil einer Mehrwortlexie belegt sind, werden dabei entsprechend markiert.

(auct. Stephan Lücke | Florian Zacherl)

Tags: Linguistik



Metadaten (Zitieren)

Beim Umgang mit Daten wird gerne zwischen Primärdaten und Metadaten unterschieden. Als Metadaten gelten alle Daten, die die Primärdaten beschreiben. Anstelle von "Metadaten" können auch die bedeutungsidentischen Bezeichnungen "Attribute" oder "Merkmale" verwendet werden. Im Zuge der Datenmodellierung wird festgelegt, welche Primärdaten durch welche Metadaten beschrieben werden müssen oder können. Die Kategorie "Metadatum" zerfällt wiederum in einzelne Metadatenkategorien. Für jede Metadatenkategorie werden außerdem die jeweils zulässigen Werte definiert.

Am besten ist dieses System an einem Beispiel zu demonstrieren. Die gegebenen Primärdaten seien Personen. Jede Person sei durch ihren Namen, Vornamen, Geburtsort, Geburtsdatum sowie ihre Augenfarbe beschrieben. Die zulässigen Werte könnten wie folgt beschrieben werden:

Name: Zeichenkette, bestehend aus Buchstaben
Vorname: Zeichenkette, bestehend aus Buchstaben
Geburtsort: Zeichenkette, bestehend aus Buchstaben
Geburtsdatum: Datum in der Form JJJJ-MM-TT
Augenfarbe: Ein Wert aus der Liste "braun, grün, blau"

Jedes Individuum sollte durch die Summe aller Werte in den verschiedenen Metadatenkategorien eindeutig beschrieben werden. Sobald der Fall auftritt, dass eine Duplizität im Datenbestand auftritt, also zwei Individuen mit vollkommen identischen Werten in allen Metadatenkategorien auftreten, muss das Metadatenschema als unzulänglich betrachtet und modifiziert werden.

(auct. Stephan Lücke)



Mitmachen! (Zitieren)

VerbaAlpina freut sich über jede Unterstützung und bietet unterschiedliche Möglichkeiten für eine aktive Beteiligung an der Projektarbeit.

Es geht z. B. darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen.

Sehr interessiert sind wir auch an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wenn Sie Kenntnisse eines im Alpenraum gesprochenen Dialekts haben, dann würden wir uns freuen, wenn Sie spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina eintragen würden. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z.B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich an unserem Projekt in dieser Weise beteiligen. – Sie haben Bilder von alpentypischen Objekten? Etwa Fotos von Almen, Hütten, Flora, Fauna, Bergen und Landschaft? Dann laden Sie diese doch in unsere Mediathek und halten fest, wo das Bild wann entstanden ist, was darauf zu sehen ist und – sofern Ihnen bekannt – geben einen spezifischen Dialektausdruck zur Bezeichnung für das Abgebildete an.

Parallel zur gezielten Mitarbeit bei VerbaAlpina können Sie sich in unserem System eine eigene Forschungsumgebung einrichten, die Sie für die Sammlung von, hauptsächlich, Sprach- jedoch durchaus auch anderen Daten verwenden können. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Sie haben die Möglichkeit, diese Daten gleichsam ausschließlich für Ihre persönliche Verwendung unter Verschluss zu halten, können sie jedoch auch für den Zugriff anderer Nutzer freigeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Wir möchten Sie dazu ermuntern, möglichst viel von Ihren Daten der Allgemeinheit zur Verfügung zu stellen. Nur auf diese Weise kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.

Um VerbaAlpina zu unterstützen und/oder das System für eigene Interessen zu nutzen, ist es nötig, sich auf unserem Portal zu registrieren: https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register

(auct. Stephan Lücke)



Module (Zitieren)

s. Versionierung

Tags: Informationstechnologie



Normdaten (Zitieren)

Der Begriff NORMDATEN hat seinen Ursprung im Bibliothekswesen. Bei der Katalogisierung von Publikationen ist es z.B. unverzichtbar, Autoren eindeutig identifizieren zu können, um Werke unabhängig von differierenden Schreibweisen oder Namensänderungen jeweils eindeutig dem jeweiligen Autor zuordnen zu können. Die gleiche Notwendigkeit ergibt sich auch bei der Verschlagwortung der erfassten Literatur, etwa um geographische Begriffe, die Gegenstand von verschiedenen Abhandlungen sind, ebenfalls eindeutig identifizieren und diese dann auch aufeinander beziehen zu können. Diese Notwendigkeiten führten zur Anlage entsprechender onomasiologischer Listen, die zunächst individuell von den einzelnen Bibliotheken geführt wurden.

Die Möglichkeiten der technischen Vernetzung von Datenbeständen, deren Anfänge in die 1970er Jahre zurückreichen, erforderten alsbald eine Angleichung der bis dato von den einzelnen Bibliotheken individuell geführten Verzeichnisse. Aus diesem Grund haben die Bibliotheken spätestens in den 1980er Jahren – erste Planungen erfolgten bereits Ende der 1970er Jahre – damit begonnen, die individuellen Verzeichnisse einander anzugleichen und gemeinsame Personen- und Schlagwortverzeichnisse anzulegen, um bibliotheksübergreifende Konsistenz zu erreichen. Im Lauf der Zeit entstanden zunächst thematisch getrennte Verzeichnisse: Ein Personenverzeichnis (Personennamendatei, PND), ein Verzeichnis von Körperschaften (Körperschaftsdatei, GKD) sowie ein Schlagwortverzeichnis (Schlagwortnormdatei, SWD). Schließlich setzte sich die Erkenntnis durch, dass die entstandene thematische Trennung nicht zweckmäßig ist, zumal Personen und Körperschaften nicht nur als Autoren bzw. Herausgeber figurieren können, sondern ihrerseits auch Gegenstand von Publikationen sein können, weswegen sie auch bei Verschlagwortungen auf Basis der Schlagwortnormdatei entsprechend berücksichtigt werden müssen. Aus diesem Grund wurden die drei getrennten Normdateien von 2009 bis 2012 in einer gemeinsamen Unternehmung der Deutschen Nationalbibliothek und der deutschsprachigen Bibliotheksverbünde zur sog. Gemeinsamen Normdatei (GND) vereinigt. Diese steht nunmehr seit 2012, zwischenzeitlich in einer ganzen Reihe von Formaten (MARC 21 Authority, MARC21-xml und RDFxml), der Öffentlichkeit zur Verfügung und wird zunehmend auch für Verschlagwortungen außerhalb des Bibliothekswesens genutzt. So werden Normdaten u.a. in den an der ITG beheimateten DH-Projekten BMLO (Bayerisches Musiker-Lexikon online) und Kaiserhof registriert und zur zweifelsfreien Identifizierung von Personen verwendet.

Unter der Adresse http://ognd.bsz-bw.de/ (ein Dienst des Bibliotheksservice-Zentrums Baden-Württemberg) steht ein komfortables Suchinstrument zur Recherche in der GND zur Verfügung. Mit der GND vergleichbare Normdateien werden von Institutionen, vorrangig Bibliotheken, weltweit geführt. Seit 2003 existiert das von der DNB und Library of Congress gemeinsam ins Leben gerufene Projekt VIAF (Virtual International Authority File), das sich zum Ziel gesetzt hat, diese Datenbestände in einem System zu vereinen und dort abrufbar zu machen.

Auch wenn das System der Normdaten rein theoretisch die eindeutige Identifizierung von Personen und Konzepten erlaubt, hängt die konkrete Nutzbarkeit von der technischen Implementierung in den elektronischen Bibliothekskatalogen ab. In den Katalogen der DNB und der Bayerischen Staatsbibliothek (BSB) liefert die Suche nach "Homère" auch Treffer, deren bibliographische Erfassung nur die deutsche Schreibweise "Homer" enthält. Andererseits listet im Online-Katalog der BSB ein Klick auf einen mit einem Link unterlegten Autorennamen derzeit (Nov. 2018) noch Titel, die nicht nur von dem entsprechenden Individuum, sondern auch von gleichnamigen Autoren stammen.

Auch wenn der Ursprung des Konzepts der Normdaten offenbar im Umfeld des Bibliothekswesens liegt, hat sich die Verwendung von Normdaten mittlerweile auch in anderen Bereichen etabliert. Als Beispiel können die Projekte Geonames (Entität Geographica), Pleiades (Entität antike Geographica) oder auch Glottolog (Entität Weltsprachen) genannt werden.

Normdaten besitzen große Bedeutung für die u.a. von der FAIR-Initiative geforderte Interoperabilität. Durch die Definition eines Normdatums und die Vergabe eines (alpha)numerischen Identifikators besteht, neben der Einbindung in die inhaltliche Erschließung der Bibliothekskataloge, auch die Möglichkeit der logischen und technischen Verknüpfung von kongruenten Daten in von einander getrennten Datenbeständen.

Aus der Perspektive von VerbaAlpina wäre die Etablierung der Normdatenkategorien "morpholexikalischer Typ" (⇒ Typisierung) und "Konzept" methodologisch konsequent und deshalb sehr wünschenswert. Dies würde erlauben, morpholexikalische Typen und Konzepte mit Identifikatoren zu versehen. Auf diese Weise könnten lexikalische Daten weltweit und, im Falle der Konzepte, unabhängig von der Einzelsprache eindeutig aufeinander bezogen werden. Vereinzelt lassen sich Ansätze in diese Richtung beobachten. So werden beispielsweise in den strukturierten Datenbeständen des Wikidata-Projekts sog. Q-IDs vergeben, die außersprachliche Konzepte eindeutig identifizieren und auf diese Weise eine gemeinsame und identische Referenz für die verschiedenen Artikel in den unterschiedlichen Sprachversionen der Wikipedia zu ein und demselben Thema liefern. Das Konzept ALMHÜTTE ist in Wikidata z.B. mit der Q-ID Q2649726 eindeutig identifiziert. Der entsprechende Eintrag in Wikidata verweist auf zugeordnete Wikipedia-Artikel in derzeit (Oktober 2018) insgesamt sieben verschiedenen Sprachen. Von den aktuell (Oktober 2018) insgesamt 2629 von VerbaAlpina erfassten Konzepten konnten bislang genau 400 eine QID zugeordnet werden. Die Q-IDs werden, soweit vorhanden, im Datenbestand von VerbaAlpina registriert. Eine analoge, systematische Identifizierung morpholexikalischer Typen besteht im Rahmen des Wikipedia- bzw. Wikidata-Projekts bislang anscheinend noch nicht. Erst ansatzweise wurden dort bislang L-IDs für sprachliche Bezeichnungen vergeben; ob damit jedoch präzis definierte Typen gemeint sind, wird nicht klar.

Orientiert am Modell der Normdaten-IDs vergibt VerbaAlpina für die Datenkategorien (Entitäten) "Konzept", "morpholexikalischer Typ" (s. Typisierung) und "Gemeinde" eigene Identifikatoren, die per einfachem Mapping auf andere bereits etablierte Normdatensysteme wie etwa die Q-IDs des Wikidata-Projekts bezogen werden können. VerbaAlpina ist überdies bestrebt, speziell die Datenkategorie "morpholexikalischer Typ" in die Systematik der Gemeinsamen Normdatei (GND) einzubringen. Die entsprechende Perspektive besteht, zumal die GND inhaltlich und strukturell erweitert und an die Bedürfnisse der Wissenschaft sowie allgemein kulturtragenden Einrichtungen und Personen angepasst werden soll. Einem entsprechenden Austausch soll die für Dezember 2018 angesetzte Konferenz GNDCon 2018 dienen. Die Interessen von VerbaAlpina werden dort von Mitgliedern der UB München sowie der ITG vertreten werden.

Die GND unterscheidet derzeit die folgenden Entitäten: Körperschaft (Sigle: b), Konferenz (f), Geographikum (g), Person (nicht individualisiert) (n), Person (individualisiert) (p), Sachbegriff (s) sowie Werk (u) (http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/entitaetenSatztypen.pdf?__blob=publicationFile). Einem DNB-Dokument aus der Kategorie "Arbeitshilfen zur gemeinsamen Normdatei (GND)" ist ferner zu entnehmen, dass für die Kategorie "Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen" der spezifische Entitätencode "slz" als Unterkategorie der Entität "Sachbegriff" vorgesehen ist. Es liegt nahe, die Normdaten von VerbaAlpina mit dieser Kategorie zu verknüpfen.

Literatur:
Capellaro 2003

(auct. Stephan Lücke)

Tags: Informationstechnologie



Notation (Zitieren)

In den Textbeiträgen werden die folgenden, weitgehend üblichen Notationsprinzipien angewandt: objektsprachliche Formen (Belegbeispiele) werden kursiviert und sprachliche Bedeutungsangaben werden durch einfache Anführungszeichen markiert, z. B. ita. formaggio 'Käse'. Außersprachliche Kategorien (Konzepte) werden durch Majuskeln repräsentiert. Der Unterschied zwischen sprachlicher Bedeutung und Konzept ist vor allem dann wichtig, wenn es in einzelnen Sprachen/Dialekten kein Wort für bestimmte Konzepte gibt, wie im Fall von KÄSE AUS DER FLÜSSIGKEIT NACH DER ZWEITEN SCHEIDUNG DER FESTSTOFFE. Dafür sagt man ita. ricotta, fra. sérac, alemannisch Ziger usw.; ein hochdeutsches Wort fehlt jedoch.

(auct. Thomas Krefeld)

Tags: Linguistik Webseite



Öffentlichkeit (Zitieren)

Integraler Bestandteil von VerbaAlpina ist auch die direkte, verlagsunabhängige Publikation von Ergebnissen. Denn nicht alles, was Publikation genannt wird, dient der PUBLIKATION. So bewirkt das traditionelle Medium des Drucks mittlerweile das strikte Gegenteil: Es entzieht der Öffentlichkeit Informationen, die ihr angesichts der Forschungsförderung durch öffentliche Mittel in weitestmöglicher Weise gegeben werden sollten und die ihr bei Verwendung der Neuen Medien auch leicht so geliefert werden könnten. Die in den Wissenschaften üblichen papierenen Auflagen von 200 oder 300 Exemplaren schaffen nicht inklusive 'Öffentlichkeit', sondern exklusive Privatheit. Es gibt daher angesichts der leicht verfügbaren Informationstechnologie keinen stichhaltigen Grund, den Druck als Mittel der Wissensverbreitung zu bevorzugen oder absolut zu setzen.
In manchen Wissenschaftsdisziplinen (nach unserer Kenntnis trifft dies u. a. auf die Informatik zu) ist in den vergangenen Jahren gar ein Trend zu beobachten, der die mit den Neuen Medien einhergehenden technischen Möglichkeiten ad absurdum führt: Während es nunmehr eigentlich ein Leichtes ist, weltweit bequemen Zugang zu Informationen und Texten zu gewähren, geschieht auch dort das blanke Gegenteil, indem der entsprechende Zugang nur gegen Bezahlung freigegeben wird. Dies ist sogar ein Rückschritt gegenüber der von uns zuvor kritisierten traditionellen Publikation auf Papier. Wir warnen an dieser Stelle nachdrücklich vor derartigen Entwicklungen, die auch im Bereich der Geisteswissenschaften bereits ansatzweise zu beobachten sind.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Webseite



Onomasiologische Einteilung (Zitieren)

Um die Konzepte in funktionale Kategorien einzuteilen, werden sie in Produkte, Prozesse, Personen, Geräte und Gefäße eingeteilt. Sie können wie folgt charakterisiert werden:

Produkte
Sind im weitesten Sinne Bestandteile des Produkts, d.h. auch Milch kann in diese Gruppe gefasst werden. Desweiteren sind beispielsweise Rahm, Buttermilch sowie Reste wie Molke auch Produkte, aus dem wieder weitere Produkte entstehen.

Prozesse
Über Prozesse werden aus einem wieder andere Produkte (z.B. Molke -> Ziger).

Personen
Meistens sind Personen an Prozessen beteiligt, z.B. der Senner.

Geräte
Die Personen verwenden Geräte, um Produkte in einem Prozess zu verarbeiten. Es wird dazu verwendet, um ein Produkt von dem einen in einen anderen Zustand zu bringen (z.B. die geronnene Milch mithilfe einer Käseharfe zu brechen). Beim Einsatz eines Geräts ist auch immer eine Form von Energie beteiligt, z.B. Muskelkraft oder elektrischer Strom. Die Trennschärfe zum Gefäß ist nicht immer gegeben. Ein Gefäß, das für einen Reifungsprozess vorgesehen ist oder mit dem Flüssigkeit durch Schwerkraft aus einem Produkt, z.B. der Käsemasse entzogen wird, stellt demnach auch ein Gerät dar. Ähnlich ist es mit den verschiedenen Formen von Butterfässern. Sie fassen zwar den Rahm, deren Zweck ist aber nicht die Lagerung, sondern die Verwendung für den Prozess, den Rahm in Butter und Buttermilch zu trennen.

Gefäße
Sind nur für die Lagerung eines Produkts oder für dessen Transport in Verwendung. Das beste Unterscheidungskriterium zum Gerät ist jenes, dass ein Gefäß in der Hinsicht keine Rolle bei einem Prozess spielt, als dass das Produkt dadurch verändert wird.






(auct. Markus Kunzmann)



Onomasiologischer Rahmen (Zitieren)





(auct. Thomas Krefeld)

Tags: Linguistik



Onomastik (Zitieren)

Onomastische Befunde, speziell in der Toponomastik, sind für die Einschätzung einer den Sprachwechsel überdauernden siedlungsgeographischen Kontinuität von grundlegender Bedeutung (vgl. im Blick auf die Alpen schon Steub 1867 und von Greyerz 1933). Hier sind zwei semantische Typen zu unterscheiden: Auf der einen Seite werden antike Formen aus Substratsprachen übernommen ("[j]ene oft unangenehmen Verräther anderer Zeiten", wie Steub 1867, 142, süffisant sagt). Ihre Freilegung muss die Regelmäßigkeiten der historischen Phonetik beachten und gleichzeitig mit vielfältigen Ausnahmen rechnen, die oft durch volksetymologische Remotivation bedingt sind. Auf der anderen Seite gibt es ‘sprechende‘ Namen, mit denen die Sprecher der Substratsprachen explizit benannt wurden, wie zum Beispiel in den alemannischen und bairischen Namen mit der Basis wal(l)-, walch-, welsch- ‘romanisch‘ (vgl. die klassische Arbeit von Ernst Schwarz 1970). Die Vorgehensweise kann aus zwei entgegengesetzte Perspektiven erfolgen, nämlich ausgehend von antiken Belegen (in Itinerarien, auf Meilensteinen u. a.) nach jüngeren oder aktuellen Entsprechungen suchen oder aber in gegenläufiger Richtung für aktuelle Formen Etyma in Form antiker Belege oder sprachwissenschaftlicher Rekonstruktionen identifizieren.
Die erstgenannte Perspektive ist wegen der überschaubaren Inputdaten zweifellos einfacher, denn sie liefert einen Grundbestand von meist gut lokalisierbaren römischen Namen, der systematisch abgearbeitet werden kann. Weitaus anspruchsvoller und auch erheblich aussagekräftiger ist die Rückperspektive. Hier fehlt es weithin an den Voraussetzungen für eine erfolgreiche großräumige Arbeit; viele Gebiete sind namenkundlich nicht erschlossen, da weder die rezenten dialektalen Varianten noch frühe Belege vorliegen. Immerhin ist mit dem Schweizer Ortsnamenportal ein vielversprechender Anfang gemacht worden.
Neben den Siedlungsnamen ist aber gerade die Dokumentation von Flurnamen (etwa von Berg und Almen) wichtig, da sie Rückschlüsse auf die kontinuierliche Nutzung des Geländes erlaubt. Dazu das folgende, ganz vorläufige Beispiel: In seiner wichtigen Studie über die frühmittelalterliche Besiedlung des südlichen Oberbayern und der sich anschließenden Tiroler und Salzburger Gebiete schreibt Franz Weindauer 2014 über das Ergebnis einer umfassenden Auswertung der archäologischen Funde: "Der Abgleich mit den Ergebnissen der Ortsnamenkunde und der Patrozinienforschung hat ergeben, dass erneut die bereits in spätrömischer Zeit besiedelten Regionen stichhaltige Hinweise auf romanisches Leben im Frühmittelalter liefern. Dazu zählen in erster Linie das Ammerseegebiet, das Werdenfelser Land, das östliche Chiemseegebiet und der Rupertiwinkel, aber beispielsweise auch die Region um das Mangfallknie, um Rosenheim und um den Starnberger See" (Weindauer 2014, 249). Dabei orientiert sich die Verteilung der archäologischen Fundorte im alpinen Teil seines Untersuchungsgebiets ganz offenkundig an den Passwegen, also etwa an der Brenneroute, die sich in Innsbruck (von Süden aus gesehen) in einen westlichen Zweig (über den Zirlerberg nach Garmisch und ins Alpenvorland) und einen östlichen Zweig (den Inn abwärts) teilt. Schon ein oberflächlicher toponomastischer Blick auf das ausgedehnte Karwendelgebirge, das im Winkel dieser beiden Routen liegt und bis heute keine einzige etwas größere Siedlung kennt, fördert im Abstand von wenigen Kilometern evidente Romanismen oder romanisch vermittelte vorrömische Wörter zu Tage:
* die Fereinalm < lat. veranum, vgl. spa. verano 'Sommer' sowie den Vereinatunnel im Unterengadin;
* die Krapfenkarspitze zur Basis vorrömisch *krapp- 'Fels', vgl. roh. (sursilvan) crap mit sehr zahlreichen Belegen in der Bündner Toponomastik (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorrömisch *blese 'steile Grashalde', vgl. roh. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 sowie die ebenfalls zahlreichen toponomastischen Belege in Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu mit Verlagerung des Akzents auf die erste Silbe; vgl. die schweizerischen Entsprechungen, wie den roh. Ortsnamen glaretsch in Disentis (vgl. Schorta 1964, 164) und den ostschweizerischen alemann. Ortsnamen Glaretsch in Pfäfers (vgl. ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, vgl. die zahlreichen roh. Belege des Typs laret, zur Variante lat. larictum in Schorta 1964, 185;
* den Bergnamen Juifen < lat. iugum 'Joch', wiederum etliche, weitgestreute Parallelen, vgl. die Ortsnamen Juferte im Simmental südlich Bern, mehrere Juf und giuf, giuv in Graubünden (alle im Ortsnamenportal der Schweiz) sowie den Jaufenpass in Südtirol; wenig östlich vom Juifen liegt der Berg Guffert, dessen Name zur genannten Simmentaler Variante gestellt werden muss.
Eine sorgfältige Analyse würde noch erheblich mehr zu Tage fördern. Man beachte beim letzten Beispiel die deutlich nicht mehr lateinische, sondern romanische Lautgestalt (-g- > -v-, -f). Alle diese Übernahmen setzen Kontakt mit einer romanischsprachigen Bevölkerung voraus, die das Gebirge zur Subsistenz nutzte, und wohl auch Akkulturation an ihre Lebensform. In diesem Sinne hat sich schon Gamillscheg 1935, 306 geäußert: "Der alemannische und bajuwarische Bauer, der dem neubesiedelten Boden seine Frucht abringt, stellt die Verbindung mit den unter gleich harten Bedingungen arbeitenden Romanen her. Nichts zeigt deutlicher, daß sich hier keine nationalen Kämpfe abgespielt haben, als die Tatsache, die altromanischen Ortsnamen und die jüngeren deutschen hier ebenso friedlich nebeneinander weiterbestehen wie Ladiner und Deutschtiroler. Das Eindringen der Alemannen und Bajuwaren in den rätisch-norischen Alpenraum hat keine Kulturzerstörung im Gefolge gehabt."

(auct. Thomas Krefeld)

Tags: Linguistik



Publikation (Zitieren)

Integraler Bestandteil von VerbaAlpina ist auch die direkte, verlagsunabhängige Publikation von Ergebnissen. Denn nicht alles, was Publikation genannt wird, dient der PUBLIKATION. So bewirkt das traditionelle Medium des Drucks mittlerweile das strikte Gegenteil: Es entzieht der Öffentlichkeit Informationen, die ihr angesichts der Forschungsförderung durch öffentliche Mittel in weitestmöglicher Weise gegeben werden sollten und die ihr bei Verwendung der Neuen Medien auch leicht so geliefert werden könnten. Die in den Wissenschaften üblichen papierenen Auflagen von 200 oder 300 Exemplaren schaffen nicht inklusive 'Öffentlichkeit', sondern exklusive Privatheit. Es gibt daher angesichts der leicht verfügbaren Informationstechnologie keinen stichhaltigen Grund, den Druck als Mittel der Wissensverbreitung zu bevorzugen oder absolut zu setzen. Es erhebt sich – ganz im Gegenteil – die Frage, warum Wissenschaftler Einrichtungen und Medien unterstützen sollten, die die Verbreitung ihrer Arbeitsergebnisse systematisch einschränken.
In manchen Wissenschaftsdisziplinen (nach unserer Kenntnis trifft dies u. a. auf die Informatik zu) ist in den vergangenen Jahren gar ein Trend zu beobachten, der die mit den Neuen Medien einhergehenden technischen Möglichkeiten ad absurdum führt: Während es nunmehr eigentlich ein Leichtes ist, weltweit bequemen Zugang zu Informationen und Texten zu gewähren, geschieht auch dort das blanke Gegenteil, indem der entsprechende Zugang nur gegen Bezahlung freigegeben wird. Dies ist sogar ein Rückschritt gegenüber der von uns zuvor kritisierten traditionellen Publikation auf Papier. Wir warnen an dieser Stelle nachdrücklich vor derartigen Entwicklungen, die auch im Bereich der Geisteswissenschaften bereits ansatzweise zu beobachten sind.
Aber auch der Begriff der Publikation hat sich substantiell verändert (vgl. Krefeld 2018c, Abschnitt 14). In umfassendem Sinne gehören dazu:
  • sprachliche Objektdaten;
  • strukturierende Metadaten;
  • wissenschaftlicher Text, der traditionell allein als ‚Publikation‘ bezeichnet wird;
  • Code und seine Dokumentation.
  • VA versteht sich also auch als Instrument zur Veröffentlichung von projektbezogenen Texten. Dafür sind im Wesentlichen drei Formate vorgesehen:
    1. Theoretisch und methodologisch zentrale Begriffe und Probleme werden in konziser Weise unter dem Reiter Methodologie abgelegt.
    2. Ausführlichere analytische Untersuchungen von Projektergebnissen oder theoretische bzw. methodologische Diskussionen können unter Projektpublikationen abgelegt werden.
    3. Kommentare zu den auf der interaktiven Online-Karte visualisierten Daten, wie z.B. zu außersprachlichen Realitäten ('Konzepte') und ihren dialektalen Bezeichnungen ('Morpho-lexikalische Typen', 'Basistypen'), werden in der Kartenlegende durch einen 'i'-Button geöffnet; sie können aber auch dem Reiter LEXICON ALPINUM aufgerufen werden; Kommentare können sehr leicht durch Projektmitarbeiter oder auch durch Externe eingestellt werden.


    Über die Legende zugängliche Kommentarfunktion

    (auct. Thomas Krefeld)

    Tags: Funktionsbereiche



    Quantifizierende Darstellungen (Zitieren)

    [Vorbemerkung: Der nachfolgende Artikel nimmt in Teilen Bezug auf derzeit noch in Entwicklung befindliche Funktionalitäten von VA_WEB, die für die Öffentlichkeit derzeit noch nicht zugänglich sind.]

    Die interaktive Online-Karte von VerbaAlpina erlaubt neben der qualitativen Kartierung auch die Visualisierung aggregierter Daten im Sinne einer quantifizierenden Abbildung der Daten im Raum. Die Aggregierung orientiert sich dabei stets an geographischen Regionen. Der Nutzer hat dabei die Auswahl zwischen Aggregierung auf Basis der Gemeindeflächen (Kleinraum), der sog. NUTS-3-Regionen (Mittelraum) und schließlich der Verbreitungsregionen der drei großen Sprachfamilien Germanisch-Romanisch-Slavisch (Großraum). Darüber hinaus besteht die Möglichkeit, beliebige Gemeindeflächen als individuelle Regionen zu definieren, die dann wiederum als Bezugsgröße der Aggregierung fungieren. Letztere Option kann verzerrenden Effekten entgegenwirken, die sich in der Perspektive der Aggregierung über die administrativ – und somit aus Sicht der Sprachwissenschaft sachfremd – motivierten Flächen der Gemeindegebiete oder der NUTS-3-Regionen ergeben. Im Einzelfall kann die entsprechende Vorgehensweise natürlich nur heuristisch sein, der Nutzer hat aber die Möglichkeit, einmal entdeckte sinnvolle regionale Kohärenzen abzuspeichern, zu kommentieren, wiederzuverwenden und der Allgemeinheit zur Verfügung zu stellen.

    Bezogen auf die gewählten Regionen bzw. Flächen werden sodann sämtliche bis zur Aktivierung der quantifizierenden Darstellung ausgewählten qualitativen Daten aggregiert. Größe und Farbgebung der einzelnen Kartensymbole korrelieren dabei mit der Anzahl der jeweils in einem Symbol gebündelten qualitativen Einzeldaten. Der arithmetisch zugrunde gelegte Maximalwert, bei dessen Erreichen ein Symbol stets die jeweils maximale Größe und Farbgebung erhält, entspricht dabei standardmäßig der höchsten Anzahl an aggregierten Daten, der in einer der ausgewählten Flächen bzw. Regionen auftritt. Wahlweise kann dieser maximale Referenzwert auf die Gesamtanzahl der aggregierten Einzeldaten umgesetzt werden, was zu einer Änderung der Kartendarstellung führt.

    Bei aktivierter Quantifizierung können durch Deaktivierung einzelner Listeneinträge in der Kartenlegende die entsprechenden qualitativen Daten aus der Berechnung der Quantitäten herausgenommen oder andere durch zusätzliche Auswahl hinzugenommen werden.

    Neben der Quantifizierung vor dem Hintergrund einer georeferenzierten, die realen Grenzverläufe abbildenden Karte erlaubt VerbaAlpina auch die Darstellung quantifizierter Daten auf einer sog. Wabenkarte. Gestalterisches Vorbild ist eine Wikipedia-Grafik, die die Wahlergebnisse der britischen Unterhauswahl von 2015 visualisiert. Im folgenden ist zunächst die punkt-, längen- und winkeltreue Karte (im folgenden als "geographische Karte" bezeichnet) mit den Wahlergebnissen in den einzelnen Wahlkreisen wiedergegeben. Daran anschließend ist die Wabenkarte abgebildet, auf der jeder Wahlkreis durch ein Sechseck jeweils identischer Größe dargestellt ist.




    Quelle: https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




    Quelle: https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (abgerufen am 03.11.2016)

    Die Gegenüberstellung der beiden Kartentypen zeigt die jeweiligen Vor- und Nachteile. Die Wabenkarte weist geographische Ungenauigkeiten bzw. diesbezüglich sogar Fehlinformationen auf. So erkennt man z.B. im Distrikt Greater London eine isolierte rote Wabe, die von lauter blauen Waben umgeben ist – ein scheinbares Faktum, das jedoch keinen Rückhalt in der geographischen Karte findet. Auf der anderen Seite besitzt die Wabenkarte den Vorteil, die realen Zahlenverhältnisse zwischen den einzelnen Farben besser zu visualisieren, da eine Vielzahl von flächenmäßig sehr kleinen Wahlbezirken auf der geographischen Karte vom Betrachter als nachrangig wahrgenommen werden, obwohl die politische Bedeutung mit der der flächenmäßig großen Wahlbezirke gleichgestellt ist. Somit ergänzen sich die beiden Kartentypen und der eigentliche Mehrwert besteht in der Möglichkeit, beide Karten konsultieren und deren Visualisierung gegenüberstellen zu können.

    Die Wabenkarte von VerbaAlpina zeichnet sich dadurch aus, dass sämtliche politischen Gemeinden im Alpenraum durch jeweils gleich große Hexagone abgebildet werden. Dabei wird versucht, die geographische Logik wenigstens ungefähr zu bewahren. Die Berechnung der Farbgebung der einzelnen Hexagone erfolgt dort in der gleichen Weise wie oben bei der Punktsymbolkarte beschrieben. Der Vorteil einer solchen Wabenkarte besteht gegenüber einer simplen Einfärbung der Gemeindeflächen auf einer georeferenzierten Karte darin, dass suggestive Effekte durch stark unterschiedliche Größe der Gemeindeflächen unterdrückt werden.

    (auct. Stephan Lücke)

    Tags: Informationstechnologie Webseite



    Quellen (Zitieren)

    In VerbaAlpina werden sehr unterschiedlichen Quellen zusammengeführt. Zu unterscheiden sind bereits publizierte Quellen (Atlanten, Wörterbücher, Ortsmonographien) auf der einen Seite und neue, das heißt durch das Projekt selbst erstmals erschlossene Quellen andererseits; hierzu gehören von Mitarbeitern, wie z. B. von Beatrice Colcuc, erhobene Daten ebenso wie solche, die durch die crowd, d.h. individuelle und nicht persönlich bekannte Sprecher, beigesteuert werden. In Frage kommen ausschließlich Quellen, die bereits georeferenzierte oder wenigstens georeferenzierbare sprachliche Daten liefern. Allerdings müssen diese Daten vor dem Hintergrund der Typisierung systematisch unterschiedlich behandelt werden. Phonetisch exakt transkribierte Äußerungen werden von VerbaAlpina als 'Einzelbeleg' ausgewiesen. Es ist nun sinnvoll, diese Einzelbelege nach bestimmten Kriterien zu gruppieren ('typisieren'); Daten, die von der Quelle in orthographischer Gestalt angeboten werden, können von vornherein als typisiert angesehen werden, da durch diese Form der Verschriftung sehr viel phonetische Varianz ausgeblendet wird. VerbaAlpina gibt daher nicht nur die Quelle an, sondern präzisiert auch den systematischen Status ('Einzelbeleg' vs. 'phonetischer Typ' vs. 'morpho-lexikalischer Typ') des jeweiligen sprachlichen Datums, das die Quelle liefert. Nicht als Quellen gelten die Referenzwörterbücher, mit denen die morpho-lexikalischen Typen lexikographisch abgesichert und im Idealfall verlinkt werden. Dazu die folgenden Beispiele:

    (1) Die Quelle liefert einen Einzelbeleg:

    Einzelbeleg:  [a̠lpˈejo̞] – Ort: Bassano del Grappa – Quelle: ALD-II 848_1, 181 (Valrovina)
    Phonetischer Typ: (nicht typisiert)
    Morpho-lexikalischer Typ: Treccani  alpeggio (roa. m.)
    Basistyp: alpe; vgl. DELI 42
    Konzept:  ALM

    (2) Die Quelle liefert einen phonetischen Typ:

    (Kein Einzelbeleg vorhanden) – Ort: Adelboden
    Phonetischer Typ: Anke – Quelle: SDS V_179_1, BE104
    Morpho-lexikalischer Typ: Anke (gem. m.), vgl. Idiotikon s.v. Anke, 1, 341 ff.
    Basistyp: anko; vgl. Kluge 2001, 47
    Konzept: BUTTER


    (3) Die Quelle liefert einen morpho-lexikalischen Typ:

    (Kein Einzelbeleg vorhanden) – Ort: St. Peter-Pagig
    Phonetischer Typ: Putter – Quelle: SDS V_179_1, GR22
    Morpho-lexikalischer Typ: Butter (gem. n.), vgl. Idiotikon s. v. [[Butter,  1, 341 ff. – Quelle: SDS V_179_1, GR22
    Basistyp: butyru(m); vgl. DELI 178
    Konzept: BUTTER


    (4) Die Quelle liefert einen morpho-lexikalischen Typ, der zwar im Standarddeutschen existiert, jedoch mit einem anderen Konzept verbunden ist:

    Morpho-lex. Typ: Pelz Duden s.v. Pelz (nicht für dieses Konzept); Idiotikon s.v. Belz P-, 4, 1222 – Quelle: SDS V_162_1
    Konzept: HAUT AUF DER MILCH, BEIM ABKÜHLEN NACH DEM KOCHEN

    (auct. Thomas Krefeld | Stephan Lücke)

    Tags: Webseite



    Rätische Inschriften (Zitieren)

    Die neuzeitliche Verteilung der Sprachfamilien im Untersuchungsgebiet lässt die Alpen als eine Barriere, gewissermaßen als gewaltigen Sperrriegel erscheinen, insofern sie grosso modo den deutschsprachigen Raum (nördlich) vom romanisch- und slawischsprachigen Raum (südlich) trennt (Link). Das über den Alpenhauptkamm hinweg deutlich nach Süden ausgreifende,  bairischsprachige Südtirol wirkt beinahe als Sonderfall. Diese 'Ansicht' ist in historischer Perspektive irreführend. Schon die ältesten sprachlichen Zeugnisse, Inschriften aus vorrömischer Zeit, sind in einem weitestgehend identischen Alphabet verfasst:


    (Quelle)

     Die Verbreitung dieser sogenannten 'rätischen' Texte reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua; sie lässt sich nur vor dem Hintergrund eines die Alpen überschreitenden kulturellen Zusammenhangs verstehen: rätische_inschrftn In diesem Alphabet wurden, grosso modo, auch die uns erhalten Dokumente des Etruskischen geschrieben; es geht offensichtlich auf eine antike westgriechische Schrift zurück. Obwohl der Lautwert der Zeichen einigermaßen klar ist, konnte die Bedeutung der Texte bis heute nicht entschlüsselt werde. Es ist weiterhin dunkel, ob der antike Name Raetii 'Räter' im Sinne einer spezifischen Kultur- und/oder Sprachgemeinschaft oder als Sammelbegriff für ganz unterschiedliche alpine Ethnien zu verstehen ist (vgl. dazu Rageth 2012). Jedenfalls kann man feststellen, dass sich das Verbreitungsgebiet der genannten Inschriften durchaus nicht mit der römischen Provinz Raetia deckt. Dasselbe gilt für die von den Archäologen als meist als 'rätisch' identifizierte Fritzens-Sanzeno-Kultur, deren charakteristische Keramik im Westen des heutigen Kantons Graubünden fehlt, obwohl diese Gebiete zur Raetia gehörten, andererseits jedoch an etlichen Orten in der östlich anschließenden Provinz Noricum gesichert wurden (vgl. Lang 1992, Rageth 1992, Marzatico 1992).



    (auct. Thomas Krefeld)



    Rätoromanisch (Zitieren)

    Im Einklang mit der Bundesverfassung der Schweizerischen Eidgenossenschaft wird hier der Ausdruck 'Rätoromanisch' für die romanischen Varietäten Graubündens benutzt, die traditionell nicht zum Italienischen gerechnet werden (vgl. Gross 2004 und Liver 2010). Damit soll aber keineswegs die Zusammengehörigkeit dieses Bündnerromanischen mit dem Dolomitenladinischen und Friaulischen im Sinne einer gemeinsamen 'Sprache' behauptet werden; eben für dieses, heute nicht mehr tragbare Konzept wurde der Ausdruck 'Rätoromanisch' im 19. Jahrhundert von der Sprachwissenschaft ursprünglich geprägt. Die Idee als solche hat Graziadio Isaia Ascoli entwickelt und auf Italienisch als 'ladino' bezeichnet.

    (auct. Thomas Krefeld)

    Tags: Linguistik



    Referent (Zitieren)

    Im Dreieck der aufeinander bezogenen sprachwissenschaftlichen Kategorien "Bezeichnung" – "Konzept" – "Referent" bezeichnet letztere die individuelle Substantiierung eines, seinem Wesen nach, stets abstrakten Konzepts, in anderen Worten eine konkrete, individuelle Sache. Bei dem von VerbaAlpina bearbeiteten Material begegnen zumeist Referenten, die eine bildliche Darstellung als Zeichnung oder Fotografie erlauben. Im Vergleich zu Bezeichnungen und Konzepten spielen die Referenten in VerbaAlpina eine untergeordnete Rolle. Vor allem im Rahmen des "Crowdsourcings" werden Abbildungen, meist Fotos, von Referenten gleichsam als 'Hilfsmittel' eingesetzt, um die bisweilen notwendigerweise umständlichen Konzeptbeschreibungen für Informanten schneller erfassbar zu machen.

    (auct. Stephan Lücke)

    Tags: Linguistik



    Referenzwörterbücher (Zitieren)

    Im Rahmen der für VerbaAlpina zentralen Typisierungsarbeit spielen Referenzwörterbücher eine wichtige Rolle. Alle aus den Quellen gewonnenen Daten, sowohl Einzelbelege als auch phonetische und morpholexikalische Typen, werden auf einen lexikographischen Referenzrahmen bezogen, um eine bessere Vergleichbarkeit des Materials zu gewährleisten. Die Typisierungsarbeit erfolgt durch die Mitarbeiter von VerbaAlpina und basiert auf deren sprachwissenschaftlicher Expertise. Sie bewegt sich somit im Bereich der Interpretationsebene und erhebt keinen Anspruch auf unbestreitbare Gültigkeit. Konkret werden die den Quellen entnommenen Daten mit den Lemmata der im Folgenden gelisteten Referenzwörterbücher verbunden. Innerhalb einer Sprachfamilie werden zu typisierende Sprachdaten jeweils mit passenden Lemmata der sprachraumspezifischen Referenzlexika verbunden. In umgekehrter Perspektive ist es somit möglich, ausgehend von den Lemmata der Referenzwörterbücher, sämtliche zugeordneten VerbaAlpina-Daten aufzufinden. Insofern stellt VerbaAlpina eine organische Erweiterung der verwendeten Referenzwörterbücher dar, die von Seiten der Referenzwörterbücher, die online verfügbar sind, ohne größere Probleme durch Verlinkung technisch realisierbar ist.
    Sofern im Einzelfall keines der definierten Referenzwörterbücher ein passendes Lemma aufweist, legt VerbaAlpina in orthographischer Schreibweise einen morpholexikalischen Typ fest, der fortan Referenzstatus besitzt und auf den alle weiteren Sprachdaten dieser morpholexikalischen Kategorie bezogen werden. Durch diese Eigenreferenzierung erhält auch VerbaAlpina selbst den Status eines Referenzwörterbuchs.
    Da es sich bei der beschriebenen Zuweisung auf die Referenzwörterbücher um eine interpretationsabhängige Arbeit handelt, ermöglicht VerbaAlpina durchaus auch eine kontroverse Kommentierung einzelner Lemmazuweisungen durch Wissenschaftler und Laien, die es Externen erlaubt, alternative Typisierungen vorzunehmen, die ihrerseits wieder kommentiert und diskutiert werden können.


    Wörter aus dem germanischen Sprachraum werden, sofern möglich, verknüpft mit den Lemmata von:
    • Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch
    • Grimm, Jacob und Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm, 16 Bde. in 32 Teilbänden, Leipzig (Quellenverzeichnis Leipzig 1971) (DWB)
    • Duden (Berücksichtigung aufgrund seiner faktischen Bedeutung und der großen Materialfülle – trotz der Dürftigkeit hinsichtlich der von ihm präsentierten lexikographischen Informationen)
    Wörter aus dem romanischen Sprachraum werden, sofern möglich, verknüpft mit den Lemmata von:
    Wörter aus dem slavischen Sprachraum werden, sofern möglich, verknüpft mit den Lemmata von:
    • Slovar slovenskega knjižnega jezika (SSKJ)
    Sofern erforderlich (speziell im Hinblick auf Etyma), dient als Referenzwörterbuch für die lateinische Sprache:
    • Georges, Karl Ernst (1913-1916, Reprint 1998): Ausführliches lateinisch-deutsches Handwörterbuch. Aus den Quellen zusammengetragen und mit besonderer Bezugnahme auf Synonymik und Antiquitäten unter Berücksichtigung der besten Hilfsmittel ausgearbeitet, 2 Bände, Darmstadt.
    Für die Bestimmung der Etymologie speziell von Basistypen dienen als Referenz:
    • Wartburg, Walther von (1922-1967): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel (FEW), mit seinen artikelschließenden Kommentare, die oft auch über das Französische und sogar das Romanische hinaus grundlegend sind.
    • Kluge
    • DELI
    • Bezlaj und auch die neuste Ausgabe Snoj. Allgemein für slawische Etymologien s. Berneker
    • Als Referenzform für germanische Basistypen dienen wenn möglich die Lemmata des AWB, denn sie repräsentieren die ältesten belegten Formen.


    (auct. Thomas Krefeld | Stephan Lücke)

    Tags: Linguistik



    Relationales Datenmodell (Zitieren)

    Das relationale Datenmodell organisiert Informationen in Gestalt von einer oder mehreren Tabellen. Die Bezeichnung rührt daher, dass Tabellen in der Fachsprache auch als „Relationen“ bezeichnet werden. Die Zeilen einer Tabelle werden auch „Datensatz“ oder „Tupel“ genannt, anstatt von Spalten spricht man auch von „Feldern“, „Attributen“ oder „Eigenschaften“. Eine Tabelle kann, zumindest theoretisch, eine unbegrenzte Anzahl von Zeilen und Spalten besitzen. Eine bestehende Tabelle kann jederzeit sowohl um neue Zeilen wie auch um neue Spalten erweitert werden. Eine Sammlung mehrerer Tabellen kann als Datenbank bezeichnet werden. Für die Verwaltung einer solchen Tabellensammlung/Datenbank werden sog. Datenbankmanagementsysteme (DBMS) wie z. B. MySQL oder PostgreSQL eingesetzt. Die Administration der Daten sowie deren Analyse erfolgt mittels einer spezifischen formalen Sprache, der sog. Structured Query Language (SQL), die speziell für den Einsatz über Daten im relationalen Format entwickelt wurde und unter anderem in einer von der ISO standardisierten Version vorliegt (Wikipedia).
    Für die Abbildung von Informationen im relationalen Datenmodell existieren eigene Regeln, die de facto eine Wissenschaft für sich darstellen (z. B. die sog. Normalisierung). Gleichzeitig ist die konkrete Wahl der Modellierung anwendungsabhängig und die Einhaltung bestehender Modellierungsregeln in manchen Fällen aus der Perspektive der Nutzbarkeit und Performanz eher hinderlich. In der Praxis stellt jede Datenmodellierung einen Kompromiss zwischen den Vorgaben des theoretischen Regelwerks, technischen Erfordernissen und Nutzerfreundlichkeit dar. Darüber hinaus kann ein einmal gewähltes Datenmodell jederzeit geändert und an veränderte Erfordernisse angepasst werden.

    (auct. Stephan Lücke)

    Tags: Linguistik



    Repositorien (Zitieren)

    Der Begriff 'Repositorium' ist bislang nicht hinreichend klar definiert, insbesondere die Abgrenzung zum Begriff 'Archiv' ist unscharf. Grundsätzlich versteht man unter Repositorium in der digitalen Welt Speichersysteme, die für die langfristige Bewahrung von Daten gedacht sind. Im wissenschaftlichen Umfeld werden Repositorien zumeist von öffentlich-rechtlichen Institutionen betrieben, bei den zu bewahrenden Daten handelt es sich überwiegend um Forschungsdaten. Wichtigste Eigenschaften eines Repositoriums sind die physische Sicherheit der zu bewahrenden Daten sowie der Erhalt deren Integrität, der unbefristete Bestand der das Repositorium betreibenden Institution, die Dokumentation von Inhalt, Struktur und Kodierung der gespeicherten Daten sowie deren zeit- und ortsunabhängige Verfügbarkeit. Aus Sicht der Geisteswissenschaften spielen derzeit (2016) in Deutschland der Clarin-D-Verbund sowie das Textgrid-Repositorium eine besonders wichtige Rolle.

    VerbaAlpina ist bestrebt, jede VA-Version in einem oder mehreren Repositorien abzulegen.

    (auct. Stephan Lücke)

    Tags: Webseite



    Semantik (Zitieren)

    Die digitale Strukturierung der Daten ('Digitalisierungsgrad D 3') erlaubt eine differenzierte semantische Analyse der erfassten sprachlichen Ausdrücke, denn Synonymien, Polysemien und Homonymien lassen sich durch die Verknüpfung der 'Bezeichnungen' mit den 'Konzepten' in Gestalt so genannter n:m-Beziehungen abbilden:



    Graphik: Stephan Lücke

    Im Lichte der dabei zu Tage tretenden Konzeptrelationen lässt sich das synchrone semantische Profil eines jeden polysemen Ausdrucks skizzieren; die wichtigsten Ausprägungen von Polysemie werden im Folgenden genannt.
    - Taxonomische Polysemie liegt vor, wenn ein Ausdruck hierarchisch sowohl einander über- als auch untergeordnete Konzepte bezeichnet.
    - Meronymische Polysemie liegt vor, wenn ein Ausdruck sowohl komplexe Sachzusammenhänge ('Ganze') als auch Konstituenten dieser Zusammenhänge ('Teile') bezeichnet; so wird die ALM, der für den Bauern wichtige Teil des Berges, häufig schlechthin als 'Berg' bezeichnet: Vgl. Karte Konzept ALM

    Meronymische Bezeichnung des Konzepts ALM als Teil des Bergs durch Übertragung der Bezeichnung des Ganzen
    Morpho-lex. Typ montagna 'Berg' (roa. fem.) (16 Belege)
    Morpho-lex. Typ monte (roa. m.) (67 Belege)

    Andererseits kann die ALM, als wirtschaftliches Ganzes (mit allem, was dazu gehört), mit Ausdrücken bezeichnet werden, die eigentlich nur für Komponenten der Almwirtschaft stehen: Vgl. Karte Konzept ALM

    Meronymische Bezeichnung des Konzepts ALM als Ganzes durch Übertragung der Bezeichnung von Komponenten
    Morpho-lex. Typ cascina 'Sennhütte' (roa. fem.) (1 Beleg)
    Morpho-lex. Typ casera 'Sennhütte' (roa. fem.) (1 Beleg)
    Morpho-lex. Typ cjampei 'Felder' (roa. m.) (2 Belege)
    Morpho-lex. Typ pascol 'Weide' (roa. m.) (1 Beleg)
    Morpho-lex. Typ pascolo 'Weide' (roa. m.) (1 Beleg)

    - Metonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die innerhalb ein und desselben 'Ganzen' unterschiedliche 'Teile' bezeichnen; so gehören zu einer ALM u. a. das VIEH, GEBÄUDE für das PERSONAL und für das Vieh, eine HÜRDE usw. Alle genannten Komponenten können in unterschiedlichen romanischen Ortsdialekten durch den morpho-lexikalischen Typen roa. mandra bezeichnet werden: Vgl. Karte
    Metonymische Bedeutungen des morpho-lexikalischen Typs roa. mandra
    Konzept ALMHÜTTE (1 Beleg)
    Konzept ALMSTALL (2 Belege)
    Konzept HERDE (15 Belege)
    Konzept RINDERHÜRDE (3 Belege)
    - Metaphorische Polysemie liegt vor, wenn ein Ausdruck Konzepte unterschiedlicher Domänen bezeichnet, die in keinem gemeinsamen Zusammenhang stehen. Allein das Konzept RAHM wird mit folgenden Metaphern bzw. metaphorischen Vergleichen bezeichnet:
    1. als 'Kopf': capo (roa. m.), (19 Belege), dazu capo di latte (roa.), wörtlich 'Milchkopf'  (12 Belege), il capo del latte (roa.) (1 Beleg)
    2. als 'Blume': fleur / fiore (roa. m.) (15 Belege), fiora (roa. fem.) (17 Belege), dazu fiora cruda (1 Beleg), wörtlich 'ungekochte Blume', fiore di latte (roa.), wörtlich 'Milchblume' (2 Belege)
    3. als 'Haut': Haut (ger. m.) (2 Belege), peau / pelle (roa. fem.) (1 Beleg), la pelle del latte (roa.) (1 Beleg)
    4. als 'Pelz': pelliccia (roa. fem.) (2 Belege), Pelz (ger. m.) (4 Belege)
    5. als 'Nebel': sbrumacje (roa. fem.) (2 Belege), sbrume (roa. m.) (11 Belege)
    6. als 'Schaum': écume / schiuma (roa. fem.) (2 Belege), spuma (roa. fem.) (1 Beleg), spumacje (roa. fem.) (1 Beleg)
    7. als 'Tuch': toile / tela (roa. m.) (14 Belege), dazu tela del latte (roa.) (1 Beleg) und tela di latte (roa.) (5 Belege), wörtlich 'Milchtuch'
    Der 3. Typ zeigt übrigens sehr schön, dass auch Metaphern über die Sprachfamiliengrenze hinweg verbreitet ein können; in diesem Fall repräsentieren deu. Pelz und roa. pelliccia darüber hinaus denselben Basistyp, nämlich lateinisch pellīcia, die feminine Form eines denominalen Adjektivs von lat. pellis 'Haut'.
      Vgl. Karte

        - Antonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die im Gegensatz zueinander stehen.
      Selbstverständlich kann ein Ausdruck auch mehrere unterschiedliche semantische Beziehungen bezeichnen, wie die Konzepte, die in unterschiedlichen romanischen Varietäten mit dem Basistyp malg- verbunden sind, exemplarisch zeigen.





    (auct. Thomas Krefeld)

    Tags: Linguistik



    Sprachatlanten im Alpenraum (Zitieren)

    Von Westen nach Osten wird die alpine Dialektlandschaft durch die folgenden, teils noch nicht vollständigen Atlanten erschlossen:
    • Romania alpina: ALF, AIS (Details), ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
    • Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAO;
    • Slavia alpina: SLA.
    Die große Zahl darf aber nicht über die erheblichen, teils durchaus überraschenden Diskrepanzen zwischen den einzelnen Atlanten hinwegtäuschen. So sind ausgerechnet manche Regionalatlanten, wie z. B. der ALD-II oder auch der BSA keineswegs besonders an ethnolinguistischen Daten interessiert. Gerade das Almwesen – das ja eine der grundlegenden Wirtschaftsformen des Alpenraums repräsentiert – wird so gut wie überhaupt nicht thematisiert; im ALD-II gibt es zwar (im Unterschied zum BSA) einen Stimulus 869 l'alpeggio 'Alm'/ la baita 'Sennhütte'. Aber schon ganz fundamentale Konzepte der Milchverarbeitung wie SENN (ita. casaro, caciaio), MELKEN (ita. mungere), LAB (ita. caglio), ENTRAHMEN (ita. scremare) und der Viehhaltung wie STALL (ita. stalla), HIRTE (ita. pastore), WEIDE (ita. pascolo) usw. fehlen (vgl. das Fragebuch).

    (auct. Thomas Krefeld)

    Tags: Linguistik



    Sprachfamilien im Alpenraum (Zitieren)

    Im Territorium der Alpenkonvention und damit im Untersuchungsgebiet von VerbaAlpina werden traditionell Sprachen aus drei Sprachfamilien gesprochen. Alle drei sind durch dialektale Kontinua repräsentiert, deren Ausdifferenzierung offenkundig auch von der Ausdehnung ihres Verbreitungsgebiets abhängt. Die Fragmentierung der romanischen Zone ist stärker als die der germanischen und diese wiederum als die der slawischen; über die dialektalen Verhältnisse informieren die einschlägigen Sprachatlanten, deren Erhebungspunkte hier zu einem umfassenden, mehrsprachigen Netz verknüpft werden. Auf der Ebene der übergeordneten Nationalsprachen bzw. regional implementierten Minderheitensprachen ist jedoch nur die Romania alpina weiter untergliedert. Denn neben dem Französischen und Italienischen sind hier nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien das Okzitanische, das im Aostatal politisch offizialisierte Arpitanische (oder: Frankoprovenzalische), das Rätoromanische, das Dolomitenladinische und das Friaulische zu nennen. Die Slavia alpina und die Germania alpina kennen dagegen mit dem Slowenischen und mit dem Deutschen jeweils nur eine Standardsprache. Was das plurizentrische Deutsche betrifft, sind allerdings mindestens für die Schweiz, für Deutschland und für Österreich koexistierende nationale Standardvarietäten zu unterscheiden.
    Das Projekt zielt auf dialektale ('basilektale') Daten; standardsprachliche oder standardnahe ('akrolektale') Varianten werden nicht erhoben; sie können de facto aber jeder Zeit auftauchen, weil die korrespondierenden Dialektformen nicht mehr geläufig oder allenfalls noch passiv bekannt sind; dieser Fall ist in Bereich der traditionellen Lebenswelt nicht selten. Es kann aber ebenso sein, dass lokale Dialektvarianten niemals existiert haben; genau diese Konstellation wird in einer eventuell dritten Phase, in der die moderne Lebenswelt thematisiert werden soll, vermehrt erwartet (vgl. Onomasiologischer Rahmen). Es wäre jedoch zu einfach, die sprachliche Dynamik ausschließlich im Abbau diatopisch markierter Formen zu vermuten: Aktuell fehlende regionale oder lokale Formen schließen zukünftige Entstehungen keineswegs aus.

    (auct. Thomas Krefeld)

    Tags: Linguistik



    Sprachkontakt (Zitieren)

    Beim Sprachkontakt, zu dem auch der Varietätenkontakt gehört, sind zwei grundverschiedene Typen zu unterscheiden, je nachdem ob es sich – auf der Ebene des sprachlichen Systems – um feste, sprecherunabhängige Integrate ('Entlehnungen') oder aber – auf der Ebene des Sprechers – um indivuelle Erscheinungen handelt. Letztere wiederum können habitualisierten oder ganz okkasionellen Verwendungen, so genannten switchings, entsprechen. Dieser Vorbehalt ist auch bei der Interpretation älterer Atlasmaterialien immer dann zu berücksichtigen, wenn ein Informant eine standardnahe Form oder, in zweisprachigen Gebieten, eine Form der jeweiligen Zweitsprache liefert. Der theoretisch fundamentale Unterschied ist angesichts der sprachlichen Daten mehr oder weniger wahrscheinlich, jedoch eigentlich nie evident. Nur die Vermehrung der Informanten, die mit social media zu einer durchaus realistischen Option wird, verspricht hier zuverlässige Auskunft.



    (auct. Thomas Krefeld)

    Tags: Linguistik



    Strata (Zitieren)

    Die diachrone Linguistik ('Sprachgeschichte') unterscheidet zwei historische Sprachkontaktkonstellationen (vgl. Krefeld 2003); beide sind räumlich fundiert und gehen von der im Untersuchungszeitraum gesprochenen Sprache des jeweiligen Gebiets aus; diese Sprache wird gelegentlich als 'Strat' bezeichnet:
  • ehemals im Untersuchungsraum gesprochene Sprachen ('ältere Schichten') werden als 'Substrate' bezeichnet; diese Sprachen wurden im Lauf der Geschichte durch die im Fokus der jeweiligen Sprachgeschichte stehende Sprache – das Strat – verdrängt;
  • Sprachen, die sekundär, durch Eroberung, in den Untersuchungsraum gelangten und die im Fokus stehende Sprache eine gewisse Zeit lang überlagerten, werden als 'Superstrate' bezeichnet; diese Sprachen konnten die überlagerten Sprachen jedoch nicht verdrängen und verschwanden selbst nach mehr oder weniger langer Zeit, etwa im Gefolge politischer Veränderung. So ist zum Beispiel das deutsche Superstrat der romanisch- und slawischsprachigen Gebiete Österreich-Ungarns mit dem Zerfall dieses Staatsgebildes nach dem Ersten Weltkrieg untergegangen.
  • Von Sub- und Superstraten spricht man also nur rückblickend, aus der Sicht einer Zeit, in der die jeweiligen Sprachen im Untersuchungsgebiet nicht mehr gesprochen werden; dabei müssen oft große Zeitspannen überbrückt werden, so dass man sich kurzerhand an den sprachlichen Systemen orientiert und dort nach kontaktinduzierten Veränderungen, also nach den Resultaten des Sprachkontakts sucht. Für das eigentliche Verständnis der mutmaßlichen Sprachkontakterscheinungen ist jedoch die historische Periode der jeweiligen Zweisprachigkeit entscheidend, d.h. die Zeit, in der beide Sprachen neben- bzw. miteinander gesprochen wurden. Diese gleichzeitig gesprochenen Sprachen heißen 'Adstrate'. Damit muss jedoch unweigerlich eine synchronische Perspektive eingenommen werden, die nicht auf die 'Sprachen' beschränkt werden kann, sondern den 'Sprecher' mit seiner spezifischen Kompetenz und womöglich die konkrete Äußerung, das 'Sprechen' mitberücksichtigt. Das ist in historischer Perspektive zwar häufig unmöglich, muss jedoch grundsätzlich auch bei der Rekonstruktion der Stratigraphie bedacht werden, denn die Äußerung eines zweisprachigen Sprecher ist grundsätzlich anders als die eines einsprachigen zu beurteilen.


    (auct. Thomas Krefeld)

    Tags: Linguistik



    Stratigraphie (Zitieren)

    Allgemeines

    Die Alpen sind seit prähistorischer Zeit ein Gebiet vielfältiger Sprachkontakte, die auf ganz unterschiedliche Stratakonstellationen zurückgehen. Grundsätzlich werden Sprachen, die in einem Gebiet in Kontakt stehen, weil es dort mehr oder weniger viele zweisprachige Sprecher oder gar Sprechergemeinschaften gibt, als Adstrate bezeichnet. Falls ein Basistyp nur in einem bestimmten Gebiet verbreitet ist, also etwa in den Alpen, und in den betroffenen Sprachfamilien ansonsten nicht vorkommt, sind die Entlehnungsrichtung und die Herkunftssprache oft nicht eindeutig (vgl. den Basistyp roa. baita / deu. Beiz, Beisl).
    Wenn die Herkunftssprache des entlehnten Elements im Verbreitungsgebiet, oder in einem Teil davon, nicht mehr gesprochen wird, werden zwei Konstellationen unterschieden: Im Fall des Substrats wurde die Herkunftssprache (Substratsprache) im Verbreitungsgebiet gesprochen, bevor ihre Überlieferungskontinuität abriss und die geltende Sprache sich durchsetzte; das Romanische ist eine Substratsprache des gesamten deutsch- und slowenischsprachigen Alpengebiets. Substratwörter setzen zwar Sprachwechsel voraus; sie zeichnen sich aber trotzdem oft durch außerordentliche regionale oder lokale Kontinuität aus.
    Im Falle des Superstrats galt die Herkunftssprache während eines gewissen Zeitraums im Verbreitungsgebiet, ohne sich dort dauerhaft zu etablieren. So herrschten in Teilen des heute romanischsprachigen Alpenraums nach dem Zusammenbruch der römischen Infrastruktur zeitweise germanische Superstrate (Gotisch, Langobardisch) und in Slowenien spielte das Deutsche während der langen Habsburgerzeit diese Rolle.
    Zwischen den drei Sprachfamilien haben sich nun durchaus unterschiedliche Szenarien ergeben; hinsichtlich der Bedeutung des Sprachkontakts für die Geschichte des sprachlichen Raums ist vor allem die Chronologie der Entlehnung wichtig: Handelt es sich beispielsweise bei Romanismen im germanischen und slawischen Sprachraum um Substratwörter mit regionaler Überlieferungskontinuität seit der Antike oder um jüngere adstratale Übernahmen? Dieselbe Frage gilt mutatis mutandis ebenso für die Germanismen im romanisch- bzw. slawischsprachigen und die Slawismen im deutsch- und romanischsprachigen Raum.
    Entlehnungen sind ein zuverlässiger Indikator historischer Akkulturationsprozesse; deshalb ist eine quantitative Darstellung angebracht, die es gestattet, die relative Häufigkeit der belegten Entlehnungen ortsgenau abzubilden. Die Akkulturationsrichtung ist jedoch keineswegs immer eindeutig; nicht selten koexistieren in eng definierten onomasiologischen Bereichen gegenläufige Entlehnungen. Die folgende Graphik schematisiert die stratigraphische Herausforderung. Sie differenziert die drei heute romanisch-, deutsch- und slowenischsprachigen Gebiete nach Substrat- und Superstratsprachen und symbolisiert (durch Kugeln) die mehrsprachigen Sprechergruppen in Adstratkonstellationen. Gleichzeitig wird die besondere historische Bedeutung der Romanisierung verdeutlicht (vgl. Märtin 2017, 102-129), die – wenn auch in sehr unterschiedlicher Intensität – den gesamten Alpenraum erfasste und deshalb wohl auch alles Ältere, Vorrömische vermittelte. Direkter Kontakt zwischen Sprechern vorrömischer Sprachen und Sprechern der das Lateinisch-Romanische gebietsweise überdeckenden nachfolgenden Sprachen (Slawisch und Germanisch) kann zwar nicht kategorisch ausgeschlossen werden; diese Annahme ist jedoch sicherlich problematisch.



    Die zentrale Aufgabe der Wortgeschichte besteht nun darin, die mutmaßliche Entlehnungen stratigraphisch zu präzisieren. Die gegenläufige Entlehnung vom deu. Schmalz > roa. smalzo und lat.-roa. butyrum > deu. Butter sowie dessen Weiterentlehnung ins Slo. (> puter ließe sich dann wie folgt schematisieren.



    Vorrömische Zeit

    Die neuzeitliche Verteilung der Sprachfamilien im Untersuchungsgebiet lässt die Alpen als eine Barriere, gewissermaßen als gewaltigen Sperrriegel erscheinen, insofern sie grosso modo den deutschsprachigen Raum (nördlich) vom romanisch- und slawischsprachigen Raum (südlich) trennt (Link). Das über den Alpenhauptkamm hinweg deutlich nach Süden ausgreifende, bairischsprachige Südtirol wirkt beinahe als Sonderfall. Diese 'Ansicht' ist in historischer Perspektive irreführend. Schon die ältesten sprachlichen Zeugnisse, Inschriften aus vorrömischer Zeit, sind in einem weitestgehend identischen Alphabet verfasst:



    Quelle

    Die Verbreitung dieser meist als 'rätisch' bezeichneten, nicht entzifferten Texte (vgl. Schumacher 2004) reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua; sie lässt sich nur vor dem Hintergrund eines die Alpen überschreitenden kulturellen Zusammenhangs verstehen:
    rätische_inschrftn In diesem Alphabet wurden, grosso modo, auch die uns erhaltenen Dokumente des Etruskischen geschrieben; es geht offensichtlich auf eine antike westgriechische Schrift zurück.

    Römische Zeit

    Die Römer haben dann den zentralen Alpenraum zwischen 25 und 15 v.Chr. erobert; das Tropaeum Alpium in La Turbie, oberhalb von Monaco, berichtet von 46 eroberten Stämmen, deren Namen sich teils bis heute erhalten haben. Die Inschrift ist leider nur in Bruchstücken erhalten, konnte jedoch durch die Naturgeschichte von Plinius dem Älteren (3, 136-137) vollständig rekonstruiert werden: 

    "Imperatori Caesari divi filio Augusto / pont(ifici) max(imo) imp(eratori) XIIII trib(unicia) pot(estate) XVII / senatus populusque Romanus / quod eius ductu auspiciisque gentes Alpinae omnes quae a mari supero ad inferum pertinebant sub imperium p(opuli) R(omani) sunt redactae / gentes Alpinae devictae Trumpilini Camunni Vennonetes Vennostes Isarci Breuni Genaunes Focunates / Vindelicorum gentes quattuor Cosuanetes Rucinates Licates Catenates Ambisontes Rugusci Suanetes Calucones / Brixentes Leponti Viberi Nantuates Seduni Veragri Salassi Acitavones Medulli Ucenni Caturiges Brigiani / Sogiontii Brodionti Nemaloni Edenates (V)esubiani Veamini Gallitae Triullatti Ectini / Vergunni Egui Turi Nemeturi Oratelli Nerusi Velauni Suetri" (Datenquelle: Epigraphik-Datenbank Clauss / Slaby

    Die folgende Übersicht zeigt die Namen aus der Aufzählung, die sich allem Anschein nach in aktuellen Namen identifizieren lassen.
    (Dép. Hautes-Alpes)
    auf dem Trop.Alpium erwähnter Name aktueller Name Geodaten (Breite ; Länge)
    Trumpilini   Val Trompia   45°44'5.87"N ;  10°12'2.20"E
    Camunni  Val Camonica    45°57'17.71"N ;  10°17'21.08"E
    Vennonetes Vinschgau   46°39'44.81"N ;  10°34'39.75"E
    Venostes   46°39'44.81"N ;  10°34'39.75"E
    Isarci Vgl. die Flussnamen Isère, Isar, Isarco (= deu. Eisack   47°23'13.25"N ;  11°16'30.42"E
    Breuni Brenner   47° 9'59.75"N ;  11°25'0.14"E
    Licates Flussname Lech (lat. Likias [2 Jh. n. Chr.], später Licca [570 n. Chr.]  
    Brixentes  eventuell der Gemeindename Brixen   47°30'2.70"N ;   9°44'32.31"E
    Leponti  Val Leventina   46° 6'47.60"N ;   8°17'31.10"E
    Seduni Sitten im Kanton Wallis, Schweiz    46°13'59.25"N ;   7°21'37.80"E
    Caturiges  der Gemeindename Chorges (Dép. Hautes-Alpes)   44°32'44.67"N ;   6°16'31.60"E
    Brigiani der Gemeindename Briançon  44° 53′ 47″N, 6° 38′ 08″E
    Ectini eventuell der Flussname Tinée    43°55'0.23"N ;   7°11'14.69"E
    Vergunni  der Gemeindename Vergons (Dép. Alpes-de-Haute-Provence)   43°19'23.90"N ;   6°17'3.20"E

    Im Gefolge der Eroberung richten die Römer im geographischen Anschluss an die Gallia Cisalpina Provinzen ein, die entweder in den Alpen selbst angesiedelt sind (Alpes Maritimae, Nr. 3 auf der folgenden Skizze; Alpes Cottidae, Nr. 2 auf der Skizze; Alpes Poeniae auch: Alpes Graiae, Nr. 1 auf der Skizze) oder aber die Alpen nach Norden überschreiten Raetia, Noricum):



    Römische Alpenprovinzen (Ausschnitt aus dieser Quelle)

    Die römische Provinzeinteilung im alpinen Raum ist im einzelnen nicht leicht zu beurteilen; insbesondere fällt es schwer, sie direkt auf sprachlich-ethnische Verhältnisse abzubilden. Das größte Rätsel bilden die Raetii 'Räter', d.h. die Namensgeber einer der beiden großen Provinzen im Alpenraum. Über sie konnte sehr wenig und allenfalls Archäologisches in Erfahrung gebracht werden, abgesehen von der kaum bezweifelbaren, allgemeinen Forschungsmeinung, dass es sich nicht um Indogermanen handelte (vgl. dazu Jürg Rageth im HLS). Es ist fraglich, ob sie mit den Etruskern identifiziert werden können; für eine Verbindung sprechen die alpinen Inschriften im etruskischen Alphabet. Allerdings decken sich die Fundorte gerade nicht mit den Provinzgrenzen. Überhaupt deckt sich das Territorium der Raetia höchstwahrscheintlich nicht mit dem Wohngebiet der Räter und auch die spätere Teilung in eine Raetia prima mit der Hauptstadt Curia (heute: Chur) und eine Raetia secunda mit der Hauptstadt Augusta Vindelicorum (heute: Augsburg), ist in dieser Hinsicht keineswegs eindeutig. Die Funde der letzten vorchristlichen Jahrhunderte aus Chur "scheinen eher einem kelt. als einem rät. Kulturkreis nahe zu stehen" (Jürg Rageth im HLS) und die auf dem Tropaeum Alpium erwähnten Vindeliker werden von der Forschung einhellig als Kelten beschrieben; man beachte auch die Kontinuität des Provinznamens Raetia in Gestalt des heutigen Landschaftsnamens Ries (vgl. die Karte zu den römischen Inschriften in dieser Gegend nordwestlich von Augsburg).

    In jedem Fall darf man davon ausgehen, dass der nordalpine Raum intensiver romanisiert war als die eigentliche Gebirgszone; es liegt daher nahe, in spätrömischer Zeit von einer stärkeren Ähnlichkeit zwischen dem nord- und  südalpinen Alpenvorland auszugehen, als zwischen den Alpen'vorländern' und der Gebirgszone. Eine große, kaum geklärte Frage betrifft die Fortdauer der vorrömischen Sprachen nach der Eingliederung des Gebiets in das Imperium Romanum. Es ist ja grundsätzlich denkbar, dass die germanischen und slawischen Einwanderer oder Invasoren nicht nur auf ein lateinisch-/romanischsprechende Bevölkerung, sondern womöglich auch noch auf Kelten trafen. In diesem Fall, dessen Wahrscheinlichkeit schwer einzuschätzen ist, hätten sprachliche Elemente unmittelbar aus vorrömischen Sprachen (jedenfalls aus dem Keltischen) ins Germanische und Slawische entlehnt werden können. In der Regel muss man jedoch davon ausgehen, dass alles Vorrömische in romanisierter Gestalt, d.h. als romanische Form an die nachrömischen Strata vermittelt wurde.

    Zur unterschiedlich starken, womöglich speziell inneralpin schwächeren Romanisierung sind die archäologischen Erkenntnisse über die Lepontier aufschlussreich:

    "Als Folge der röm. Expansion in der Poebene kamen die L. ab dem 2. Jh. v.Chr. schrittweise mit römisch geprägten Sitten und Gebräuchen in Kontakt und sie übernahmen erneut – in einem radikal veränderten hist. Umfeld – die Rolle von Mittlern zwischen der Nord- und der Südseite der Alpen. Mit den Feldzügen des Augustus (35-15 v.Chr.), deren Ziel die Unterwerfung der Alpenvölker zur Sicherung der Handelswege und des militär. Durchgangs durch die Alpen war, wurden die L. ins röm. Verwaltungs- und Wirtschaftssystem integriert. Trotz tiefgreifender Akkulturationsprozesse überlebten einige traditionelle Elemente der L., besonders bei der weibl. Bekleidung und den Bestattungsriten, bis ins 2.-3. Jh. n.Chr." (Gianluca Vietti im HLS)

    In jedem Fall ist es zum Verständnis möglicher Sprachkontaktszenarien sinnvoll, georeferenzierbare historische Daten in die Datenbank mit aufzunehmen, also zum Beispiel archäologische Funde, das spätantike Straßenverzeichnis der so genannten Tabula Peutingeriana (Link_1, Link_2), die römischen Alpenpässe, die römische Epigraphik usw. So zeigt diese Karte einerseits, dass die früh im bairischen Raum gegründeten Klöster und die ersten germanischen Funde sich offenkundig an romanische Infrastruktur anlagern, die sich in Gestalt von Inschriften, antiken Ortsnamen und der frühmittelalterlichen Bezeichnung anwesender Romanen (Walchen) manifestiert. Andererseits ist in eben diesen Verdichtungsgebieten gleichzeitig mit mutmaßlich frühen Entlehnungen zu rechnen, wie caseareus, -a zeigt.



    (auct. Thomas Krefeld)

    Tags: Linguistik



    Stratigraphie und Onomasiologie (Zitieren)

    Manche onomasiologische Bereiche weisen deutliche Affinitäten zu Entlehnungen auf; so finden sich für etliche Konzepte aus dem Bereich des Almwesens, speziell der Milchverarbeitung im Deutschen romanische bzw. vorrömische Bezeichnungstypen (vgl. die Basistypen: butyru(m), caseu(m), caseāria, crama, tegia, stabulum u. a.).
    Das spricht in unmissverständlicher Weise dafür, dass die entsprechenden grundlegenden Kulturtechniken im Alpenraum sehr alt sind und an jeweils hinzukommende Ethnien und ihre Sprachen weitergegeben wurden. Aber es wäre natürlich zu einfach, bestimmte onomasiologische Teilbereiche zur Gänze mit bestimmten sprachlichen 'Schichten' zu verknüpfen. Es ist vielmehr bemerkenswert, dass gerade auch Entlehnungen in entgegengesetzter Richtung belegt sind und daher dauerhafter gegenseitige kultureller Austausch anzunehmen ist. Charakteristisch sind die komplementären Bezeichnungstypen für das Konzept BUTTER. Während sich im Bairischen der romanische Typus Butter durchgesetzt hat, ist der deutsche Typ Schmalz in einem Teil der romanischen Mundarten etabliert: Vgl. die synoptische Karte der Basistypen butyrum und Schmalz.

    Es scheint also, als ob sich das Auslassen, d. h. das Schmelzen (daher Schmalz) der Butter als elementare Konservierungstechnik ausgehend vom deutschsprachigen Gebiet nach Süden verbreitet hätte.
    Ein vergleichbares Bild geben die Bezeichnungstypen lat. stabulu(m) und deu. Stall für einfache Almgebäude: Vgl. die synoptische Karte zu den Basistypen lat. stabulu(m) und deu. Stall.



    (auct. Thomas Krefeld)

    Tags: Linguistik



    Stratigraphie: Romanismen (Zitieren)

    Als 'Romanismen' werden in VA alle im heute deutsch- bzw. slawischsprachigen Teilgebiet des Untersuchungsgebiets erhobenen Ausdrücke bezeichnet, die unmittelbar aus dem Romanischen und mittelbar aus dem Lateinischen bzw. aus vorrömischen Sprachen stammen. Dabei sind im Hinblick auf die regionale Stratigraphie ebenso wie im Hinblick auf die großräumige 'Architektur' des Deutschen und Slowenischen im Wesentlichen zwei verschiedene geolinguistische und historische Konstellationen zu unterscheiden.
    (1) Exklusiv dialektale Romanismen
      Diese Kategorie, zu der die lokalen Varianten ohne Entsprechungen in der Standardsprache gehören, bildet gewissermaßen die prototypischen romanischen Entlehnungen des Alpenraums; es handelt sich in aller Regel um Substratwörter, d.h. um solche Ausdrücke, die in der Zeit der romanisch-germanischen bzw. romanische-slawischen Zweitsprachigkeit entlehnt wurden und den späteren Sprachwechsel zur germanischen bzw. slawischen Einsprachigkeit grosso modo ortsfest als Relikte überdauert haben. Ein eindeutiges Beispiel liefert der morpho-lexikalische Typ Käser, der so wie sein romanisches Äquivalent casera auf den Basistyp lat. casearia zurückgeht: Vgl. die Karte zum Basistypen casearia.

      (2) Dialektale Romanismen mit Entsprechungen in der Standsprache und in den romanischen Dialekten des Untersuchungsgebiets
        Da auch bei dieser Gruppe sowie im Falle von (1) eine areale Verbreitung gegeben ist, die die aktuellen Grenzen der Sprachfamilien überschreitet, liegt es nahe, die standardsprachlichen Varianten auf die dialektalen Formen zurückzuführen. Diese Kategorie der Romanismen kann daher auch über den Alpenraum hinaus sprachgeschichtliches Interesse beanspruchen. Ein eindeutiges, in der Etymologie des Standarddeutschen verkanntes Beispiel liefert deu. Butter.
      Die folgende Karte zeigt klar, dass die maskuline süddeutsche Variante der Butter eine gemeinsames Areal mit dem ebenfalls maskulinen romanischen Typ butirro und beurre bildet und insofern als historisch primär gegenüber der femininen Standardvariante die Butter angesehen werden muss: Vgl. die Karte zum Basistypen butyru(m).

      Dieses Muster der primären süddeutschen Entlehnung und ihrer sekundären Verbreitung ins Standardeutsche scheint jedoch nicht immer eindeutig, da auch die Möglichkeit der umgekehrten Verbreitungsrichtung aus dem Standard in die Dialekte des Untersuchungsgebiets in Betracht gezogen werden muss. So könnte man eventuell die deutschen Entsprechungen des Basistyps lat. cellārium sehen.
      Sowohl im Fall der exklusiv dialektalen wie der dialektal-standardsprachlichen Romanismen sind im Einzelnen substratale lokale Relikte und adstratale Entlehnungen mit sekundärer arealer Verbreitung zu unterscheiden.


    (auct. Thomas Krefeld)

    Tags: Linguistik



    Synoptische Karte (Zitieren)

    Diese Funktion erlaubt es dem Nutzer, eine getroffene Auswahl an Karten auf einer synoptischen Kombinationskarte zu fixieren . So können die Verbreitungsgebiete beliebiger sprachlicher und außersprachlicher Merkmale im Zusammenhang visualisiert werden. Gleichzeitig besteht die Möglichkeit, diese synoptischen Karten in Zoomstufen festzuhalten, wenn ein lokaler Kontext, wie z.B. das Karwendel oder das okzitanisch-frankoprovenzalisch-piemontesische Dialektkontinuum der Westalpen, dokumentiert werden soll.

    (auct. Thomas Krefeld)

    Tags: Webseite



    Tabula Peutingeriana (Zitieren)

    Die Tabula Peutingeriana (T.P.) ist eine vermutlich im 12. oder 13. Jh. entstandene kartographische Darstellung der bedeutendsten Ortschaften und Verkehrswege im römischen Kaiserreich. Sie befindet sich heute in der österreichischen Nationalbibliothek in Wien (Codex Vindobonensis 324). Es handelt sich um einen aus mehreren Einzelteilen bestehenden Pergamentstreifen von knapp sieben Metern Länge bei einer Höhe von etwas über 30 Zentimetern (genaue Maße: 6,8 m x 0,33 m).




    Ausschnitt aus der Tabula Peutingeriana (in der Mitte Apulien und Kalabrien, dazwischen der Golf von Tarent, unterhalb von Kalabrien Sizilien)

    Die Abdeckung der Karte geht nach Osten hin über die Grenze des römischen Reiches hinaus und reicht bis an die Ostküste Indiens, wobei das in diesem Bereich abgebildete Orts- und Straßennetz verglichen mit dem Gebiet des römischen Reichs stark ausgedünnt ist. Die Teile der Karte, auf der die britische Hauptinsel, die iberische Halbinsel sowie der Bereich der nordafrikanischen Küste westlich von Algier abgebildet waren, sind heute verloren (die dortigen Ortschaften und Straßenverläufe wurden z.T. jedoch aus den Angaben im sog. Itinerarium Antonini ergänzt, einem Itinerar aus dem 3. Jh., das allerdings nicht in Kartenform, sondern in Gestalt einer bloßen Routenliste samt Entfernungsangaben vorliegt [ Text ]). Die Darstellung der Karte ist weder winkel- noch maßstabsgetreu und insofern nicht mit modernen Karten vergleichbar. Wenigstens ansatzweise entspricht die Abbildung der Küstenverläufe jedoch durchaus den realen Verhältnissen. Ein Beispiel hierfür ist die Darstellung Unteritaliens, die eindeutig Stiefelabsatz und -spitze sowie den dazwischen liegenden Golf von Tarent erkennen lässt. Auf der T.P. sind neben Landflächen und Meeren auch Flußläufe und Gebirgszüge eingetragen. Der vordergründige Informationsgehalt der Karte besteht in der ungefähren Lokalisierung und Benennung von Ortschaften sowie den zwischen den Ortschaften bestehenden Straßenverbindungen (Seewege sind nicht kartiert). Die Markierung von Ortschaften geschieht in unterschiedlicher Weise in Abhängigkeit von deren Größe und Bedeutung. Während vergleichsweise bedeutende Orte durch schematische Darstellungen von größeren oder kleineren Bauwerken angezeigt werden, sind unbedeutende Siedlungen nur durch einen "Knick" innerhalb eines Straßenverlaufs markiert. Grundsätzlich gibt die Karte die Distanz zwischen zwei mit einer Straße verbundenen Ortschaften in römischen Meilen an. Die von der Karte gegebenen Informationen weisen z. T. Inkonsistenzen auf. So ist einerseits das i. J. 79 zerstörte Pompeji verzeichnet, andererseits findet sich der Name Constantinopolis, der der Stadt Byzantion erst im Jahr 337 verliehen worden ist. Diese Inkonsistenz mag darauf hindeuten, dass die T.P. entweder direkt oder mittelbar auf unterschiedlichen Quellen basiert.

    Es ist umstritten, welcher Art die antiken Vorlagen gewesen sind, auf die die T.P. rekurriert. Insbesondere ist unklar, ob es eine antike kartographische, in ihrer Erscheinungsform mit der T.P. vergleichbare, Vorlage gegeben hat, an der sich die T.P. orientierte. Diese Frage berührt die viel grundsätzlichere Thematik, ob es in der Antike überhaupt "Landkarten" im modernen Sinn gegeben hat, wobei hier differenziert werden muss. Tatsächlich erhalten sind Kataster- und Stadtpläne. Ein prominentes Beispiel ist die sog. Forma Urbis, ein Plan der Stadt Rom, der unter Kaiser Septimius Severus zu Beginn des 3. Jhs. angefertigt wurde. Der Plan, der auch detaillierte Grundrisse von Gebäuden präsentiert, war auf insgesamt 150 Marmorplatten aufgetragen, die an einer Innenwand des Templum Pacis in Rom angebracht wurden. Zahlreiche Fragmente dieses Plans sind erhalten. Ein weiteres Beispiel antiker "Kartographie" sind die sog. Katasterpläne von Orange. Dabei handelt es sich um insgesamt drei unterschiedliche Pläne, die die Landaufteilung in der Umgebung der römischen Kolonie Arausio (= Orange) in der Provence dokumentieren und deren Entstehung in das letzte Viertel des 1. Jhs. datiert wird (Kaiser Vespasian). Fragmente auch dieser Pläne sind bis heute erhalten (Musée d'Art et d'Histoire in Orange).

    Bei der Forma Urbis wie auch bei den Katasterplänen von Orange handelt es sich um Kartierungen einzelner "Siedlungsplätze" im weitesten Sinn. Kartographische Werke, die die übergeordnete Dimension, also die Verortung von Siedlungsplätzen in ihrem lokalen Verhältnis zueinander, abzubilden versuchen, sind realiter nicht aus der Antike auf uns gekommen. Es gibt lediglich eine Reihe von literarischen Nachrichten aus der Antike, die als Hinweise auf die Existenz solcher Kartenwerke interpretiert werden können, was im Einzelfall jedoch sehr umstritten ist. Reisende in der Antike bedienten sich zur Orientierung für gewöhnlich wohl sog. Itinerare, Listen, die die Namen der Ortschaften nannten, die auf einer Reise von einem Punkt A zu einem Punkt B nacheinander anzusteuern waren, und die außerdem die Distanzen zwischen den Orten angaben. Im wesentlichen sind dies die Informationen, die auch aus der T.P. abzulesen sind. Dies lässt an die Möglichkeit denken, dass die T.P. unter Umständen nichts anderes ist als eine nachträgliche, rein mittelalterliche Visualisierungsform eines oder mehrerer solcher antiker Itinerare.




    Abschrift eines Itinerars, das auf einen bei der toskanischen Ortschaft Vicarello gefundenen Silberbecher (einer von insgesamt vier nahezu identischen) geschrieben ist und das die Route von Gades/Cadiz nach Rom beschreibt (Itinerarium Gaditanum)

    Für VerbaAlpina ist zunächst das toponomastische Repertoire von Interesse, das durch die Karte überliefert wird, da es Einblicke in historische Gegebenheiten und Prozesse erlaubt, die vor allem für die Substratforschung von Bedeutung sind (s. z.B. T. Krefeld, Wortgeschichte und Toponymie: zur Familie von ‚Salles‘, ‚Sala‘ und Verwandtem, in: VerbaAlpina 18/1, https://www.verba-alpina.gwi.uni-muenchen.de/?p=2064&db=181). Die durch die T.P. dokumentierten in der Antike benutzten Verkehrsrouten durch die Alpen können wiederum Aufschluss über die möglichen Verbreitungswege sprachlicher Phänomene geben.

    Die auf der T.P. verzeichneten Routen durch die Alpen sind eindeutig hauptsächlich auf deren Überquerung ausgerichtet. Rein inneralpine, gleichsam quer zu den großen Transitrouten verlaufende Kommunikationswege, die etwa gezielt verschiedene Talschaften miteinander verbinden würden, sind nicht kartiert. Aufs Ganze gesehen kann man das auf der T.P. abgebildete Straßensystem in einen West- und in einen Ostteil gliedern. Die Straßen südlich des Genfer Sees verbinden im Wesentlichen Italien mit den gallischen Provinzen, vor allem der Gallia Narbonensis. Die eingezeichneten Verkehrswege des Ostteils führen von Italien aus in die Provinzen Raetia und Noricum. Unter den Straßen des Westteils befindet sich auch eine der ältesten römischen Straßen im Alpenraum: Die Via Domitia, die zwischen 122 und 118 v. Chr. vom Prokonsul Gnaeus Domitius Ahenobarbus zur Anbindung der neu eingerichteten Provinz Gallia Transalpina (später: Narbonensis) angelegt worden war. Sie führte von der Poebene durch die Val di Susa (Segusio) über den Col de Montgenèvre (1850 m) hinüber nach Briançon und von dort weiter über Gap nach Narbonne (Narbo). Erst gut 100 Jahre nach der Erbauung der Via Domitia wurde von Augustus die Via Iulia Augusta angelegt, die die Seealpen in unmittelbarer Meeresnähe überwindet und an deren höchstem Punkt (512 m) das Tropaeum Alpium steht. Neben diesen beiden Straßen mit prominenter Benennung verzeichnet die T.P. in den Westalpen weitere zwar namenlose, zweifellos jedoch auch bedeutende und stark frequentierte Routen. Eine davon führte durch das Aostatal und schließlich, nach der Gabelung bei Aosta, über den Großen Sankt Bernhard (2469 m) hinüber in das Wallis und schließlich zum Genfer See bzw. über den Kleinen Sankt Bernhard (2188 m) und in der Folge über Albertville und Chambery nach Vienne im Rhonetal. Abzweigungen von der Via Domitia führten nach Vienne und Valence. Es fällt auf, dass der Abstand zwischen den einzelnen Etappenorten im Bereich der Westalpen im Schnitt markant geringer ist als bei den auf der T.P. verzeichneten Streckenverläufen in den Ostalpen.

    In den Ostalpen verzeichnet die T.P. im Wesentlichen vier Übergänge von Italien nach Raetien bzw. Noricum. Am weitesten im Westen liegt die Route, die Mailand (Mediolanum) mit Bregenz (Brigantium) und schließlich Augsburg (Augusta Vindelicum) verband. Sie führte von Como über Chiavenna und den Splügenpass (2114 m) nach Chur (Curia) und folgte dann dem Rheintal bis zum Bodensee. Weiter im Osten ist der Verlauf der Via Raetia eingetragen, die Verona über den Brenner mit Augsburg verband. Im südlichen Abschnitt, von Verona bis Bozen (Pontedrusi), folgte sie dabei der Trasse der Via Claudia Augusta, jener Straße, die bereits unter Augustus angelegt und später von Kaiser Claudius ausgebaut worden war. Anders als diese, die von Bozen durch das Vintschgau und dann über den Reschen- (1504 m) und den Fernpass (1216 m) Richtung Augsburg führte, folgte die Via Raetia dem Lauf des Eisack bis zum Brenner (1370 m) hinauf und führte von dort weiter über den Seefelder Sattel (1185 m) und Partenkirchen. Die Via Raetia war erst von Kaiser Septimius Severus (193-211) angelegt worden und verkürzte die Strecke von Verona bis Augsburg um rund 70 Kilometer. Besondere Hindernisse, die dem Ausbau dieser Route zunächst entgegenstanden, waren die Eisackschlucht zwischen Bozen und Klausen (Sublabione) sowie die Sillschlucht bei Innsbruck. Noch weiter im Osten verzeichnet die T.P. je eine Straßenverbindung von Viruno, dem heutigen Maria Saal wenig nördlich von Klagenfurt, über den Radstädter Tauernpass (1738 m) nach Salzburg (Iuvavo) bzw. über die Triebener Tauern (1274 m) nach Liezen (Stiriate) und von dort weiter nach Wels (Ovilia = Colonia Aurelia Antoniana Ovilabis).

    Die auf der T.P. im Alpenraum verzeichneten Straßenverbindungen repräsentieren bei weitem nicht alle in der römischen Antike genutzten Verkehrswege in dieser Region. Als Beispiel sei hier nur die Römerstraße genannt, die über den Iulierpass (römischer Meilenstein auf der Passhöhe) führend das Oberengadin mit Chur im Rheintal verband.

    Einige wenige der von der T.P. im Alpenraum verzeichneten Ortschaften sind in ihrer Bedeutung durch die Verwendung eines besonderen Symbols in Hausform hervorgehoben. Innerhalb des Perimeters der Alpenkonvention sind dies im Bereich der Westalpen Riez (Reis Apollinaris = Colonia Iulia Augusta Apollinarium Reiorum) und Aosta (Augusta Pretoria = Colonia Augusta Praetoria), in den Ostalpen Bregenz (Brigantio), Trient/Trento (Tredente), Maria Saal (Viruno = Claudium Virunum, von Kaiser Claudius als Hauptstadt der Provinz Noricum gegründet, Nachfolger der Siedlung auf dem Magdalensberg) sowie Salzburg (Iuvavo = Iuvavum).

    Die auf der interaktiven Karte von VerbaAlpina gegebene georeferenzierte Präsentation der Daten von der T.P. basiert auf der entsprechenden Vorarbeit von René Voorburg (https://omnesviae.org/), der die Nachnutzung seiner Arbeit ausdrücklich gestattet, wofür ihm hier gedankt sei.


    Lit.: Brodersen 1995, S. 186f. (T.P. als "Umsetzung von Itinerar-Texten in eine Graphik"); Fellmeth, Ulrich, “Tabula Peutingeriana”, in: Der Neue Pauly, Herausgegeben von: Hubert Cancik, Helmuth Schneider (Antike), Manfred Landfester (Rezeptions- und Wissenschaftsgeschichte). Consulted online on 27 November 2018 http://dx.doi.org.emedien.ub.uni-muenchen.de/10.1163/1574-9347_dnp_e1128120> First published online: 2006; Rathmann 2016. -
    http://www.cambridge.org/us/talbert/talbertdatabase/prm.html


    (auct. Stephan Lücke)

    Tags: Außersprachlicher Kontext



    Technologie (Zitieren)

    VerbaAlpina verwendet soweit möglich online-Technologie. Herzstück ist eine Wordpress-Installation (Modul VA_WEB), an die mehrere MySQL-Datenbanken (Modul VA_DB) angebunden sind. Bei Wordpress handelt es sich um ein kostenfrei verfügbares, quelloffenes (open source) und individuell erweiterbares PHP-Framework, dessen Funktionalitäten durch den Einsatz von Javascript-Bibliotheken ergänzt werden. Letzteres trifft vor allem auf die interaktive online-Karte zu, die sich in den ersten Versionen von VerbaAlpina der einschlägigen Javascript-Bibliothek von Google Maps bediente. Voraussichtlich mit der VA-Version 19_1 erfolgt die Umstellung auf das quelloffene Javascript-Framework "Leaflet", die mit der Implementierung eines hochperformanten WebGL-Layers zur Visualisierung großer Datenmengen einhergeht.

    Soweit möglich und sinnvoll, werden sämtliche von VerbaAlpina entwickelten Wordpress-Funktionalitäten als sog. Plugins realisiert, die anschließend auf der weithin bekannten und innerhalb der Entwickler-Community fest etablierten Plattform "Github" abgelegt werden (https://github.com/VerbaAlpina/). Sie können von dort uneingeschränkt heruntergeladen und nachgenutzt werden. Die Verwendung der Plugins wird im Rahmen der im Bereich der Softwareentwicklung weit verbreiteten MIT- Lizenz gestattet. Die auf Github angezeigte Unterscheidung zwischen PHP- und Javascript-Plugins ist artifiziell und wurde vom Github-System automatisch eingetragen. Die meisten der von VerbaAlpina entwickelten Plugins enthalten grundsätzlich neben PHP-Code immer auch gewisse Anteile an Javascript-Code. Derzeit (November 2018) stehen auf der Github-Seite von VerbaAlpina die Plugins "TranscriptionTool-Plugin", "Interactive-Map_Plugin", "Verba-Alpina-Plugin" zur Verfügung. Zusätzlich kann von dort auch das "Verba-Alpina-Theme" heruntergeladen werden, das hauptsächlich für das Design des Frontends verantwortlich ist. Es ist vorgesehen, noch weitere von VerbaAlpina entwickelte Funktionserweiterungen in Form von Plugins auf Github zum Download anzubieten.

    Liste der wichtigsten bislang von VerbaAlpina entwickelten Funktionserweiterungen:

    • Interaktive Online-Karte (vielschichtige Visualisierung von Datenanalysen)
    • Transkriptionstool (für die Transkription hauptsächlich von Sprachatlanten)
    • Typisierungstool (Kategorisierung von erfasstem Sprachmaterial und Zuweisung zu Typen)
    • Konzeptbaum (Verwaltung der hierarchischen Struktur der außersprachlichen Konzeptwelt)
    • CS-Tool ("Crowdsourcing"-Tool; Erhebung von Sprachmaterial über das Internet zur Abrundung und Ergänzung des Datenmaterials)
    • SQLtoHTML (direkte Einbindung der Ergebnisse von SQL-Abfragen in Wordpressbeiträge)

    Neben diesen komplexen Tools, die sehr wahrscheinlich auch für Anwender jenseits von VerbaAlpina von Nutzen sein können, erfolgte die Entwicklung von zahlreichen Funktionalitäten im Detail, deren Umformung in modular verwendbare Plugins nicht sinnvoll erscheint, da sie entweder zu geringfügig oder zu spezifisch zugeschnitten auf die Erfordernisse von VerbaAlpina erscheinen. Zugänglich ist jedoch auch diese Kategorie von Entwicklungen, zumal neben den erwähnten Plugins auch der komplette Softwarecode von VerbaAlpina auf Github abgelegt wird.

    Das an die Wordpress-Umgebung angebundene Backend besteht, wie gesagt, aus mehreren MySQL-Datenbanken. Die Datenbank va_wp basiert auf dem Standard-Modell einer MySQL-Datenbank, wie sie üblicherweise als Backend von Wordpress-Installationen Verwendung finden. Über diese Datenbank werden hauptsächlich die "generischen" Funktionalitäten einer Wordpress-Installation wie z.B. die Benutzerverwaltung abgewickelt. Der zentrale fachwissenschaftliche Datenbestand von VerbaAlpina wie etwa Transkriptionen (Tabelle `tokens`), Typisierungen im weitesten Sinn (`morph_typen`, `basistypen`, `etyma`, `lemmata`), Konzepte (`konzepte`), Methodologie-Einträge (`glossar`), Beiträge des Lexikon alpinum (`im_comments`) oder auch die Bibliographie (`bibliographie`) befindet sich in der Datenbank va_xxx. Das Suffix "xxx" bezeichnet dabei die jeweilige Arbeitsversion von VerbaAlpina, deren Datenbestand durch den laufenden Betrieb ständigen Änderungen unterliegt. Bei der Erzeugung einer VerbaAlpina-Version wird jeweils eine dann stabile Kopie dieser Datenbank erzeugt, deren Name die entsprechende Versions-Nummer als Suffix erhält (z.B. va_181). Außerdem existiert für eine Reihe von Kooperationspartnern von VerbaAlpina jeweils eine MySQL-Datenbank. Die Namen dieser Datenbanken weisen jeweils das Praefix "pva_" (= "Partner von VerbaAlpina") auf, es folgt das Kürzel des Partnerprojekts (z.B. pva_ald-i).

    Die von VerbaAlpina in der Mediathek (Modul VA_MT) der Wordpressinstallation gesammelten Mediendateien (Bilder, Videos, Tonaufnahmen) werden, wie bei Wordpress-Installationen üblich, im Filesystem des Webservers gespeichert.

    Alle technologischen Instanzen von VerbaAlpina, also die Wordpress-Installation wie auch die Datenbanken, nutzen die IT-Infrastruktur der IT-Gruppe Geisteswissenschaften der LMU. Diese Institution betreibt ein professionelles IT-Management mit hochverfügbaren Web- und Datenbankservern und greift dabei auch auf Dienste des Leibniz-Rechenzentrums der Bayerischen Akademie der Wissenschaften zurück. Der Bestand der ITG ist mit derzeit insgesamt sieben unbefristeten Personalstellen langfristig gesichert. Ein Teil des Personals widmet sich ausschließlich dem Betrieb sowie der Wartung und Pflege von Server-Hard- und -Software.

    Sämtliche Softwareentwicklungen wurden von den Informatikern David Englmeier (wiss. Mitarbeiter; seit Oktober 2016), Filip Hristov (Hilfskraft; seit September 2016) und Florian Zacherl (wiss. Mitarbeiter; seit Oktober 2014) geleistet.

    (auct. Stephan Lücke)

    Tags: Informationstechnologie



    Terminologie (Zitieren)

    Vielfach wird eine Unterscheidung zwischen Rohdaten, Primär- und Metadaten vorgenommen. Eine verbindliche Definition dieser Kategorien existiert bislang nicht.

    Rohdaten: Daten nach Übernahme aus "Quelle" (z.B. von Partnern, über OCR aus Lexika, via Transkription ...)

    VA orientiert sich am Modell von Stuart Card (infovis-reference-model; reference-model for vizualization).

    Dementsprechend wird unterschieden zwischen Roh- und Primärdaten. Rohdaten sind alle Daten in der Gestalt, die vorliegt, bevor die Daten elektronisch in die VA-Struktur übertragen wurden. Dies gilt auch für den Fall, dass zu übernehmende Daten bereits in der VA-Struktur vorliegen, da auch in diesem Fall menschliche Interaktion zur Datenübernahme erforderlich ist (etwa um festzustellen, *dass* die Struktur identisch ist).

    Als Primärdaten werden definiert: Sämtliche Daten, die über die API mit dem Parameter "getRecord" (Beispiel: https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getRecord&id=C1&version=182&format=xml&empty=0) abgerufen werden (noch nicht vollständig implementiert) können. Dabei wird unterschieden zwischen Kern-Primärdaten (=sprachliche Daten) und peripheren Primärdaten (sprachliche Peripherie wie z.B. archäologische Daten).

    Unter Metadaten werden all die Daten verstanden, die die Primärdaten beschreiben (z.B. administrative Daten zur Beschreibung des Gesamtprojekts, alle erläuternden Texte, z.B. in der Methodologie [die unterschiedliche Aspekte des Gesamtprojekts beleuchtet] oder dem Lexikon Alpinum).

    Sekundärdaten sind all die Daten, die der Verarbeitung all der anderen Daten dienen (Code, Queries etc. ...)

    (auct. David Englmeier | Filip Hristov | Thomas Krefeld | Stephan Lücke | Christina Mutter | Florian Zacherl)

    Tags: Informationstechnologie



    Transkription (Zitieren)

    Die sprachlichen Materialien werden graphisch in doppelter Weise wiedergegeben, um den beiden gegenläufigen Prinzipien der Quellentreue und der leichten Vergleichbarkeit gerecht zu werden:
    (1) Inputversion in der Originaltranskription
    Im VA-Portal werden Quellen zusammengeführt, die aus unterschiedlichen Fachtraditionen stammen (Romanistik, Germanistik, Slavistik) und die historisch unterschiedliche Phasen der dialektologischen Forschung repräsentieren; manche Wörterbuchdaten wurden zu Beginn des letzten Jahrhunderts (GPSR) und andere erst vor wenigen Jahren (ALD) erhoben. Deshalb ist es wissenschaftsgeschichtlich notwendig, die Originaltranskription weitestgehend zu respektieren. Aus technischen Gründen ist es allerdings unmöglich, bestimmte Konventionen unverändert zu erhalten; das gilt insbesondere für die vertikale Kombination von Basiszeichen (‘Buchstaben’) und diakritischen Zeichen, also etwa dann, wenn ein Betonungsakzent über einem Längenzeichen über einem Vokal über einem Schließungszeichen positioniert ist (Betacode). Diese Konventionen werden in jeweils definierten technischen Transkriptionen in lineare Folgen von Zeichen überführt, wobei ausschließlich ASCII-Zeichen benutzt werden (so genannter Betacode). Bis zu einem gewissen Grad können bei der Beta-Kodierung intuitiv verständliche graphische Ähnlichkeiten zwischen den Originaldiakritika und den ASCII-Entsprechungen ausgenützt werden; sie sind mnemotechnisch günstig.

    (2) Outputversion in IPA
    Im Sinne der Vergleichbarkeit und auch der Nutzerfreundlichkeit ist zudem die Ausgabe in einer einheitlichen Transkription wünschenswert. Alle Beta-Codes werden daher mit spezifischen Ersetzungsroutinen in IPA-Zeichen überführt. Einige wenige, aber unvermeidbare Unverträglichkeiten ergeben sich vor allem dann, wenn einem, durch Diakritika spezifizierten Basiszeichen in der Inputtranskription in IPA zwei unterschiedliche Basiszeichen entsprechen. Das gilt vor allem im Hinblick auf die Öffnungsgrade der Vokale, wo z. B. in der palatalen Reihe die beiden Basiszeichen <i> und <e> in Verbindung mit Schließungspunkt und einem oder zwei Öffnungshäkchen es erlauben, sechs Öffnungsgrade abzubilden; in Beta-Kodierung sind das: i – i( – i((– e?-- e – e(– e((. Dafür stehen in IPA nur vier Basiszeichen i – ɪ – e – ɛ zur Verfügung.


    (auct. Thomas Krefeld)

    Tags: Linguistik Informationstechnologie



    Tropaeum Alpium (Zitieren)

    Das Tropaeum Alpium (https://www.wikidata.org/wiki/Q747588; s. H. Philipp, RE 7A,1 [1939], Sp. 661f., s.v. Tropaea Augusti; E. Meyer, RE Suppl. 11 [1968], Sp. 1269, s.v. Tropaeum Alpium) ist ein Siegesmonument, das nach der Niederwerfung der den Alpenraum besiedelnden Barbarenstämme (Feldzug des [späteren Kaisers] Tiberius und des Drusus [dessen jüngerem Bruder] i. J. 15 v. Chr.; Hauptquellen: Cassius Dio 54, 22 und Strabon 4, 6, 6–9; 7, 1, 5) auf Beschluss von Senat und Volk von Rom zu Ehren des Kaisers Augustus bald nach dem Jahr 7/6 v. Chr. (die Beschlussfassung erfolgte laut Inschrift im 17. Jahr seiner Tribunicia potestas, d.h. zwischen dem 26.6.7 und dem 25.6.6 v. Chr.) errichtet worden war. Die Reste des monumentalen, ursprünglich rund 50 Meter hohen, Bauwerks stehen in den französischen Seealpen hoch oberhalb von Monaco bei der Ortschaft La Turbie direkt auf der Passhöhe des Col d'Èze (512 m über dem Meer; Märtin 2017, S. 119).




    Rekonstruktion des Tropaeum Alpium im Museum von La Turbie. Auf dem Sockel ist die im Folgenden besprochene Inschrift erkennbar.
    (Von Matthias Holländer – Selbst fotografiert, Copyrighted free use, https://commons.wikimedia.org/w/index.php?curid=37407992)


    Aus Sicht von VerbaAlpina ist vor allem die monumentale (etwa 20 x 4 Meter) an dem Denkmal angebrachte Inschrift (CIL V 7817 = EDCS-05401067; Foto) von Interesse, die die Namen der damals unterworfenen Stämme auflistet. Diese Inschrift ist nur teilweise erhalten, und die Reste sind überdies in knapp 170 Fragmente zerschlagen. Der vollständige Text ist jedoch vom römischen Schriftsteller Plinius dem Älteren in dessen Naturalis Historia überliefert (Plin. NH 3, 136f.), so dass die Rekonstruktion der fragmentierten Inschrift gelingen konnte.




    Die, über weite Strecken rekonstruierte, Inschrift auf dem Sockel des Tropaeum Alpium
    (Foto: Stefano Costa https://www.flickr.com/photos/47912543@N00/11358571655/in/pool-1876758@N22, Lizenz: https://creativecommons.org/licenses/by-sa/2.0/)

    Reflexe der in der Inschrift genannten Stammesnamen haben sich z.T. bis heute in der Benennung von Orten oder Regionen im Alpenraum erhalten, so dass auch aufgrund dessen in manchen Fällen die Lokalisierung der jeweiligen Siedlungsräume mit einiger Sicherheit angegeben werden kann. Aus Sicht der Sprachwissenschaft können dies im Hinblick auf die Substratforschung wichtige Informationen sein (vgl. Krefeld, Thomas [2018]: Geschichte des romanisch-germanischen Sprachkontakts. Vorlesung dh-lehre. Version 8 [27.08.2018, 17:03]. https://www.dh-lehre.gwi.uni-muenchen.de/?p=53255&lv=8&v=8#p:5).

    Die Passage bei Plinius, in der der Text der Inschrift zitiert ist, liest sich wie folgt (Plin. a.a.O.; die Auflösung der Abkürzungen in runden Klammern stammt von mir, Buchstaben[folgen], die nur in der Inschrift am Tropaeum Alpium vorhanden sind, sind unterstrichen; die Zeilenumbrüche sind durch senkrechte Striche angegeben; die Nummerierung in Klammern hinter den Stammesnamen stammt von mir):

    (136) Non alienum videtur hoc loco subicere inscriptionem e tropaeo Alpium, quae talis est:

    IMP(eratori) · CAESARI DIVI FILIO AVG(usto) | · PONT(ifici) · MAX(imo) · IMP(eratori) · XIIII · TR(ribunicia) · POT(estate) · XVII | · S(enatus) · P(opulus) · Q(ue) · R(omanus) |· QVOD EIVS DVCTV AVSPICIISQVE GENTES ALPINAE OMNES QVAE A MARI SVPERO AD INFERVM PERTINEBANT SVB IMPERIVM P(opuli) · R(omani) · SVNT REDACTAE · | GENTES ALPINAE DEVICTAE TRVMPILINI (1)· CAMVNNI (2) · VENOSTES (3)· VENNONETES (4)· ISARCI (5)· BREVNI (6)· GENAVNES (7)· FOCVNATES (8) · | VINDELICORVM GENTES QVATTVOR (9)· COSVANETES (10)· RVCINATES (11)· LICATES (12)· CATENATES (13)· AMBISONTES (14)· RVGVSCI (15)· SVANETES (16)· CALVCONES (17) · | BRIXENETES (18)· LEPONTI (19)· VBERI (20)· NANTVATES (21)· SEDVNI (22)· VARAGRI (23)· SALASSI (24)· ACITAVONES (25)· MEDVLLI (26)· VCENNI (27)· CATVRIGES (28)· BRIGIANI (29)· | SOGIONTI (30)· BRODIONTI (31)· NEMALONI (32)· EDENATES (33)· VESVBIANI (34)· VEAMINI (35)· GALLITAE (36)· TRIVLLATI (37)· ECDINI (38)· | VERGVNNI (39)· EGVI (40)· TVRI (41)· NEMATVRI (42)· ORATELLI (43)· NERVSI (44)· VELAVNI (45)· SVETRI (46).

    (138) Non sunt adiectae Cottianae civitates XV, quae non fuerant hostiles, item adtributae municipiis lege Pompeia.

    (ed. C. Mayhoff, Stuttgart [Teubner] 1906; Text der Edition Loeb [zugangsbeschränkt])


    Übersetzung:

    Es erscheint nicht abwegig, an dieser Stelle die Inschrift vom Tropaeum Alpium anzufügen, die folgendermaßen lautet:
    Dem Imperator Caesar, Sohn des Göttlichen, Augustus, Pontifex Maximus, als er 14 Mal die imperatorische Akklamation erhalten hatte und zum 17. Mal die tribunizische Amtsgewalt ausübte, haben der Senat und das römische Volk, weil unter seiner Führung und unter seinem Oberbefehl alle Stämme in den Alpen, die sich vom oberen bis zum unteren Meer erstreckten, unter die Herrschaft des römischen Volkes gebracht worden sind, (dieses Monument errichtet). Die besiegten alpinen Stämme: [Liste der Namen].
    Nicht hinzugefügt sind die 15 Gemeinden der Cottier, die nicht feindselig gewesen waren und auch (schon) durch die Lex Pompeia zu den Municipien hinzugefügt worden sind. (Übers. Stephan Lücke)


    Plinius dürfte den Text der Inschrift nicht am Monument selbst, sondern vielmehr das originale Schriftstück im Archiv in Rom gesehen haben. Darauf deuten nicht zuletzt die Abweichungen hin, die zwischen dem Text der Inschrift und dem von Plinius überlieferten bestehen.

    Mit dem "mare superum" ist die Adria gemeint, "mare inferum" ist das tyrrhenische Meer (s. Georges, s.v. mare; man vergleiche auch die Formulierung von Plinius [NH 3, 133]: verso deinde in Italiam pectore Alpium iuris Euganeae gentes, quarum oppida XXXIIII enumerat Cato. Die Metapher von der "Brust der Alpen" [bei den Euganei, also ungefähr dem heutigen Veneto/Friaul] versteht man gut, wenn man sich die Alpen als einen auf seiner linken Seite liegenden Riesen vorstellt, dessen in Richtung Süden blickendes Haupt am "oberen" Meer zu verorten ist. In diesem Sinn liegt das Tropaeum Alpium am "Fuß" der Alpen, und auch der Name der italienischen Region Piemonte [ich danke Thomas Krefeld für diesen Hinweis] erhält dadurch eine spezifische, bislang wohl eher selten wahrgenommene Konnotation; es ist allerdings einzuräumen, dass die Bezeichnung "Piemonte" für die heute so genannte Region in Antike und Mittelalter anscheinend unbekannt war Treccani s.v. Piemonte), die Unterwerfung betraf also Stämme fast im kompletten Alpenbogen. Ausgenommen scheint allerdings die Gegend östlich des Brenners gewesen zu sein, in der Metapher des Plinius also das "Caput Alpium". Diese Region war ein Jahr vor dem Feldzug des Drusus und Tiberius von Publius Silius Nerva niedergeworfen worden, wobei speziell Noricum keinen Widerstand geleistet hatte (s. Junkelmann, Die Legionen des Augustus, 1986, S. 63 und 70 [non vidi]; zum widerstandslosen Anschluss Noricums: Karl-Wilhelm Welwei, Römische Weltherrschaftsideologie und augusteische Germanienpolitik, Gymnasium 93, 1986, S. 118–138 [non vidi]).

    Einige der genannten Stämme werden auch in antiken literarischen Quellen erwähnt und können aufgrund dessen lokalisiert werden. Im Folgenden geben die Nummern hinter den Namen die Position innerhalb der Inschrift an. Die Trumpilini (1) und die Camunni (2) seien Stämme der Euganeer, so Plinius (NH 3, 134). Plinius (ebd.) berichtet von den Leponti (19) – deren Name von Manchen angeblich vom griechischen Wort für VERLASSEN, ZURÜCKLASSEN (λείπω) hergeleitet werde, weil sie angeblich bei der Überschreitung der Alpen im Gefolge des Herakles dort zurückgeblieben seien, da ihnen die Kälte die Glieder hatte gefrieren lassen –, dass sie in der Nähe der Quelle der Rhone siedelten. Die Uberi (20) (im Text der Inschrift VIBERI) bezeichnet Plinius (a.O. 135) als einen Teil, also vermutlich Stamm, der Lepontier, was diese einerseits als Volk erscheinen lässt und damit gleichzeitig im Widerspruch zur Inschrift auf dem Tropaeum Alpium steht, wo sie als gens figurieren. Auffällig ist, dass Leponti und Uberi offenkundig in nächster Nachbarschaft zu einander siedelten und in der Inschrift des Tropaeum Alpium auch unmittelbar nach einander genannt werden. Dies reflektiert u.a. die der Anordnung innewohnende geographische Logik (s. unten). In 3,135 erwähnt Plinius auch die Vennonenses, bei denen es sich um einen Stamm der Raeter handle und die, gemeinsam mit den Sarunetes, in der Nähe der Rheinquelle siedelten. Dass sie mit den Vennonetes (4) der Inschrift zu identifizieren sind, ist jedoch sehr unwahrscheinlich, wie aus dem Folgenden ersichtlich werden wird. Von den in der Inschrift erwähnten Turi schließlich berichtet Plinius (NH 3,135), dass sie ein Stamm der Ligurer seien, demnach also bereits irgendwo im Bereich der Seealpen lebten.

    Neben den Nachrichten aus antiken Quellen gibt auch die neuzeitliche Toponomastik Hinweise auf die Lage der Siedlungsgebiete der genannten Gentes. Der Name der Trumpilini (1), von denen Plinius sagt, sie seien ein Stamm der Euganeer, an die noch heute die Colli Euganei westlich von Padua erinnern, kann mit dem Namen der Val Trompia etwas westlich des Gardasees in Verbindung gebracht werden (s. Thomas Krefeld). Nördlich der Val Trompia befindet sich die Val Camonica, deren Name sich sehr wahrscheinlich von den Camunni (2) herleitet. Wiederum nördlich davon liegt das Vinschgau, italienisch Val Venosta, das man unschwer mit den Venostes (3) assoziieren kann. Die Isarci (5) passen zum Isarco, dem linken Nebenfluss der Etsch, der am Brenner entspringt. Der Brenner wiederum mag seinen Namen von den Breuni (6) bekommen haben.

    Die Vindelici (9) sind wohlbekannt durch den römischen Namen für Augsburg, Augusta Vindelic(or)um. Da es hier um Bewohner der Alpen geht, wird man ihr Siedlungsgebiet also irgendwo am nördlichen Rand der Alpen unmittelbar südlich von Augsburg zu suchen haben. Es ist umstritten, ob der Eintrag VINDELICORVM GENTES QVATTVOR als Überschrift zu verstehen ist und somit die nachfolgenden vier Gentes als Vindelicer zu verstehen sind. Dafür könnte sprechen, dass eine dieser im Folgenden genannten Gentes, die Licates (12), sicher als vindelikischer Stamm angesehen wurden (Strab. 4,6,8: ἰταμώτατοι δὲ τῶν μὲν Οὐινδολικῶν ἐξητάζοντο Λικάττιοι καὶ Κλαυτηνάτιοι καὶ Οὐέννωνες, τῶν δὲ Ῥαιτῶν Ῥουκάντιοι καὶ Κωτουάντιοι [ed. Loeb [zugangsbeschränkt]). Sehr wahrscheinlich haben sie irgendwo im Lechtal (lat. Licca) gesiedelt, somit in einer Region, die man als Siedlungsgebiet der Vindelicer erwarten würde. Entsprechend wären dann auch die Cosuanetes (10), Rucinates (11) und Catenates (13) Vindelicer und in der näheren oder weiteren Umgebung des Lechtals zu suchen (eine genauere Lokalisierung ist anscheinend bislang noch nicht möglich). Eine weitere Stütze der Annahme, dass VINDELICORVM GENTES QVATTVOR als Überschrift zu verstehen ist, kann in der Analogie von GENTES ALPINAE DEVICTAE, das die Namensliste einleitet, gesehen werden. Auch dieser Passus hat offenkundig den Charakter einer Überschrift. Hinzu kommt, dass VINDELICORVM GENTES QVATTVOR ebenso wie GENTES ALPINAE DEVICTAE am Anfang einer Inschriftenzeile steht.

    Brixenetes (18) ist ein anderer Name der Briganti, die ihren Namen an den der Stadt Bregenz am Bodensee weitergegeben haben (HLS, s.v. Brigantii; ich danke Thomas Krefeld für den Hinweis). Thomas Krefeld a.a.O bringt die Val Leventina mit dem Namen der Leponti in Verbindung, was sehr gut zur Nachricht des Plinius passt, diese hätten in der Nähe der Quellen der Rhone gelebt. Den Namen der Caturiges (28) schließlich erkennt Thomas Krefeld im Namen der französischen Ortschaft Chorges in der Nähe von Gap.

    Auch die Siedlungsgebiete noch einer Reihe weiterer der in der Inschrift genannten Gentes lassen sich wenigstens ungefähr georeferenzieren, wobei allerdings durchaus die Gefahr von Zirkelschlüssen besteht. Trägt man diese ungefähren Lokalisierungen auf einer Karte ab und kippt diese um ca. 90 Grad nach Westen, erkennt man die der Inschrift innewohnende Logik (die Nummern beziehen sich wiederum auf die Rangfolge der Nennung in der Inschrift. Türkise Zahlen markieren Stämme, deren Lokalisierung allein auf Grundlage der geographischen Logik der Inschrift erschlossen wurde; die Verortung kann nicht wörtlich genommen werden, sondern ist absolut vage):




    Ungefähre Lokalisierung der Alpenstämme auf einer um 90 Grad nach links gekippten Karte
    (Kartengrundlage: Google Earth; Download der kmz-Datei)

    Die unterworfenen Stämme werden, beginnend beim "oberen" Meer, der Reihe nach nach unten bis zum "unteren" Meer aufgezählt – was ja auch exakt dem Wortlaut der Inschrift entspricht: GENTES ALPINAE OMNES QVAE A MARI SVPERO AD INFERVM PERTINEBANT. Genau an der Stelle, an der die letztgenannten Stämme gelebt haben, steht symbolisch das Siegesmonument und setzt damit im übertragenen Sinn ein Ausrufezeichen unter die Liste. Der Standort ist also alles andere als zufällig und überdies auch deswegen ideal gewählt, weil er an einer sicher sehr stark frequentierten Land- und Seeroute (das Monument ist vom Meer her sehr gut zu sehen) gelegen war. Das Tropaeum Alpium lag genau am höchsten Punkt der Via Iulia Augusta, einer sehr wichtigen Straßenverbindung, die erst wenige Jahre vor der Errichtung des Siegesmonuments (im Jahr 13 v. Chr., also unmittelbar nach der siegreichen Beendigung des Feldzugs von Drusus und Tiberius im Spätsommer 15 v. Chr.) von Augustus angelegt worden war und die Italien mit der Provinz Gallia Narbonensis verband.

    Wirklich irritierend ist zunächst allein die Nennung des Stammes der Ambisontes (14), da deren Siedlungsgebiet traditionell im Saalfeldener Becken und somit vollkommen außerhalb der ansonsten konsistenten Reihung von Ost nach West bzw. oben nach unten angenommen wird. Diese Lokalisierung geht anscheinend auf eine Stelle in den Geographica des Claudius Ptolemaeus (2,13,2: Κατέχουσι δὲ τὰ μὲν δυσμικώτερα τῆς ἐπαρχίας ἀπὸ ἄρκτων ἀρχομένοις Σεούακες καὶ Ἀλαυνοὶ (Ἀλανοὶ) καὶ Ἀμβισόντιοι, τὰ δὲ ἀνατολικώτερα Νωρικοὶ καὶ Ἀμβίδραυοι καὶ Ἀμβίλικοι.) zurück. Ziemlich sicher liegt hier eine fehlerhafte Identifizierung vor (bereits Theodor Mommsen, CIL III 2, p. 588, hatte vermutet, dass die bei Ptolemaeus genannten Ambisonten nicht mit denen auf dem Tropaeum Alpium identisch sind). Aufgrund der Position 14 innerhalb der Liste des Tropaeum Alpium wäre ihr Siedlungsgebiet wesentlich weiter westlich, vielleicht im Unterengadin oder dem angrenzenden österreichischen Inntal zu suchen. Hinzu kommt, dass die von Ptolemaeus genannten Ambisontes ein Stamm der Noriker gewesen sind, von denen wir wissen, dass diese sich bereits ein Jahr vor dem großen Alpenfeldzug, auf den sich das Tropaeum Alpium bezieht, im Rahmen der Kampagne des Publius Silius Nerva widerstandslos unterworfen hatten. Andere Stämme der Noriker werden in der Inschrift nicht genannt, die Ambisonten wären also der einzige in der Inschrift erwähnte Stamm der Noriker, was allein schon verdächtig wäre. Schließlich ist noch anzumerken, dass die Inschrift vom Tropaeum Alpium von "Ambisontes" spricht, bei Ptolemaios jedoch von den Ἀμβισόντιοι, in der lateinischen Entsprechung also von den Ambisontii, die Rede ist. Einander sehr ähnliche Stammesnamen sind für den Alpenraum auch anderwärts nachgewiesen (vgl. die Vennonenses und die Vennonetes [4]).

    Soweit mir bekannt, sind die folgenden in der Inschrift genannten Stämme bislang noch nicht genauer lokalisiert worden: Clucones (17), Acitavones (25), Sogionti (30), Brodionti (31), Nemaloni (32), Veamini (35), Gallitae (36), Ecdini (38), Egui (40), Nematuri (42), Oratelli (43), Nerusi (44), Velauni (45), Suetri (46). Auf Basis der in der Inschrift vom Tropaeum Alpium offenbar vorliegenden geographischen Logik, lässt sich nun aber zumindest eine ungefähre Verortung dieser Stämme vornehmen. Demnach ist das Siedlungsgebiet der Clucones (17) irgendwo in Graubünden, am ehesten vielleicht im Rheintal in der Umgebung von Chur zu suchen. Die Acitavones (25) könnten irgendwo südlich des Mont Blanc im oberen Aosta- oder auch Isère-Tal gelebt haben. Sogionti (30), Brodionti (31), Nemaloni (32) wären in der Gegend südlich von Gap zu suchen, die übrigen genannten bislang nicht lokalisierten Stämme wiederum weiter südlich davon im Bereich der Seealpen.

    Laut Plinius fehlen in der Inschrift diejenigen, die sich während des Feldzugs den Römern gegenüber freundschaftlich verhalten hatten. Konkret (aber eben nicht namentlich) genannt werden die 15 Stämme der Cottii (s. Georges, s.v. cottius), deren Siedlungszentrum sich im Susa-Tal (Segusio) südwestlich von Turin befand (Märtin 2017, S. 108). Die Namen von insgesamt 14 Stämmen der Cottii ist durch eine Inschrift (CIL CIL V 7231; Eintrag in der Epigraphischen Datenbank Heidelberg) auf dem Augustusbogen von Susa überliefert (aus dem Jahr 9/8 v. Chr.). Dort werden genannt: Segovii, Segusini, Belaci, Caturigi, Medulli, Tebauii, Adanatii, Savincatii, Ecdinii, Veaminii, Venisami, Iemerii, Vesubianii, Quadiatii.

    Bei der von Plinius erwähnten Lex Pompeia muss es sich um die sog. Lex Pompeia de Transpadanis handeln, ein Gesetz aus dem Jahr 89 v. Chr., das vom Konsul Pompeius Strabo (dem Vater Pompeius' des Großen) eingebracht worden war (vgl. E. Weiss, RE 12,2 [1925], Sp. 2403, s.v. Lex Pompeia [1]; G. Rotondi, Leges publicae populi Romani, 1912 [Nachdruck 1962] S. 342 [non vidi]). Gegenstand des Gesetzes ist die Verleihung des latinischen Bürgerrechts an die nördlich des Flusses Po lebenden Verbündeten der Römer im Bundesgenossenkrieg (91-88) gewesen (vgl. Luraschi, Giorgio [1980]. Sui destinatari della c.d. Lex Pompeia de Transpadanis. In: Atti del II seminario romanistico Gardesano, S. 267-292. Milano [non vidi]). Insofern stellt dieses Gesetz eine Ergänzung der Lex Iulia de Civitate Latinis et Sociis Danda aus dem Jahr 90 sowie der Lex Plautia Papiria de Civitate Sociis Danda (89 v. Chr.) dar, durch die die in Italien südlich des Po lebenden Stämme bzw. Völker das latinische Bürgerrecht erhalten hatten.

    Die Inschrift vom Tropaeum Alpium unterscheidet hinsichtlich der gelisteten Namen mindestens zwei unterschiedliche Status. Beim Gros der Namen handelt es sich offenkundig um "gentes", also um Stämme. Der Eintrag "Vindelicorum gentes quattuor" zeigt jedoch, dass "gentes" grundsätzlich eine Gliederung einer größeren Einheit sein konnten, die man wohl als "Volk" bezeichnen kann. Es mag sein, dass unter den civitates der Cottier, von denen Plinius spricht, im Grunde auch "gentes" zu verstehen sind. Die unterschiedliche Bezeichnung dürfte mit dem geänderten rechtlichen Status zu erklären sein, der sich aus der Verleihung des latinischen Bürgerrechts ergeben hat (civitas < civis !).

    (auct. Stephan Lücke)

    Tags: Außersprachlicher Kontext



    Typisierung (Zitieren)

    Die 'Interaktive Karte' bietet dem Nutzer die Möglichkeit, nach drei verschiedenen sprachlichen 'Typen' zu suchen. Jeder 'Typ' ist als eine Klasse von sprachlichen Ausdrücken zu verstehen; dadurch soll die unübersichtliche Vielfalt der zahlreichen sprachlichen Varianten in überschaubarer Weise strukturiert werden. Es werden phonetische, morphologische und – im Fall des 'Basistyps' – sprachgeschichtliche Kriterien eingesetzt. Die Typisierung der georeferenzierten Sprachdaten gehört zu den grundlegenden Anforderungen von VerbaAlpina. Dazu werden, wo dies möglich ist, aus den Inputdaten nach der Transkription in einem ersten Schritt Tokens ('Einzelwörter') extrahiert und in das gleichnamige Datenbankfeld eingetragen.

    Im Zentrum des Interesses von VerbaAlpina steht die morphologische Typisierung des gesammelten Sprachmaterials. Ein morphologischer Typ wird dabei durch Übereinstimmung der folgenden Eigenschaften definiert: Sprachfamilie – Wortart – einfaches Wort vs. affigiertes Wort – Genus – lexikalischer Basistyp. Die Nennform des morphologischen Typs schließlich orientiert sich an den korrespondierenden Lemmata ausgewählter Referenzlexika (s.u.).

    Durch die Zuweisung zu einem gemeinsamen lexikalischen Basistyp wird die Zusammengehörigkeit aller vereinigten morpho-lexikalischen Typen klar – auch über Sprachgrenzen hinweg. So lassen sich die folgenden (hier nicht im Detail beschriebenen) Nomina und Verben einem einzigen Basistyp malga zuweisen: malga (ALM, HERDE), malgaro (SENN), malghese (HIRTE), immalgare (ALM BEZIEHEN), dismalgare (ALM VERLASSEN). Allerdings sagt der lexikalische Basistyp nichts über die Wortgeschichte der einzelnen morpho-lexikalischen Typen aus: Ob ein Typ mit lateinisch-romanischem Etymon, der heute im germanischen oder slowenischen Sprachgebiet belegt ist, wie z. B. slowenisch bajta 'einfaches Haus', auf altes lokales Substrat zurückgeht oder aber auf neueren romanischen Sprachkontakt, muss jeweils einzeln herausgearbeitet werden. Aus diesem Grund wird die Bezeichnung "Etymon", die sich grundsätzlich auf die unmittelbare historische Vorstufe eines Wortes bezieht, in diesem Kontext vermieden – auch wenn in vielen Fällen der lexikalische Basistyp tatsächlich auch das Etymon eines morpho-lexikalischen Typs ist. Die Basistypen, die von den Referenzwörterbüchern als unbekannt oder umstritten gekennzeichnet sind, werden durch eine zusätzliche Voranstellung eines Fragezeichens markiert, wie im Beispiel: (?) battuere. Wenn im Prozess der Typisierung die Bestimmung des Basistyps nicht möglich ist, verwendet VerbaAlpina einen unbekannten Typ, der mit einem ? markiert wird.
    Die morpho-lexikalischen Typen bilden die Leitkategorie in der Verwaltung der sprachlichen Daten; sie sind den Lemmata der Lexikographie vergleichbar. Mittels der oben genannten, robusten und gut operationalisierbaren Kriterien lassen sich z.B. die vier phonetischen Typen barga, bark, margun, bargun mit der Bedeutung ALMHÜTTE, ALMSTALL auf drei morpho-lexikalische Typen reduzieren:





    Die Zugehörigkeit der morpho-lexikalischen Typen zu Sprachfamilien (gem., roa., sla.) hängt von der jeweiligen Quelle ab; sie ergibt sich im Fall traditionell erhobener Atlas- oder Wörterbuchdaten automatisch über die jeweiligen Informanten und wird entsprechend in der Datenbank notiert. Zeigen einzelne Wörter in bestimmten Varietäten ein Suffix, das aber keinen Genuswechsel mit sich bringt, so wird kein gesonderter morpho-lexikalischer Typ angelegt (vgl. bar. Nom. Sg. die Wiesn vs. deu. die Wiese), da die Bündelung der Belege im Vordergrund steht. Im Fall der Daten, die VerbaAlpina selbst durch Crowdsourcing erhebt, wird die Sprach- bzw. Dialektzugehörigkeit von den Informanten behauptet und im Idealfall quantitativ bestätigt; die Anzahl von bestätigenden Informanten wird so zu einem Instrument der Datenvalidierung.

    Morpho-lexikalische Typen sind auf eine Sprachfamilie beschränkt. Es stellt sich nun die Frage, durch welche Form ein morpho-lexikalischer Typ in der Suchfunktion der interaktiven Karte repräsentiert werden soll. Im Hinblick auf die germanische und slawische Sprachfamilie fällt die Antwort eher leicht, da beide jeweils nur durch eine standardisierte Einzelsprache ('Deutsch' [deu] bzw. 'Slowenisch' [slo]) vertreten sind. Die morpho-lexikalischen Typen können in Gestalt ihrer standardsprachlichen Varianten abgebildet werden, selbstverständlich unter der Bedingung, dass es im Standard Entsprechungen des Typs gibt; so können beispielsweise alle entsprechenden phonetischen Typen des Alemannischen und Bairischen, die Varianten der Standardform sind, unter ebendieser Standardform aufgerufen werden. Falls Standardvarianten nicht existieren, werden die Lemmata der großen Referenzwörterbücher (Idiotikon, WBOE) herangezogen.

    Im Fall der romanischen Sprachfamilie ist die Situation wegen der zahlreichen, teils nicht hinreichend standardisierten Kleinsprachen sehr viel komplexer. Aus pragmatischen Gründen wurde hier der folgende Weg gewählt: Alle morpho-lexikalischen Typen werden, sofern vorhanden, durch die französischen und italienischen Standardformen repräsentiert; so können z. B. alle phonetischen Typen, die Varianten von beurre/burro 'Butter' sind, unter diesen beiden Formen aufgerufen werden; als Referenzwörterbücher fungieren u.a. TLF und Treccani. In entgegengesetzter Perspektive werden jeder Einzeläußerung alle drei Typen, ein Konzept sowie ein Verweis auf ein Referenzwörterbuch zugeordnet: Vgl. Karte Konzept RAHM

    Falls nur eine dieser beiden Standardsprachen eine passende Variante hat, erscheint nur diese, wie im Fall von ricotta (die Zugehörigkeit zum Italienischen wird durch die Notationskonvention -/ricotta angezeigt). Wenn in keiner der beiden romanischen Referenzsprachen eine Variante des Typs existiert, wird auf den Eintrag eines dialektalen Referenzwörterbuchs zurückgegriffen, etwa auf LSI. Für den Fall, dass keine verlässlichen Einträge in Dialektwörterbüchern verfügbar sind, schlägt VerbaAlpina einen Basistyp mitsamt grafischer Repräsentation ('VA') vor.

    Im Gesamtkonzept und der technischen Umsetzung vorgesehen, jedoch peripher und demnach nicht konsequent umgesetzt, ist die phonetische Typisierung des Sprachmaterials. Die entsprechende Kategorie ist vor allem deswegen unentbehrlich, weil Sprachatlanten bisweilen (z. B. SDS und VALTS) und Wörterbücher ausschließlich phonetische Typen dokumentieren. Bei der phonetischen Typisierung durch VerbaAlpina werden die Tokens nach Kriterien der historischen Phonetik in phonetische Typen eingeteilt (Datenbankfeld 'phon_typ'). Dazu ein charakteristisches Beispiel (aus AIS 1204 LA PANNA | RAHM | CRÈME):





    Nach Maßgabe der Phonetik ist es sinnvoll, die Anlautvarianten [kr-] und [gr-] sowie die Tonvokalvarianten [a], [e] und [o] vor [m] zu differenzieren. Sie erscheinen daher als unterschiedliche 'phonetische Typen'. Gleichzeitig ist es klar, dass es sich um lautliche Varianten ein und desselben morpho-lexikalischen Typs handelt, denn es gibt zahlreiche analoge Fälle von Lautwandel. Da sich jedoch keinerlei Evidenz für einen Wandel von [kr-] > [br-] findet, wäre es nicht sinnvoll die entsprechenden dolomitenladinischen Formen (brama) ebenfalls dazu zu stellen. Sie repräsentieren daher trotz der Ähnlichkeiten im Tonvokal und im Silbenauslaut [-ama] einen anderen morpho-lexikalischen Typ.



    Eine Automatisierung der phonetischen Typisierung auf Basis von Levenshtein- und soundex-Algorithmen wird untersucht und wenn möglich umgesetzt werden; allerdings wird in jedem Fall ein starker Korrekturaufwand entstehen. Etwa die beiden historisch zusammengehörigen Formen krama und gromma unterscheiden sich rein numerisch im Sinn der Levenshtein-Distanz durch die Menge an Zeichenersetzungen die durchgeführt werden müssen, um eine Form in die andere zu transformieren, stärker als die nicht zusammengehörigen Formen krama und brama.





    Durch die Typisierung (Klassenbildung) wird die Datenvielfalt zunehmend übersichtlich; es gilt also in der Regel: Zahl der Tokens > Zahl der phonetischen Typen > Zahl der morpho-lexikalischen Typen > Basistyp. Man beachte jedoch den Extremfall eines einzigen Belegs (Hapax), der einem Token, einem phonetischem Typ und einem morpho-lexikalischen Typ als einzigem Vertreter eines Basistyps entspricht. U.U. ist es sinnvoll, solche Hapax-Formen in der Darstellung herauszufiltern.


    (auct. Thomas Krefeld | Stephan Lücke)

    Tags: Linguistik



    Uniform Resource Name (URN) (Zitieren)

    s. Digital Object Identifier

    Tags: Informationstechnologie



    Untersuchungsgebiet (Zitieren)

    "Eine umfassende und kohärente Geschichte der Alpen wurde bisher noch nicht vorgelegt" (http://www.hls-dhs-dss.ch/textes/d/D8569.php); vielmehr konkurrieren unterschiedliche, "naturräumliche" und "wirtschaftlich-politische Alpendefinitionen" (Bätzing 1997, 23 f.). Im Sinn einer transparenten und pragmatischen Abgrenzung wurde das Untersuchungsgebiet dieses Projekts mit dem klar umrissenen Geltungsbereich der Alpenkonvention gleichgesetzt; die dort festgeschriebenen "Inkonsistenzen zwischen den Mitgliedstaaten" (Bätzing 1997, 31) wurden in Kauf genommen; sie betreffen das bayerische Alpenvorland (eingeschlossen), "größere randalpine Gebiete wie das Emmental oder das Zürcher Oberland" ((Bätzing 1997, 32), ausgeschlossen) sowie den Umgang mit einigen wichtigeren Städten am Alpenrand: Luzern und Salzburg sind eingeschlossen, Graz und Biella dagegen ausgeschlossen. Der Perimeter der Alpenkonvention kann hier heruntergeladen werden. Das eigentliche Ziel des Projekts ist es jedoch, die Alpen in diesem formal abgesteckten Rahmen als sprachlich-kulturellen Raum zu erfassen und die Ähnlichkeit der zugehörigen Orte abzubilden.

    (auct. Thomas Krefeld)

    Tags: Außersprachlicher Kontext



    Versionierung (Zitieren)

    VerbaAlpina besteht aus folgenden Modulen:





    - VA_DB: Datenbestand in der (MySQL-)Projekt-Datenbank (va_xxx)
    - VA_WEB: Programmcode der Webschnittstelle des Projektportals www.verba-alpina.gwi.uni-muenchen.de samt zugehöriger Wordpress-Datenbank (va_wp)
    - VA_MT: Mediendateien (Photos, Filme, Text- und Tondokumente), die sich in der Medienbibliothek der Webschnittstelle befinden

    Alle drei Module bilden ein konsistentes Ganzes mit wechselseitigen Verknüpfungen und Abhängigkeiten und können daher nicht voneinander getrennt werden. Während der Projektlaufzeit wird halbjährlich, jeweils zum 15. Juni und zum 15. Dezember eines Jahres, simultan der jeweils aktuelle Status der Module VA_DB und VA_WEB in Gestalt einer elektronischen Kopie gleichsam "eingefroren". Diese eingefrorenen Kopien erhalten Versionsnummern nach dem Schema [Kalenderjahr]/[laufende Nummer] (z .B. 15/1). Die jeweils produktive VA-Version erhält die Bezeichnung XXX (vgl. Zitierweise).

    Die Erzeugung von Kopien der VA-Mediathek (VA_MT) verbietet sich aufgrund der üblicherweise enormen Größe von Mediendateien. Aus diesem Grund wird von diesem Modul im Zuge eines Versionierungsvorgangs keine Kopie erzeugt. Einmal dort abgelegte Elemente können daher, sofern auch nur eine einzige VA-Version mit ihnen verknüpft ist, nicht aus der VA-Mediathek entfernt werden.

    Im Projektportal besteht die Möglichkeit, zwischen der jeweils "produktiven" und daher ständigen Änderungen unterworfenen VA-Version sowie den archivierten, "eingefrorenen" Versionen zu wechseln. Im Projektportal wird durch geeignete Farbgebung des Hintergrunds bzw. bestimmter Bedienelemente angezeigt, ob man sich in der produktiven oder einer archivierten Version von VA befindet. Zitierfähig sind *ausschließlich* die archivierten Versionen von VA.

    Titelbilder älterer VerbaAlpina-Versionen:

    15/1

    15/2

    16/1

    16/2

    17/1

    17/2

    18/1



    (auct. Stephan Lücke)

    Tags: Informationstechnologie



    Wikidata (Zitieren)

    Wikidata ist eine freie Wissensdatenbank, die Daten ihrer Wikimedia-Schwesterprojekte (Wikipedia, Wikivoyage, Wikisource) als eine Art zentraler Speicher in strukturierter Form bereitstellt. Die Daten auf Wikidata werden unter einer freien Lizenz zur Verfügung gestellt (Creative Commons Public Domain Dedication 1.0) und können in bis zu 111 verschiedenen Einzelsprachen und Dialekten erstellt, verwendet und durchsucht werden. Im Unterschied zu Wikipedia sind auf Wikidata keine vollständigen Artikel, sondern lediglich einzelne Konzepte gelistet, die alle über eine eigene Q-ID verfügen. So hat das Konzept MOLKE z.B. die Q-ID 185009 (vgl. Wikidata). Wenngleich die Nachhaltigkeit dieses Katalogs nicht im strengen Sinn garantiert wird, ist damit aus sprachwissenschaftlicher Sicht de facto die Grundlages eines sehr nützlichen onomasiologischen Referenzsystems entstanden.

    Den Konzepten von VerbaAlpina werden die entsprechenden Q-IDs von Wikidata zugewiesen. Dies ist für VerbaAlpina vor allem hinsichtlich der Kooperation mit dem Projekt GeRDI von Relevanz. So wird Wikidata von GeRDI als Wissensdatenbank (knowledge base) verwendet, um eine disziplinübergreifende Suche in unterschiedlichen Sprachen gewährleisten zu können. Auf diese Weise wird ermöglicht, dass z.B. bei Eingabe eines Suchbegriffs auf Italienisch zugleich auch Ergebnisse in anderen Sprachen gefunden werden.

    Konzepte, die auf Wikidata noch nicht erfasst sind, werden von VerbaAlpina dort neu angelegt. Zu diesem Zweck wurde auf Wikidata ein Projektaccount für VerbaAlpina eingerichtet. Als Default-Sprache gilt Englisch. Es können jedoch Übersetzungen des jeweiligen Konzepts in allen auf Wikidata verfügbaren Sprachen eingegeben werden.

    (auct. Christina Mutter)



    Wissenschaftskommunikation im Web (Zitieren)

    VerbaAlpina kann als eine webbasierte raumorientierte Forschungsumgebung beschrieben werden. Dieses Format wird bestimmt durch die aktuellen Rahmenbedingungen, die sich ganz erheblich von der traditionellen Wissenschaftskommunikation unterscheiden. In allen Disziplinen, die in ‚klassischer‘ Weise mit empirischen Daten arbeiten, lassen sich drei einander folgende Phasen unterscheiden:
    1. Der Wissenschaftler sucht Informanten.
    2. Die Informanten liefern dem Wissenschaftler Rohdaten.
    3. Der Wissenschaftler gibt eine bestimmte Menge der erhobenen Daten, die im Lichte theoretischer Annahmen selektiert und modelliert wurde, an ein im Wesentlichen wissenschaftliches Publikum weiter.
    Die Kommunikation in den drei Phasen verläuft unidirektional und zielt auf in sich abgeschlossene, dinghafte Publikationen, d.h. auf gedruckte Bücher.

    Die drei Schritte der traditionellen Wissenschaftskommunikation
    Medien spielen eine zwar grundlegende, aber scharf begrenzte Rolle, denn sie sind in Gestalt des Drucks ausschließlich in der dritten Phase für die Publikation der Forschungsergebnisse zuständig. Diese Ergebnisse sind nur da zugänglich, wo die papierenen Publikationen materiell vorhanden sind, d.h. im wesentlichen in wenigen, meist öffentlichen Bibliotheken; in der Graphik wird die mediale Komponente durch die blaue Unterlegung des Feldes symbolisiert.
    Die Neuen Medien haben die Rahmenbedingungen für die Wissenschaftskommunikation revolutioniert,denn alle Schritte der wissenschaftlichen Arbeit setzen hochtechnische Medialität voraus und werden dadurch grundsätzlich zu kommunikativen Handlungen; deshalb ist die folgende Graphik im Ganzen blau unterlegt. Die Organisation und Bündelung der Handlungsschritte zu drei notwendig aufeinander folgenden Phasen wird überwunden; die skizzierte Unidirektionalität der Informationsflusses ist ebenso aufgehoben wie die Bindung der Rolle (INFORMANT, AUTOR, LESER) an unterschiedliche Personen; grundsätzlich kann sich ein und dieselbe Person in schnell wechselnden Funktionen an der Kommunikation beteiligen. Von Grund auf verändert ist im Hinblick auf die Kommunikanten die Funktion INFORMANT, da die Behandlung der gelieferten Daten transparent bleibt und kontinuierlich verfolgt werden kann. Der INFORMANT wird so zum LESER seiner eigenen DATEN – ganz unabhängig davon, ob er die wissenschaftliche Intention überhaupt versteht; gleichzeitig eröffnet sich ihm die Möglichkeit, dazu als AUTOR Stellung zu nehmen. Nicht weniger radikal verändert sich unter diesen Bedingungen der Status Daten selbst, da sie in grundsätzlich dynamischen Datenbank abgelegt werden, deren Umfang und Struktur Veränderungen unterworfen bleibt. Unter diesen Bedingungen wird bereits die Kommunikation zwischen den involvierten Personen, in ihren womöglich wechselnden Rollen, zu einer elementaren Form der Kooperation. Es ist aber deutlich zu sagen, dass der Einsatz von Webtechnologie die Forschungskooperation nicht automatisch optimiert. Vielmehr ist es notwendig, bestimmte Regeln einzuhalten, die in den so genannten FAIR-Prinzipien prägnant formuliert wurden; sie implizieren gleichzeitig den konsequenten Verzicht auf das Copyright (©) der Print-Publikation zugunsten eine angemesseneren Lizenzierung.


    Wissenschaftskommunikation unter den Bedingungen des Internet

    In diesem Sinn wurde VerbaAlpina als Forschungsumgebung mit unterschiedlichen, aber eng miteinander verflochtenen Bereichen angelegt. Bei der Operationalisierung der FAIR-Prinzipien ist VerbaAlpina weiterhin auf institutionelle Absicherung angewiesen; Projektarbeit ist ja grundsätzlich befristet und insofern prekär. Das Forschungsdatenmanagement erfolgt deshalb auf der Grundlage von Prozeduren, die gemeinsam mit der Universitätsbibliothek der LMU entwickelt werden.




    (auct. Thomas Krefeld)

    Tags: Webseite



    Wissenshorizont (Zitieren)

    Dieses Portal informiert in drei unterschiedlichen Dimensionen:
    (1) über außersprachliche Realität (‘Sachen’),
    (2) über Konzepte, oder: inhaltliche, bzw. onomasiologische Kategorien, die nicht an einzelne Sprachen oder Dialekte gebunden sind,
    (3) über sprachliche Ausdrücke der untersuchten Sprachen und Dialekte.
    Die getrennte Behandlung von (2) und (3) ist grundlegend, da ja die relevanten Konzepte durchaus nicht immer im gesamten Untersuchungsgebiet mit spezifischen Bezeichnungen belegt (‘lexikalisiert’) sind; so gibt es z. B. in weiten Teilen des bairischen Gebiets kein Wort für den aus Molke hergestellten so genannten Käse (vgl. dafür gsw. (alemannisch) Ziger, ita. ricotta, fra. sérac), während es z.B. für die frische, noch ungeformte Käsemasse (bar. Topfen, deu. Quark) in den romanischen Dialekten oft, so wie auch im Standarditalienischen, keine Bezeichnung gibt. Das Verhältnis von (1) auf der einen Seite und (2) und (3) auf der anderen ist gelegentlich auch problematischer als es auf den ersten Blick erscheint; so finden sich manchmal sprachliche Ausdrücke mit unklarem semiotischen Status, weil aus den Belegen nicht hervorgeht, ob es sich um Bezeichnungen von Konzepten oder aber womöglich um Namen für Dinge handelt; das ist z. B. der Fall, wenn ein Sprecher eine ganz bestimmte Alm, etwa diejenige, die er selbst nutzt, mit einem generischen Wort als munt wörtlich ‘Berg‘ oder als pastüra ‘Weide‘ tituliert.


    (auct. Thomas Krefeld)

    Tags: Linguistik Außersprachlicher Kontext



    Wording (Zitieren)





    Zitierweise (Zitieren)

    Den Nutzerinnen und Nutzern von VerbaAlpina wird folgende Zitierweise der bereitgestellten Sprachdaten empfohlen:

    • Eintrag von VerbaAlpina in einer Bibliographie
    VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de,[Version].

    Die Nennung des Datums des letzten Zugriffs ist entbehrlich, da die Zitierversionen (im Unterschied zur Arbeitsversion XXX) stabil sind und nicht mehr verändert werden (vgl. Versionierung).

    Beispiel:
    VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.

    • Zitat eines Methodologiebeitrages:
    [Autor/en]: s.v. “[Lemma]”, in: VA-[Sprachkürzel nach ISO 639-1] [Version], Methodologie, [URL des Glossareintrags].

    Beispiel:
    Krefeld, T. / Lücke, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.

    Als Autoren sind stets die unter dem Glossareintrag aufgeführten und mit "auct." gekennzeichneten Personen zu nennen.

    • Zitat eines Einzelbelegs:
    [zitat]|[kategorie]|[Ort]|[Quellenkürzel]#[Referenz]|VA_[Version]

    Beispiele:
    Hütte|morphTyp|Herisau|SDS#VII_244_1|VA_15/1
    Chääsera|phonTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
    Käserei|BasisTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1

    Hinweis 1: Das Trennzeichen Pipe | erhalten Sie auf Windows-Computern durch Drücken von Strg+Alt zusammen mit der Taste, auf der sich neben der Pipe die Größer/Kleiner-Zeichen <> befinden. Auf Apple-Geräten ist die Tastenkombination Alt+fn+7 zu drücken.
    Hinweis 2: Die folgenden Sprachkürzel nach ISO 639-1 sind zu verwenden: für Deutsch deu, für Französisch fra, für Italienisch ita, für Rätoromanisch roh, für Slowenisch slv.

    (auct. Stephan Lücke | Susanne Oberholzer)

    Tags: Webseite