Methodologie
Alle Einträge anzeigen
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Alpenwörter
(Zitieren)
(Thomas Krefeld)
Tags: Dokumentation
Analoge Sprachgeographie
(Zitieren)

Dergleichen Inkonsistenzen müssen bei der digitalen Datenaufnahme unbedingt beseitigt werden; oberstes Gebot ist hier die scharfe Trennung der genannten inhaltlichen Dimension, sozusagen die systematische Dekonstruktion der gebotenen Information.

Im Zuge einer solchen Dekonstruktion ergibt die oben als Beispiel genannte Karte folgende Datensätze:
AIS 1192a, Stimulus LA CASCINA DI MONTAGNA; SENNHÜTTE
weitere Stimuli (= onomasiologisch eindeutige KONZEPTE): 8 (MILCHKELLER, KÄSEKELLER, LA CANTINA DA LATTE, MAIENSÄSSE, ALMSTALL, SCHLAFRAUM IN DER SENNHÜTTE, ANDERE ÖKONOMIEGEBÄUDE, DIE ALP WECHSELN)
mögliche untergeordnete KONZEPTE: 120
sprachliche Einzelbelege: 1032
Erhebungsorte: 134
Im Anschluss können dann alle Informationen in konsistenten Kategorien und quasi beliebiger Kombination aus der Datenbank abgerufen und visualisiert werden.
(auct. Thomas Krefeld)
Tags: Dokumentation
Außersprachliche Daten
(Zitieren)
Ökologische und geophysikalische Daten sind immer dann relevant, wenn sie einen klaren Bezug zur Siedlungsgeschichte haben. Das ist zum Beispiel evident im Hinblick auf die Vegetationszonen, die bestimmte Nutzungen gestatten oder verlangen (z. B. die Almwirtschaft setzt Höhenlagen über der Baumgrenze voraus (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_DE).
(Thomas Krefeld)
Tags: Dokumentation
Autorenschaft
(Zitieren)
(auct. Thomas Krefeld | Susanne Oberholzer)
Tags: Publikation
Betacode
(Zitieren)
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):

Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel das Häkchen unterhalb des u im Wort tu durch eine öffnende runde Klammer wiedergegeben: tu(. Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Betacodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Dokumentation Kooperation Forschungslabor
Bezeichnung
(Zitieren)

(auct. Stephan Lücke)
Tags: Dokumentation
Codepage
(Zitieren)
Nachfolgend ein Auszug aus der für die Konvertierung des AIS-Transkriptionssystems in IPA grundlegenden Codepage. Insgesamt umfasst diese Codepage rund 4500 Zeilen/Zuordnungen:

Die Kolumne `BETA` enthält die im AIS verwendeten Zeichen in nach dem Prinzip des Betacodes transkribierter Form, die Kolumne `IPA` das jeweils entsprechende IPA-Zeichen und die Kolumne `HEX` den oder die Zahlenwerte der Unicodetabelle, die dem jeweiligen IPA-Zeichen entsprechen.
(auct. Stephan Lücke)
Tags: Dokumentation Kooperation
Crowdsourcing
(Zitieren)
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008. Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.
(auct. Thomas Krefeld)
Tags: Crowdsourcing
Datenmodellierung
(Zitieren)
Datenzugriffsschicht
(Zitieren)
auct. Stephan Lücke
Tags: Kooperation Publikation Forschungslabor
Digital Humanities
(Zitieren)
Das bedeutet:
(1) Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
(2) Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
(3) Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
(4) Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.
(auct. Thomas Krefeld)
Tags: Kooperation Crowdsourcing
Digital Object Identifier (DOI) (Zitieren)
Der wesentliche Nutzen des DOI-Systems besteht in der nachhaltigen Zitierbarkeit elektronischer Ressourcen. Ein DOI-Zitat führt auch dann auf die richtige Ressource, wenn sich die Adresse im Internet (die URL) geändert hat. Der DOI von VerbaAlpina lautet doi:10.5282/verba-alpina, wobei die 10.5282 der registrierenden Organisation, in diesem Fall der Universitätsbibliothek der LMU zugeordnet ist. Damit ein Zitat beispielsweise in einem wissenschaftlichen Aufsatz direkt auf das Portal von VerbaAlpina führt, muss der DOI in die URL der DOI-Stiftung eingebunden werden: http://dx.doi.org/10.5282/verba-alpina. Das unmittelbare Ansprechen spezifischer Teilressourcen auf dem VerbaAlpina-Portal (beispielsweise einzelner Dateien in der Mediathek-Modul von VerbaAlpina [VA_MT]) über den DOI ist nicht möglich. Für jede Teilressource von VerbaAlpina wäre ein weiterer DOI erforderlich.
Nahezu dem selben Zweck wie der DOI dient der sog. Uniform Resource Name (URN), und auch die Funktionsweise ist in etwa die gleiche. Anders als beim DOI ist beim URN jedoch die Registrierung mehrerer URLs für eine Ressource möglich. Dies kann etwa dann von Interesse sein, wenn Ressourcen im Sinne der Ausfallsicherheit oder Nachhaltigkeit auf verschiedenen Servern mit entsprechend unterschiedlichen URLs abgelegt werden. Ein gewisser Nachteil der URN gegenüber der DOI besteht darin, dass das URN-Register nicht von einer einzigen Institution, sondern dezentral von verschiedenen nationalen Organisationen betrieben wird. Für Deutschland übernimmt diese Aufgabe die Deutsche Nationalbibliothek (DNB), weshalb für Ressourcen, die über die DNB registriert wurden, der die URN verwaltende Server (ein sog. Resolver) der DNB aufgerufen werden muss. Die URN von VerbaAlpina lautet urn:nbn:de:bvb:19-verba-alpina-8, die entsprechende URL mit dem DNB-Resolver, der auf das Portal von VerbaAlpina führt, lautet http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8. Ebenso wie beim DOI ist das unmittelbare Ansprechen spezifischer Teilressourcen auf dem VerbaAlpina-Portal über den URN nicht möglich.
(auct. Stephan Lücke)
Tags: Dokumentation
Digitalisierung
(Zitieren)

Dabei kommt quasi ausschließlich das relationale Datenmodell zum Einsatz, bei dem das Datenmaterial grundsätzlich in Tabellengestalt organisiert wird. Die Tabellen bestehen aus Zeilen (= Datensätze, Tupel) und Spalten (= Attribute, Felder, Eigenschaften), wobei jede Tabelle in jede Richtung um zusätzliche Zeilen und Spalten erweitert werden kann. Zwischen den Tabellen bestehen logische Zusammenhänge, die sinnvolle Verknüpfungen und entsprechende synoptische Darstellungen (sog. "Joins") von zwei und mehr Tabellen erlauben. Für die Verwaltung der Tabellen setzt VerbaAlpina derzeit das Datenbankmanagementsystem MySQL ein, die Tabellen sind jedoch nicht an dieses System gebunden, sondern können jederzeit z.B. in Textgestalt mit eindeutig zu definierenden Trennzeichen für Feld- und Datensatzgrenzen (sog. Separatoren) zusammen mit den Spaltennamen und der Dokumentation der logischen Zusammenhänge (Entity-Relationship-Modell) exportiert werden. Die derzeit vielfach verwendete XML-Struktur wird im operativen Bereich von VerbaAlpina nicht eingesetzt. Im Rahmen des Schnittstellenkonzepts ist XML jedoch als Exportformat verankert.
Neben der logischen Strukturierung der Daten spielt im Zusammenhang mit dem Stichwort "Digitalisierung" die Kodierung der Schriftzeichen die zweite zentrale Rolle. Gerade im Hinblick auf die Langzeitarchivierung des Datenmaterials ist der richtige Umgang mit dieser Thematik von großer Bedeutung. Soweit möglich, orientiert VerbaAlpina sich dabei an der Kodierungstabelle und den Vorgaben des Unicode-Konsortiums. Im Fall der Digitalisierung von Schriftzeichen, die bislang noch nicht in die Unicodetabelle aufgenommen sind, erfolgt die digitale Datenerfassung eines Einzelzeichens vorzugsweise durch Serialisierung in Gestalt einer Abfolge von Zeichen aus dem Unicode-Bereich x21 bis x7E (innerhalb des ASCII-Bereichs). Die entsprechenden Zuordnungen werden in speziellen Tabellen dokumentiert, wodurch eine spätere Konvertierung in dann möglicherweise vorhandene Unicodewerte stets möglich ist.
(auct. Stephan Lücke)
Tags: Dokumentation
Erklärungssprache
(Zitieren)
(auct. Thomas Krefeld)
Tags: Publikation
Ethnolinguistik
(Zitieren)
In der romanistischen, aber vor allem italianistischen Forschungstradition war die Dialektologie von Beginn an, d.h. in Italien mindestens seit Giuseppe Pitré, immer sehr eng mit den Sozialwissenschaften, genauer gesagt mit der Soziologie und der Ethnologie verbunden. In dieser Perspektive lässt sich die gesamte Geolinguistik sogar als Teildisziplin einer übergeordneten 'Ethnowissenschaft' verstehen. Dieser Ausdruck, der hier als Übersetzung von ita. etnoscienza (aus engl. ethnoscience) gesetzt wird, hat allerdings weder in Italien, noch in Deutschland etablieren können. In dem sehr scharfsinnigen und informativen Manuale di etnoscienza von Giorgio Raimondo Cardona (Cardona 1995) heißt es:
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
b) la scienza botanica posseduta da una specifica etnia.
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 f.; Hervorhebung durch fette Schrift: ThK)
Die so skizzierte etnoscienza wird in der US-amerikanischen Tradition auch als cultural anthropology (dt. Kulturanthropologie) bezeichnet. Speziell im deutschsprachigen Raum wurde darüberhinaus zwischen Volkskunde für die Erforschung einheimischer Kultur(en) und Völkerkunde für die Erforschung fremder, insbesondere nichteuropäischer Kulturen unterschieden. In der Gegenwart wird stattdessen meist allgemein von Ethnologie mit dem besonderen Teilgebiet der Europäischen Ethnologie (im Sinne der Volkskunde) gesprochen. Die Bezeichnung Ethnolinguistik ist daher auch nicht eindeutig, da sie oft auf die sprachwissenschaftliche Untersuchung nicht europäischer Kulturen eingeschränkt wird (vgl. Senft 2003), obwohl sie die europäischen nicht ausschließen sollte; die kategorische Trennung erweist sich im Hinblick auf die massenhaften und weiträumigen Migrationsströme ohnehin in rapide zunehmendem Maße als sinnlos.
Eine Unschärfe im zitierten Passus von Cardona bleibt zu klären; sie betrifft das 'Präfixoid' ethno-, das einerseits als Synonym des en. folk und andererseits mit Bezug auf etnia verwandt wird. Mit folk (in folk-taxonomy usw.) wird auf die alltags- oder lebensweltlichen Wissensbestände und Konventionen der Laien bzw. Nicht-Wissenschaftler verwiesen und genau in diesem Sinne sollte auch Ethnie (bzw. ethno-) auf alltagsweltliche Kulturgemeinschaften bezogen werden, ohne jedoch idealisierte Vorstellungen von Homogenität, Archaizität, sozialer Abgeschlossenheit usw. zu implizieren. Die Unterscheidung Cardonas (a vs. b) verweist weiterhin auf zwei komplementäre Forschungsperspektiven in den Kultur- und Sozialwissenschaften.
Zusammenfassend darf man dialektologische Forschungen im Sinn von Cardona (auch im Nachhinein) als 'ethnolinguistisch' bezeichnen, wenn sie ihre sprachlichen Daten im engen Zusammenhang mit der Alltagskultur der Sprecher erhebt und analysiert.
Richtungweisend für die ethnolinguistisch orientierte Tradition der italienischen Dialektologie ist die in teilnehmender Beobachtung entstandene Untersuchung von Hugo Plomteux 1980 über die Cultura contadina in Liguria. Ethnolinguistisch sehr gut, im regionalen Vergleich vielleicht am besten erschlossen ist Sizilien. Zu nennen sind vor allem: Fanciullo 1983 und mehrere wichtige Arbeiten, die im Rahmen des Atlante linguistico della Sicilia entstanden sind; die folgenden Titel geben Auskunft über die jeweils untersuchten kulturellen Techniken und Traditionen: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 und Castiglione 1999.
(auct. Thomas Krefeld)
Tags: Dokumentation
Ethnolinguistisches Ähnlichkeitsprofil
(Zitieren)
- Zunächst sind die Alpenwörter von besonderem Interesse; ihre Gesamtheit bildet sozusagen einen fiktiven Idealtyp, dem die einzelnen Ortsdialekte mehr oder weniger nahe kommen. Dem entspricht die Kartierung einer gradueller Ähnlichkeit, die durch die Darstellung des champ gradient de la gasconité im ALG 6 inspiriert wurde.
- Sodann wird nach dem Vorbild des ASD die relative Ähnlichkeit aller Aufnahmeorte untereinander kartiert, indem die gemeinsamen Basistypen eines beliebigen Aufnahmeortes und diejenigen eines beliebigen anderen Ortes als Bezugspunkt festgestellt und angezeigt werden.
(auct. Thomas Krefeld)
Tags: Dokumentation
Etymologie
(Zitieren)
- die Ermittlung der Herkunftssprache der lexematischen Basis;
- die Begründung der Zusammengehörigkeit aller unter dem Basistyp vereinigten Typen; dafür sind die Regularitäten der historischen Phonetik und die semantische Plausibilität der zugrundeliegenden Konzeptrelationen entscheidend;
- die Rekonstruktion der Entlehnungswege, falls der Basistyp in mehreren Sprachgebieten verbreitet ist; sobald die Sprache des Etymons einerseits und des Informanten andererseits nicht übereinstimmen, wird automatisch Sprachkontakt festgestellt.
(auct. Thomas Krefeld)
Tags: Dokumentation Kooperation
Fotos
(Zitieren)
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Dokumentation
Funktionsbereich (1): Dokumentation
(Zitieren)
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).
Perspektive
Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Hinblick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als Ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.
Kartographie
Den Zugang zur Dokumentation vermittelt vor allem ein interaktive Karte. Bislang werden zur Visualisierung nur Punktsymbolkarten mit interaktiven Symbolen eingesetzt. Komplementär wird eine interaktive Flächensymbolisierung auf Basis der Gemeindeflächen vorbereitet, um eine bessere Visualisierung quantitativer Verhältnisse zu erzielen. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern.Linguistische Datenaufbereitung
Bei Aktivierung ('Klick') eines Punktsymbols öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten; das folgende Beispiel zeigt die Bezeichnung des Konzepts BUTTER in Ramosch (Unterengadin):
Präsentation der sprachlichen Daten mit einem Pop-up-Fenster der interaktiven Karte
Die Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Demnächst kommen – wenn möglich – Verweise auf Referenzwörterbücher hinzu.
Filter
Mehrere Filter erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen. Der oben gezeigte Kartenausschnitt stammt aus der Karte, die bei Auswahl des 'Konzepts' BUTTER erscheint:
Filter zu Steuerung der interaktiven Karte
Gruppieren und Sortieren
Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) führt zu 1448 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:
Die Sortierfunktion der interaktiven Karte: Konzepte
Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen oder Basistypen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:

Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen:

Polysemie des morpho-lexikalischen Typs malga
Quellen
Bislang wurden einige georeferenzierbare Wörterbücher, vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:- Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.).
- Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD und den ALTR praktiziert.
- Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; dies gilt bislang vor allem für SAO-Daten.
- Orte mit lateinischen Inschriften in der Provinz Noricum
;
- Orte mit lateinischen Inschriften aus Raetien
;
- aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae
.
- Basistyp lat. casearia in der Bedeutung 'Hütte'
in Nord-, Süd- und besonders prägnant in Osttirol;
- den Basistyp vorröm. baita in der Bedeutung 'Haus'
in Slowenien südlich von Ljubljana;
- den Basistyp lat. cellarium in der Bedeutung 'Hütte'
in Oberösterreich.

Das von VA entwickelte Transkriptionstool
Multidimensionalität
Für ein umfassendes Verständnis der historischen Prozesse ist es unbedingt wünschenswert, die sprachliche Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die
Synoptische Karte zur lateinischen Epigraphik, den Tabula Peutingeriana-Orten und den Basistypen cellarium und baita in einem Teil des deu. und slow. Raums (vgl. die Legende oberhalb der Karte)
Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.
(auct. Thomas Krefeld)
Tags: Publikation
Funktionsbereich (2): Kooperation
(Zitieren)
(auct. Thomas Krefeld)
Tags: Kooperation Publikation
Funktionsbereich (3): Publikation
(Zitieren)
- Theoretisch und methodologisch zentrale Begriffe und Probleme werden in konziser Weise unter dem Reiter Methodologie abgelegt.
- Ausführlichere analytische Untersuchungen von Projektergebnissen oder theoretische bzw. methodologische Diskussionen können unter Projektpublikationen abgelegt werden.
- Kommentare zu einzelnen sprachlichen Typen werden in der Kartenlegende durch einen 'i'-Button geöffnet; sie können dort auch sehr leicht durch Projektmitarbeiter oder Externe eingestellt werden.

Über die Legende zugängliche Kommentarfunktion
auct. Thomas Krefeld
Tags: Publikation
Funktionsbereich (4): Crowdsourcing
(Zitieren)

Herausheben des Käsebruchs (Tannheim, Bezirk Reutte, Tirol, 1940)
auct. Thomas Krefeld
Tags: Crowdsourcing
Funktionsbereich (5): Forschungslabor
(Zitieren)
auct. Thomas Krefeld
Tags: Forschungslabor
Funktionsbereiche
(Zitieren)
(1) Dokumentation und sprachgeschichtliche Analyse des dialektalen Wortschatzes, der nach Maßgabe des onomasiologischen Rahmes als charakteristisch eingeschätzt wird;
(2) Kooperation mit Projektpartnern zum gegenseitigen Datenaustausch und zur Datenanalyse;
(3) Publikation des Datenbestandes, analytischer Texte und unterschiedlicher, projektbezogener Materialien, die sich teils an die fachliche, teils an die breite Öffentlichkeit richten.
Die Funktionen (1) bis (3) wurden mit der ersten Version 15/1 bereits aktiviert und werden kontinuierlich ausgebaut. In der Vorbereitung befinden sich die zwei weitere Funktionen:
(4) Datenerhebung durch Crowdsourcing;
(5) die Einrichtung eines Forschungslabors.
(auct. Thomas Krefeld)
Tags: Publikation
Georeferenzierung
(Zitieren)
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Dokumentation Kooperation Crowdsourcing
Gruppieren und Sortieren
(Zitieren)

Eine Sortierung nach Basistypen zeigt die sprachgrenzüberschreitenden Verbreitungsareale, hier den romanischen Typen butyru(m) im deutschen Sprachgebiet und den deutschen Typ Schmalz im romanischen.

Basistyp Schmalz (111 Belege)
Basistyp butyru(m)
(913 Belege)

Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen:

Tags: Dokumentation Forschungslabor
Induktive Kulturraumforschung
(Zitieren)
Das Grundprinzip besteht darin, ausschließlich mit georeferenzierbaren Daten zu operieren und – abgesehen von der Zugehörigkeit der Orte zur Alpenkonvention – keinerlei großräumige Kategorien vorzugeben. Zur kulturräumlichen Profilierung des Alpenraums können die außersprachlichen Daten beitragen, die aktuelle oder historische Informationen über die soziale Organisation der Einwohner und/oder über deren infrastrukturelle Erschließung und Bewirtschaftung des Raums liefern. Im Hinblick auf die historische Rekonstruktion des alpinen Kulturraums ist es erstrebenswert, die Gebiete archäologischer Persistenz mit den Arealen sprachlicher Relikte abzugleichen und quantitativ in Gestalt einer kombinierter Sach- und Sprachschichtenkartographie zu visualisieren; vgl. dazu aus archäologischer Sicht allgemein Häuber/Schütz 2004a sowie den modellhaften Kölner Stadtschichtenatlas (vgl. Häuber/Schütz/Spiegel 1999 und Häuber u.a. 2004).
(auct. Thomas Krefeld)
Tags: Dokumentation
Informant
(Zitieren)
(auct. Thomas Krefeld)
Tags: Kooperation Crowdsourcing
Inputdaten
(Zitieren)
(auct. Thomas Krefeld)
Tags: Dokumentation
Interlinguale Geolinguistik
(Zitieren)
Es sind, genauer gesagt, drei Sprachfamilien, die den neuzeitlichen Alpenraum in Gestalt unterschiedlich großer und vor allem unterschiedlich stark differenzierter Dialektkontinua prägen; die Verbreitungszonen der drei Sprachfamilien lassen sich übrigens nicht auf spezifische Staaten abbilden vgl. aktuelle Sprachgebiete. Das Germanische ist durch alemannische und bairische Varietäten vertreten, die der plurizentrischen deutschen Sprache zugerechnet werden; allerdings ist der gemeinsame Bezug auf die schweizerische, deutsche und österreichische Standardvarietät, der die Zugehörigkeit zu ein und derselben Sprachgemeinschaft überhaupt erst stiftet, bei manchen walserischen und altbairischen (zimbrischen) Sprachinseln auf der Alpensüdseite eigentlich nicht mehr gegeben.
Im Unterschied zum germanischsprachigen Teilgebiet kann man die Varietäten des romanischen Kontinuums mehreren Sprachen zuordnen; neben dem Französischen und Italienischen handelt es sich dabei nach Maßgabe der politischen Anerkennung in der Schweiz und in Italien um Okzitanisch, Frankoprovenzalisch, Rätoromanisch (im Sinne von Bündnerromanisch), Dolomitenladinisch und Friaulisch.
Das Slawische ist durch slowenische Dialekte vertreten, die außer in Slowenien auch in etlichen italienischen und österreichischen Gemeinden gesprochen werden. Zu den Zielen von VerbaAlpina gehört es jedoch nicht, die Dialekte des Alpenraums möglichst vollständig zu beschreiben, die lokalen oder regionalen Dialektgrenzen herauszuarbeiten und den Raum so gewissermaßen als Mosaik von Varietäten darzustellen. Vielmehr sollen durch die großräumige Anlage gerade die (vor allem lexikalischen) Merkmale hervortreten, die über die einzelnen Dialekt- und Sprachgrenzen hinweg verbreitet sind und so die ethnolinguistischen Gemeinsamkeiten hervortreten lassen.

Da Dialekte in sich vollständige sprachliche Systeme bilden, darf man im Hinblick auf die gemeinsame Untersuchung der drei 'genetisch' verschiedenen Kontinua sagen, dass der Sprachkontakt hier in Gestalt einer interlingualen Geolinguistik untersucht wird.
(auct. Thomas Krefeld)
Tags: Dokumentation Kooperation
Kartographie
(Zitieren)
Das heuristisches Potential der Kartographie ist beachtlich; daher wird dem Nutzer von VerbaAlpina die Option angeboten, unterschiedliche Datenklassen aus einer Kategorie (z. B. mehrere Basistypen) oder aus den unterschiedlichen Kategorien (z. B. außersprachliche und sprachliche Daten) auf synoptischen Karten zu kombinieren und zu kumulieren.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist.

Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.
(auct. Thomas Krefeld)
Tags: Dokumentation Forschungslabor
Kontinuität
(Zitieren)
(auct. Thomas Krefeld)
Tags: Dokumentation
Konzept
(Zitieren)
- Traditionelle Alltagswelt,
- Natürliche Umwelt,
- Moderne Alltagswelt,
die jedoch für die Organisation der Daten nur eine sehr allgemeine Bedeutung haben. Auf der Ebene der Datenbank sind vielmehr solche Ordnungsprinzipien relevant, die es erlauben Relationen zwischen den einzelnen Konzepten festzulegen. Zunächst lassen sich alltagsweltliche Kategorien durch Konzepte sehr unterschiedlichen Abstraktions-, bzw. Spezifikationsgrads erfassen, so dass sich taxonomische Hierarchien ergeben. Zwischen Konzepten, die auf unterschiedlichen hierarchischen Ebenen liegen, bestehen strenge
(1) Inklusionsrelationen
in der Weise, dass jede Definition eines Unterbegriffs die Definition ihres Oberbegriffs enthält und spezifiziert. Dazu das Beispiel einer konzeptuellen Kategorie:
- Oberbegriff: GEBÄUDE
- Unterbegriff der 1. Ebene: SENNHÜTTE, STALL, KÄSEKELLER usw.
- Unterbegriff der 2. Ebene: SENNHÜTTE AUS STEIN, SENNHÜTTE AUS HOLZ, SENNHÜTTE AUS HOLZ MIT UNTERBAU AUS STEIN usw.
Zwischen den hierarchisch gleichgeordneten Konzepten auf ein- und derselben Ebene bestehen dagegen stets:
(2) Exklusionsrelationen
Eine Sennhütte ist weder ein Stall, noch ein Käsekeller.
Ganz anders ist dagegen die Hierarchie, die sich ergibt, wenn komplementäre Konzepte einen komplexen Funktionszusammenhang bilden, der ebenfalls als Konzept gefasst werden muss. Hier spricht man von
(3) Teil-Ganzes-Relationen.
So gehören zum umfassenden Konzept ALM (als Ganzes) unterschiedliche Sektionen, das GELÄNDE, das VIEH, die GEBÄUDE, das PERSONAL und die TÄTIGKEITEN, insbesondere die MILCHVERARBEITUNG (Teile). Teil-Ganzes-Relationen sind einerseits hierarchisch (wie die Inklusionsrelationen), aber andererseits beruhen sie gerade nicht auf definitorischer Inklusion, sondern auf Exklusion. Baumgraphen sind für ihre Darstellung nicht geeignet.
Man vergleiche exemplarisch das Schema zur begrifflichen Sektionierung des Feldes ALMWESEN.

Im Bereich der Sektionen lassen sich wiederum Ganze und deren konstitutive Teile erkennen. So gehören zur PRODUKTION VON KÄSE (Ganzes) diverse TÄTIGKEITEN, PROZESSE, GERÄTE, GEFÄSSE, PERSONEN und GEBÄUDE (Teile).

(auct. Thomas Krefeld)
Tags: Dokumentation
Konzeptbeschreibung
(Zitieren)
(auct. Giorgia Grimaldi | Thomas Krefeld)
Tags: Publikation
Langzeitarchivierung
(Zitieren)
Im einzelnen werden die folgenden Aspekte berücksichtigt:
1. Welche Institution(en) wird(/werden) mit der Bewahrung der Daten bzw. der betreffenden Datenträger betraut?
2. Dokumentation der Datenstrukturierung sowie der logischen Zusammenhänge zwischen Daten und Datenkategorien (Entity Relationship)
3. Dokumentation der verwendeten Zeichenkodierung(en)
Mehrere Kopien der Projektdaten sollen bei mehreren verschiedenen Institutionen archiviert werden. Derzeit sind dafür die IT-Gruppe Geisteswissenschaften der Ludwig-Maximilians-Universität München (ITG) mit deren Anbindung an die Archivierungsserver des Leibniz-Rechenzentrums sowie das BAS Clarin Repository vorgesehen. Es ist geplant, zusätzliche Sicherungskopien bei weiteren geeigneten Institutionen zu deponieren. Die Archivierung findet im Rhythmus der Versionierungen statt. Archiviert werden jeweils die Datenbank mit sämtlichen Projektdaten (Modul VA_DB zusammen mit dem Entity-Relationship-Modell) sowie das Web-Framework (VA_WEB), das für die Präsentation der Daten im Internet (inklusive der jeweiligen Funktionalität) zuständig ist, so dass, zumindest theoretisch, ein "Wiedererwecken" jeder einzelnen Version in entsprechenden emulierten Betriebssystem- bzw. Softwareumgebungen möglich ist. Archiviert wird ferner die Medienbibliothek, die hauptsächlich Photos, Filme, Text- und Tondokumente enthält (Modul VA_MT).
(auct. Stephan Lücke)
Tags: Publikation
Lizenzierung
(Zitieren)

CC BY-SA 3.0 DE (http://creativecommons.org/licenses/by-sa/3.0/de/; "Namensnennung, Weitergabe unter gleichen Bedingungen") (objektabhängig) bzw.

CC BY-NC-SA 3.0 DE (http://creativecommons.org/licenses/by-nc-sa/3.0/de/; "Namensnennung, nicht kommerziell, Weitergabe unter gleichen Bedingungen").
Einzelne Mediendateien im VA-Modul VA_MT, die VA aus externen Datenquellen bekommen oder erworben hat, können auch dem Copyright unterliegen. Die Objekte im Modul VA_MT werden individuell mit entsprechenden Merkmalen versehen.
Das Lizenzierungssystem sowie die Zugriffsrechte der verschiedenen VA-Benutzergruppen wird durch die folgende Graphik dokumentiert:

(auct. Stephan Lücke)
Tags: Kooperation Publikation
Mehrwortlexie
(Zitieren)
Aus informatischer Perspektive ergibt sich dabei das Problem einer mehrschichtigen Konzeptzuordnung, die im relationalen Datenmodell abgebildet werden muss: Neben der Bedeutung der Mehrwortlexie als ganzer besitzen die Einzelwörter eigene Bedeutungen, die ein Licht auf die Motivation der Bildung der Mehrwortlexie werfen. Um diese Besonderheit zu berücksichtigen, werden in der Datenbank von VerbaAlpina sogenannte Tokengruppen verwendet. Ein Beleg, der aus mehreren Einzelwörtern besteht, wird hierbei in seine Bestandteile aufgespalten und diese werden in der Tabelle `tokens` abgelegt. Jedes dieser Tokens verweist dabei auf ein und denselben Eintrag in der Tabelle `tokengruppen` und speichert zusätzlich seine Position in der Tokengruppe (1., 2. usw. Stelle), so dass die Mehrwortlexie aus den Einzeltokens rekonstruiert werden kann. Ein explizites Speichern der Mehrwortlexie ist somit nicht nötig; in der Tabelle `tokengruppen` werden also (außer der ID der Tokengruppe) nur zusätzliche Informationen abgelegt, die aus den Einzeltokens nicht hervorgehen können, wie beispielsweise das Genus der Tokengruppe.
Eine Zuordnung von Konzepten findet sowohl auf Ebene der Tokens als auch auf Ebene der Tokengruppen statt. Für das obige Beispiel gibt es damit drei Einträge in der Tabelle Tokens, denen jeweils unterschiedliche Konzepte zugeordnet sind:

Zusätzlich gibt es einen Eintrag in der Tabelle `Tokengruppen` mit einer eigenen Konzeptzuordnung:

Bei der kartographischen Darstellung an der Oberfläche von VerbaAlpina werden Tokens und Tokengruppen gleichberechtigt behandelt, das heißt, eine Suche nach dem Konzept ALMHÜTTE liefert sowohl Tokengruppen also auch Tokens, die mit diesem Konzept verbunden sind. Einzelwörter, die nur als Bestandteil einer Mehrwortlexie belegt sind, werden dabei entsprechend markiert.
(auct. Stephan Lücke | Florian Zacherl)
Tags: Dokumentation
Module
(Zitieren)
Notation
(Zitieren)
(auct. Thomas Krefeld)
Tags: Publikation
Onomasiologischer Rahmen
(Zitieren)
Onomastik
(Zitieren)
Die erstgenannte Perspektive ist wegen der überschaubaren Inputdaten zweifellos einfacher, denn sie liefert einen Grundbestand von meist gut lokalisierbaren römischen Namen, der systematisch abgearbeitet werden kann. Weitaus anspruchsvoller und auch erheblich aussagekräftiger ist die Rückperspektive. Hier fehlt es weithin an den Voraussetzungen für eine erfolgreiche großräumige Arbeit; viele Gebiete sind namenkundlich nicht erschlossen, da weder die rezenten dialektalen Varianten noch frühe Belege vorliegen. Immerhin ist mit dem Schweizer Ortsnamenportal ein vielversprechender Anfang gemacht worden.
Neben den Siedlungsnamen ist aber gerade die Dokumentation von Flurnamen (etwa von Berg und Almen) wichtig, da sie Rückschlüsse auf die kontinuierliche Nutzung des Geländes erlaubt. Dazu das folgende, ganz vorläufige Beispiel: In seiner wichtigen Studie über die frühmittelalterliche Besiedlung des südlichen Oberbayern und der sich anschließenden Tiroler und Salzburger Gebiete schreibt Franz Weindauer 2014 über das Ergebnis einer umfassenden Auswertung der archäologischen Funde: "Der Abgleich mit den Ergebnissen der Ortsnamenkunde und der Patrozinienforschung hat ergeben, dass erneut die bereits in spätrömischer Zeit besiedelten Regionen stichhaltige Hinweise auf romanisches Leben im Frühmittelalter liefern. Dazu zählen in erster Linie das Ammerseegebiet, das Werdenfelser Land, das östliche Chiemseegebiet und der Rupertiwinkel, aber beispielsweise auch die Region um das Mangfallknie, um Rosenheim und um den Starnberger See" (Weindauer 2014, 249). Dabei orientiert sich die Verteilung der archäologischen Fundorte im alpinen Teil seines Untersuchungsgebiets ganz offenkundig an den Passwegen, also etwa an der Brenneroute, die sich in Innsbruck (von Süden aus gesehen) in einen westlichen Zweig (über den Zirlerberg nach Garmisch und ins Alpenvorland) und einen östlichen Zweig (den Inn abwärts) teilt. Schon ein oberflächlicher toponomastischer Blick auf das ausgedehnte Karwendelgebirge, das im Winkel dieser beiden Routen liegt und bis heute keine einzige etwas größere Siedlung kennt, fördert im Abstand von wenigen Kilometern evidente Romanismen oder romanisch vermittelte vorrömische Wörter zu Tage:
* die Fereinalm < lat. veranum, vgl. span. verano 'Sommer' sowie den Vereinatunnel im Unterengadin;
* die Krapfenkarspitze zur Basis vorröm. *krapp- 'Fels', vgl. rätorom. (sursilvan) crap mit sehr zahlreichen Belegen in der Bündner Toponomastik (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorröm. *blese 'steile Grashalde', vgl. rätorom. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 sowie die ebenfalls zahlreichen toponomastischen Belege in Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu mit Verlagerung des Akzents auf die erste Silbe; vgl. die schweizerischen Entsprechungen, wie den rätorom. Ortsnamen glaretsch in Disentis (vgl. Schorta 1964, 164) und den ostschweizerischen alemann. Ortsnamen Glaretsch in Pfäfers (vgl. ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, vgl. die zahlreichen bündnerrom. Belege des Typs laret, zur Variante lat. larictum in Schorta 1964, 185;
* den Bergnamen Juifen < lat. iugum 'Joch', wiederum etliche, weitgestreute Parallelen, vgl. die Ortsnamen Juferte im Simmental südlich Bern, mehrere Juf und giuf, giuv in Graubünden (alle im Ortsnamenportal der Schweiz) sowie den Jaufenpass in Südtirol; wenig östlich vom Juifen liegt der Berg Guffert, dessen Name zur genannten Simmentaler Variante gestellt werden muss.
Eine sorgfältige Analyse würde noch erheblich mehr zu Tage fördern. Man beachte beim letzten Beispiel die deutlich nicht mehr lateinische, sondern romanische Lautgestalt (-g- > -v-, -f). Alle diese Übernahmen setzen Kontakt mit einer romanischsprachigen Bevölkerung voraus, die das Gebirge zur Subsistenz nutzte und wohl auch Akkulturation an ihre Lebensform. In diesem Sinne hat sich schon Gamillscheg 1935, 306 geäußert: "Der alemannische und bajuwarische Bauer, der dem neubesiedelten Boden seine Frucht abringt, stellt die Verbindung mit den unter gleich hart Bedingungen arbeitenden Romanen her. Nichts zeigt deutlicher, daß sich hier keine nationalen Kämpfe abgespielt haben, als die Tatsache, die altromanischen Ortsnamen und die jüngeren deutschen hier ebenso friedlich nebeneinander weiterbestehen wie Ladiner und Deutschtiroler. Das Eindringen der Alemannen und Bajuwaren in den rätisch-norischen Alpen hat keine Kulturzerstörung im Gefolge gehabt."
(auct. Thomas Krefeld)
Tags: Dokumentation
Publikation
(Zitieren)
In manchen Wissenschaftsdisziplinen (nach unserer Kenntnis trifft dies u. a. auf die Informatik zu) ist in den vergangenen Jahren gar ein Trend zu beobachten, der die mit den Neuen Medien einhergehenden technischen Möglichkeiten ad absurdum führt: Während es nunmehr eigentlich ein Leichtes ist, weltweit bequemen Zugang zu Informationen und Texten zu gewähren, geschieht auch dort das blanke Gegenteil, indem der entsprechende Zugang nur gegen Bezahlung freigegeben wird. Dies ist sogar ein Rückschritt gegenüber der von uns zuvor kritisierten traditionellen Publikation auf Papier. Wir warnen an dieser Stelle nachdrücklich vor derartigen Entwicklungen, die auch im Bereich der Geisteswissenschaften bereits ansatzweise zu beobachten sind.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Publikation
Quellen
(Zitieren)
(1) Die Quelle liefert einen Einzelbeleg:
Einzelbeleg: [a̠lpˈejo̞] – Ort: Bassano del Grappa – Quelle: ALD-II 848_1, 181 (Valrovina)
Phonetischer Typ: (nicht typisiert)
Morpho-lexikalischer Typ: Treccani alpeggio (rom. m.)
Basistyp: alpe; vgl. DELI 42
Konzept: ALM
(2) Die Quelle liefert einen phonetischen Typ:
(Kein Einzelbeleg vorhanden) – Ort: Adelboden
Phonetischer Typ: Anke – Quelle: SDS V_179_1, BE104
Morpho-lexikalischer Typ: Anke (ger. m.), vgl. Idiotikon s.v. Anke, 1, 341 ff.
Basistyp: anko; vgl. Kluge 2001, 47
Konzept: BUTTER
(3) Die Quelle liefert einen morpho-lexikalischen Typ:
(Kein Einzelbeleg vorhanden) – Ort: St. Peter-Pagig
Phonetischer Typ: Putter – Quelle: SDS V_179_1, GR22
Morpho-lexikalischer Typ: Butter (ger. n.), vgl. Idiotikon s. v. [[Butter, 1, 341 ff. – Quelle: SDS V_179_1, GR22
Basistyp: butyru(m); vgl. DELI 178
Konzept: BUTTER
(4) Die Quelle liefert einen morpho-lexikalischen Typ, der zwar im Standarddeutschen existiert, jedoch mit einem anderen Konzept verbunden ist:
Morpho-lex. Typ: Pelz Duden s.v. Pelz (nicht für dieses Konzept); Idiotikon s.v. Belz P-, 4, 1222 – Quelle: SDS V_162_1
Konzept: HAUT AUF DER MILCH, BEIM ABKÜHLEN NACH DEM KOCHEN
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Dokumentation Kooperation Crowdsourcing
Rätoromanisch
(Zitieren)
(auct. Thomas Krefeld)
Tags: Publikation
Referent
(Zitieren)
(auct. Stephan Lücke)
Tags: Dokumentation
Referenzwörterbücher
(Zitieren)
auch phonetische und morpholexikalische Typen, werden auf einen lexikographischen Referenzrahmen bezogen, um eine bessere Vergleichbarkeit des Materials zu gewährleisten. Die Typisierungsarbeit erfolgt durch die Mitarbeiter von VerbaAlpina und basiert auf deren sprachwissenschaftlicher Expertise. Sie bewegt sich somit im Bereich der Interpretationsebene und erhebt keinen Anspruch auf unbestreitbare Gültigkeit. Konkret werden die den Quellen entnommenen Daten mit den Lemmata der im Folgenden gelisteten Referenzwörterbücher verbunden. Innerhalb einer Sprachfamilie werden zu typisierende Sprachdaten jeweils mit passenden Lemmata der sprachraumspezifischen Referenzlexika verbunden. In umgekehrter Perspektive ist es somit möglich, ausgehend von den Lemmata der Referenzwörterbücher, sämtliche zugeordneten VerbaAlpina-Daten aufzufinden. Insofern stellt VerbaAlpina eine organische Erweiterung der verwendeten Referenzwörterbücher dar, die von Seiten der Referenzwörterbücher, die online verfügbar sind, ohne größere Probleme durch Verlinkung technisch realisierbar ist.
Sofern im Einzelfall keines der definierten Referenzwörterbücher ein passendes Lemma aufweist, legt VerbaAlpina in orthographischer Schreibweise einen morpholexikalischen Typ fest, der fortan Referenzstatus besitzt und auf den alle weiteren Sprachdaten dieser morpholexikalischen Kategorie bezogen werden. Durch diese Eigenreferenzierung erhält auch VerbaAlpina selbst den Status eines Referenzwörterbuchs.
Da es sich bei der beschriebenen Zuweisung auf die Referenzwörterbücher um eine interpretationsabhängige Arbeit handelt, ermöglicht VerbaAlpina durchaus auch eine kontroverse Kommentierung einzelner Lemmazuweisungen durch Wissenschaftler und Laien, die es Externen erlaubt, alternative Typisierungen vorzunehmen, die ihrerseits wieder kommentiert und diskutiert werden können.
Wörter aus dem germanischen Sprachraum werden, sofern möglich, verknüpft mit den Lemmata von:
- Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch
- Grimm, Jacob und Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm, 16 Bde. in 32 Teilbänden, Leipzig (Quellenverzeichnis Leipzig 1971) (DWB)
- Duden (Berücksichtigung aufgrund seiner faktischen Bedeutung und der großen Materialfülle – trotz der Dürftigkeit hinsichtlich der von ihm präsentierten lexikographischen Informationen)
- Vocabolario Treccani
- Trésor de la langue française informatisé (TLFi)
- Glossaire des patois valdôtains http://patoisvda.org/gna/index.cfm/moteur-de-recherche.html
- Banca lessicala ladina (BLad; Ladinisch [lld])
- Pledari grond (Rätoromanisch [roh]) und DRG
- LSI und RID
- Slovar slovenskega knjižnega jezika (SSKJ)
- Georges, Karl Ernst (1913-1916, Reprint 1998): Ausführliches lateinisch-deutsches Handwörterbuch. Aus den Quellen zusammengetragen und mit besonderer Bezugnahme auf Synonymik und Antiquitäten unter Berücksichtigung der besten Hilfsmittel ausgearbeitet, 2 Bände, Darmstadt.
- Wartburg, Walther von (1922-1967): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel (FEW), mit seinen artikelschließenden Kommentare, die oft auch über das Französische und sogar das Romanische hinaus grundlegend sind.
- Kluge
- DELI
- Bezlaj und auch die neuste Ausgabe Snoj. Allgemein für slawische Etymologien s. Berneker
Auct. Thomas Krefeld | Stephan Lücke
Tags: Dokumentation
Relationales Datenmodell
(Zitieren)
Für die Abbildung von Informationen im relationalen Datenmodell existieren eigene Regeln, die de facto eine Wissenschaft für sich darstellen (z. B. die sog. Normalisierung). Gleichzeitig ist die konkrete Wahl der Modellierung anwendungsabhängig und die Einhaltung bestehender Modellierungsregeln in manchen Fällen aus der Perspektive der Nutzbarkeit und Performanz eher hinderlich. In der Praxis stellt jede Datenmodellierung einen Kompromiss zwischen den Vorgaben des theoretischen Regelwerks, technischen Erfordernissen und Nutzerfreundlichkeit dar. Darüber hinaus kann ein einmal gewähltes Datenmodell jederzeit geändert und an veränderte Erfordernisse angepasst werden.
(auct. Stephan Lücke)
Tags: Dokumentation
Repositorien
(Zitieren)
VerbaAlpina ist bestrebt, jede VA-Version in einem oder mehreren Repositorien abzulegen.
auct. Stephan Lücke
Tags: Dokumentation
Semantik (Zitieren)

Graphik: Stephan Lücke
Im Lichte der dabei zu Tage tretenden Konzeptrelationen lässt sich das synchrone semantische Profil eines jeden polysemen Ausdrucks skizzieren; die wichtigsten Ausprägungen von Polysemie werden im Folgenden genannt.
- Taxonomische Polysemie liegt vor, wenn ein Ausdruck hierarchisch sowohl einander über- als auch untergeordnete Konzepte bezeichnet.
- Meronymische Polysemie liegt vor, wenn ein Ausdruck sowohl komplexe Sachzusammenhänge ('Ganze') als auch Konstituenten dieser Zusammenhänge ('Teile') bezeichnet; so wird die ALM, der für den Bauern wichtige Teil des Berges häufig schlechthin als 'Berg' bezeichnet:

Morpho-lex. Typ montagna 'Berg' (rom. m.) (16 Belege) |
|
Morpho-lex. Typ monte (rom. f.) (67 Belege) |
Andererseits kann die ALM, als wirtschaftliches Ganzes (mit allem, was dazu gehört) mit Ausdrücken bezeichnet werden, die eigentlich nur für Komponenten der Almwirtschaft stehen:

Meronymische Bezeichnung des Konzepts ALM als Ganzes durch Übertragung der Bezeichnung von Komponenten | |
Morpho-lex. Typ cascina 'Sennhütte' (rom. f.) (1 Beleg) |
|
Morpho-lex. Typ casera 'Sennhütte' (rom. f.)(1 Beleg) |
|
Morpho-lex. Typ cjampei 'Felder' (rom. m.)(2 Belege) |
|
Morpho-lex. Typ pascol 'Weide' (rom. m.)(1 Beleg) |
|
Morpho-lex. Typ pascolo 'Weide' (rom. m.)(1 Beleg) |
- Metonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die innerhalb ein und desselben 'Ganzen' unterschiedliche 'Teile' bezeichnet; so gehören zu einer ALM u.a. das VIEH, GEBÄUDE für das PERSONAL und für das Vieh, eine HÜRDE usw. Alle genannten Komponenten können in unterschiedlichen romanischen Ortsdialekten durch den morpho-lexikalischen rom. mandra bezeichnet werden:

Metonymische Bedeutungen des morpho-lexikalischen Typs rom. mandra
Konzept ALMHÜTTE (1 Beleg) |
|
Konzept ALMSTALL (2 Belege) |
|
Konzept HERDE (15 Belege) |
|
Konzept RINDERHÜRDE (3 Belege) |
- als 'Kopf': capo (rom. m.), (19 Belege), dazu capo di latte (rom.), wörtlich 'Milchkopf' (12 Belege), il capo del latte (rom.) (1 Beleg)
- als 'Blume': fleur / fiore (rom. m.) (15 Belege), fiora (rom. f.) (17 Belege), dazu fiora cruda (1 Beleg), wörtlich 'ungekochte Blume', fiore di latte (rom.), wörtlich 'Milchblume' (2 Belege)
- als 'Haut': Haut (ger. m.) (2 Belege), peau / pelle (rom. f.) (1 Beleg), la pelle del latte (rom.) (1 Beleg)
- als 'Pelz': pelliccia (rom. f.) (2 Belege), Pelz (ger. m.) (4 Belege)
- als 'Nebel': sbrumacje (rom. f.) (2 Belege), sbrume (rom. m.) (11 Belege)
- als: 'Schaum': écume / schiuma (rom. f.) (2 Belege), spuma (rom. f.) (1 Beleg), spumacje (rom. f.) (1 Beleg)
- als: 'Tuch': toile / tela (rom. m.) (14 Belege), dazu tela del latte (rom.) (1 Beleg) und tela di latte (rom.) (5 Belege), wörtlich 'Milchtuch'
-
- Antonymische Polysemie liegt vor, wenn ein Ausdruck Konzepte bezeichnet, die im Gegensatz zueinander stehen.

(auct. Thomas Krefeld)
Tags: Dokumentation
Sprachatlanten im Alpenraum
(Zitieren)
- Romania alpina: ALF, AIS (Details), ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
- Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAO;
- Slavia alpina: SLA.
(auct. Thomas Krefeld)
Tags: Dokumentation
Sprachfamilien im Alpenraum
(Zitieren)
Das Projekt zielt auf dialektale ('basilektale') Daten; standardsprachliche oder standardnahe ('akrolektale') Varianten werden nicht erhoben; sie können de facto aber jeder Zeit auftauchen, weil die korrespondierenden Dialektformen nicht mehr geläufig oder allenfalls noch passiv bekannt sind; dieser Fall ist in Bereich der traditionellen Lebenswelt nicht selten. Es kann aber ebenso sein, dass lokale Dialektvarianten niemals existiert haben; genau diese Konstellation wird in einer eventuell dritten Phase, in der die moderne Lebenswelt thematisiert werden soll, vermehrt erwartet (vgl. Onomasiologischer Rahmen. Es wäre jedoch zu einfach, die sprachliche Dynamik ausschließlich im Abbau diatopisch markierter Formen zu vermuten: Aktuell fehlende regionale oder lokale Formen schließen zukünftige Entstehungen keineswegs aus.
(auct. Thomas Krefeld)
Tags: Dokumentation
Sprachkontakt
(Zitieren)
(auct. Thomas Krefeld)
Tags: Publikation Crowdsourcing
Strata (Zitieren)
Tags: Dokumentation
Stratigraphie
(Zitieren)
Wenn die Herkunftssprache des entlehnten Elements im Verbreitungsgebiet, oder in einem Teil davon, nicht mehr gesprochen wird, werden zwei Konstellationen unterschieden: Im Fall des Substrats wurde die Herkunftssprache (Substratsprache) im Verbreitungsgebiet gesprochen, bevor ihre Überlieferungskontinuität abriss und die geltende Sprache sich durchsetzte; das Romanische ist eine Substratsprache des gesamten deutsch- und slowenischsprachigen Alpengebiets. Substratwörter setzen zwar Sprachwechsel voraus; sie zeichnen sich aber trotzdem oft durch außerordentliche regionale oder lokale Kontinuität aus.
Im Falle des Superstrats galt die Herkunftssprache während eines gewissen Zeitraums im Verbreitungsgebiet, ohne sich dort dauerhaft zu etablieren. So herrschten in Teilen des heute romanischsprachigen Alpenraums nach dem Zusammenbruch der römischen Infrastruktur zeitweise germanische Superstrate (Gotisch, Langobardisch) und in Slowenien spielte das Deutsche während der Habsburgerzeit diese Rolle.
Zwischen den drei Sprachfamilien haben sich nun durchaus unterschiedliche Szenarien ergeben; hinsichtlich der Bedeutung des Sprachkontakts für die Geschichte des sprachlichen Raums ist vor allem die Chronologie der Entlehnung wichtig: Handelt es sich beispielsweise bei Romanismen im germanischen und slawischen Sprachraum um Substratwörter mit regionaler Überlieferungskontinuität seit der Antike oder um jüngere adstratale Übernahmen? Dieselbe Frage gilt mutatis mutandis für die Germanismen im romanisch- bzw. slawischsprachigen und die Slawismen im deutschund romanischsprachigen Raum.
Entlehnungen sind ein zuverlässiger Indikator historischer Akkulturationsprozesse; deshalb ist eine quantitative Darstellung angebracht, die es gestattet, die relative Häufigkeit der belegten Entlehnungen ortsgenau abzubilden. Die Akkulturationsrichtung ist jedoch keineswegs immer eindeutig; nicht selten koexistieren in eng definierten onomasiolgischen Bereichen gegenläufige Entlehnungen. Die folgende Graphik schematisiert die stratigraphische Herausforderung. Sie differenziert die drei heute romanisch-, deutsch- und slowenischen Gebiete nach Substrat- und Superstratsprachen und symbolisiert (durch Kugeln) die mehrsprachigen Sprechergruppen in Adstratkonstellationen.

(auct. Thomas Krefeld)
Tags: Dokumentation Kooperation Forschungslabor
Stratigraphie und Onomasiologie (Zitieren)
Karte Basistypen: butyrum, casearia, crama, tegia, stabulum u.a.
Das spricht in unmissverständlicher Weise dafür, dass die entsprechenden grundlegenden Kulturtechniken im Alpenraum sehr alt sind und an jeweils hinzukommende Ethnien und ihre Sprachen weitergegeben wurden. Aber es wäre natürlich zu einfach, bestimmte onomasiologische Teilbereiche zur Gänze mit bestimmten sprachlichen 'Schichten' zu verknüpfen. Es ist vielmehr bemerkenswert, dass gerade auch Entlehnungen in entgegengesetzter Richtung belegt sind und daher dauerhafter gegenseitige kultureller Austausch anzunehmen ist. Charakteristisch sind die komplementären Bezeichnungstypen für das Konzept BUTTER. Während sich im Bairischen der romanische Typus Butter durchgesetzt hat, ist der deutsche Typ Schmalz in einem Teil der romanischen Mundarten etabliert:

Es scheint also, als ob sich das Auslassen, d.h das Schmelzen (daher Schmalz) der Butter als elementare Konservierungstechnik ausgehend vom deutschsprachigen Gebiet nach Süden verbreitet hätte.
Ein vergleichbares Bild geben die Bezeichnungstypen lat. stabulu(m) und deu. Stall für einfach Almgebäude.

Tags: Dokumentation Kooperation
Stratigraphie: Romanismen (Zitieren)
(1) Exklusiv dialektale Romanismen
-
Diese Kategorie, zu der die lokalen Varianten ohne Entsprechungen in der Standardsprache gehören, bildet gewissermaßen die prototypischen romanischen Entlehnungen des Alpenraums; es handelt sich in aller Regel um Substratwörter, d.h. um solche Ausdrücke, die in der Zeit der romanisch-germanischen bzw. romanische-slawischen Zweitsprachigkeit entlehnt wurden und den späteren Sprachwechsel zur germanischen bzw. romanischen Einsprachigkeit grosso modo ortsfest als Relikte überdauert haben. Ein eindeutiges Beispiel liefert der morpho-lexikalische Typ Käser, der so wie sein romanisches Äquivalent casera auf den Basistyp lat. casearia zurückgeht.


(2) Dialektale Romanismen mit Entsprechungen in der Standsprache und in den romanischen Dialekten des Untersuchungsgebiets
- Da auch bei dieser Gruppe sowie im Falle von (1) eine areale Verbreitung gegeben ist, die die aktuellen Grenzen der Sprachfamilien überschreitet, liegt es nahe, die standardsprachlichen Varianten auf die dialektalen Formen zurückzuführen. Diese Kategorie der Romanismen kann daher auch über den Alpenraum hinaus sprachgeschichtliches Interesse beanspruchen. Ein eindeutiges, in der Etymologie des Standarddeutschen verkanntes Beispiel liefert deu. Butter.

Dieses Muster der primären süddeutschen Entlehnung und ihrer sekundären Verbreitung ins Standardeutsche scheint jedoch nicht immer eindeutig, da auch die Möglichkeit der umgekehrten Verbreitungsrichtung aus dem Standard in die Dialekte des Untersuchungsgebiets in Betracht gezogen werden muss. So könnte man eventuell die deutschen Entsprechungen des Basistyps lat. cellārium sehen.
Sowohl im Fall der exklusiv dialektalen wie der dialektal-standardsprachlichen Romanismen sind im Einzelnen substratale lokale Relikte und adstratale Entlehnungen mit sekundärer arealer Verbreitung zu unterscheiden.
(Auct. Thomas Krefeld)
Tags: Dokumentation Kooperation
Synoptische Karte
(Zitieren)
(auct. Thomas Krefeld)
Tags: Dokumentation Kooperation Forschungslabor
Transkription
(Zitieren)
(1) Inputversion in der Originaltranskription
Im VA-Portal werden Quellen zusammengeführt, die aus unterschiedlichen Fachtraditionen stammen (Romanistik, Germanistik, Slavistik) und die historisch unterschiedliche Phasen der dialektologischen Forschung repräsentieren; manche Wörterbuchdaten wurden zu Beginn des letzten Jahrhunderts (GPSR) und andere erst vor wenigen Jahren (ALD) erhoben. Deshalb ist es wissenschaftsgeschichtlich notwendig, die Originaltranskription weitestgehend zu respektieren. Aus technischen Gründen ist es allerdings unmöglich, bestimmte Konventionen unverändert zu erhalten; das gilt insbesondere für die vertikale Kombination von Basiszeichen (‘Buchstaben’) und diakritischen Zeichen, also etwa dann, wenn ein Betonungsakzent über einem Längenzeichen über einem Vokal über einem Schließungszeichen positioniert ist (Betacode). Diese Konventionen werden in jeweils definierten technischen Transkriptionen in lineare Folgen von Zeichen überführt, wobei ausschließlich ASCII-Zeichen benutzt werden (so genannter Betacode). Bis zu einem gewissen Grad können bei der Beta-Kodierung intuitiv verständliche graphische Ähnlichkeiten zwischen den Originaldiakritika und den ASCII-Entsprechungen ausgenützt werden; sie sind mnemotechnisch günstig.
(2) Outputversion in IPA
Im Sinne der Vergleichbarkeit und auch der Nutzerfreundlichkeit ist zudem die Ausgabe in einer einheitlichen Transkription wünschenswert. Alle Beta-Codes werden daher mit spezifischen Ersetzungsroutinen in IPA-Zeichen überführt. Einige wenige, aber unvermeidbare Unverträglichkeiten ergeben sich vor allem dann, wenn einem, durch Diakritika spezifizierten Basiszeichen in der Inputtranskription in IPA zwei unterschiedliche Basiszeichen entsprechen. Das gilt vor allem im Hinblick auf die Öffnungsgrade der Vokale, wo z. B. in der palatalen Reihe die beiden Basiszeichen <i> und <e> in Verbindung mit Schließungspunkt und einem oder zwei Öffnungshäkchen es erlauben, sechs Öffnungsgrade abzubilden; in Beta-Kodierung sind das: i – i( – i((– e?-- e – e(– e((. Dafür stehen in IPA nur vier Basiszeichen i – ɪ – e – ɛ zur Verfügung.
(auct. Thomas Krefeld)
Tags: Dokumentation
Typisierung
(Zitieren)
Im Zentrum des Interesses von VerbaAlpina steht die morphologische Typisierung des gesammelten Sprachmaterials. Ein morphologischer Typ wird dabei durch Übereinstimmung der folgenden Eigenschaften definiert: Sprachfamilie – Wortart – einfaches Wort vs. affigiertes Wort – Genus – lexikalischer Basistyp. Die Nennform des morphologischen Typs schließlich orientiert sich an den korrespondierenden Lemmata ausgewählter Referenzlexika (s.u.).
Durch die Zuweisung zu einem gemeinsamen lexikalischen Basistyp wird die Zusammengehörigkeit aller vereinigten morpho-lexikalischen Typen klar – auch über Sprachgrenzen hinweg. So lassen sich die folgenden (hier nicht im Detail beschriebenen) Nomina und Verben einem einzigen Basistyp malga zuweisen: malga (ALM, HERDE), malgaro (SENN), malghese (HIRTE), immalgare (ALM BEZIEHEN), dismalgare (ALM VERLASSEN). Allerdings sagt der lexikalische Basistyp nichts über die Wortgeschichte der einzelnen morpho-lexikalischen Typen aus: Ob ein Typ mit lateinisch-romanischem Etymon, der heute im germanischen oder slowenischen Sprachgebiet belegt ist, wie z. B. slowenisch bajta 'einfaches Haus', auf altes lokales Substrat zurückgeht oder aber auf neueren romanischen Sprachkontakt, muss jeweils einzeln herausgearbeitet werden. Aus diesem Grund wird die Bezeichnung "Etymon", die sich grundsätzlich auf die unmittelbare historische Vorstufe eines Wortes bezieht, in diesem Kontext vermieden – auch wenn in vielen Fällen der lexikalische Basistyp tatsächlich auch das Etymon eines morpho-lexikalischen Typs ist.
Die morpho-lexikalischen Typen bilden die Leitkategorie in der Verwaltung der sprachlichen Daten; sie sind den Lemmata der Lexikographie vergleichbar. Mittels der oben genannten, robusten und gut operationalisierbaren Kriterien lassen sich z.B. die vier phonetischen Typen barga, bark, margun, bargun mit der Bedeutung ALMHÜTTE, ALMSTALL auf drei morpho-lexikalische Typen reduzieren:

Die Zugehörigkeit der morpho-lexikalischen Typen zu Sprachfamilien (germ., rom., slaw.) hängt von der jeweiligen Quelle ab; sie ergibt sich im Fall traditionell erhobener Atlas- oder Wörterbuchdaten automatisch über die jeweiligen Informanten und wird entsprechend in der Datenbank notiert. Im Fall der Daten, die VerbaAlpina selbst durch Crowdsourcing erhebt, wird die Sprach- bzw. Dialektzugehörigkeit von den Informanten behauptet und im Idealfall quantitativ bestätigt; die Anzahl von bestätigenden Informanten wird so zu einem Instrument der Datenvalidierung.
Morpho-lexikalischen Typen sind auf eine Sprachfamilie beschränkt. Es stellt sich nun die Frage, durch welche Form ein morpho-lexikalischer Typ in der Suchfunktion der interaktiven Karte repräsentiert werden soll. Im Hinblick auf die germanische und slawische Sprachfamilie fällt die Antwort eher leicht, da beide jeweils nur durch eine standardisierte Einzelsprache ('Deutsch' [deu] bzw. 'Slowenisch' [slo]) vertreten sind. Die morpho-lexikalischen Typen können in Gestalt ihrer standardsprachlichen Varianten abgebildet werden, selbstverständlich unter der Bedingung, dass es im Standard Entsprechungen des Typs gibt; so können beispielsweise alle entsprechenden phonetischen Typen des Alemannischen und Bairischen, die Varianten der Standardform
Im Fall der romanischen Sprachfamilie ist die Situation wegen der zahlreichen, teils nicht hinreichend standardisierten Kleinsprachen sehr viel komplexer. Aus pragmatischen Gründen wurde hier der folgende Weg gewählt: Alle morpho-lexikalischen Typen werden, sofern vorhanden, durch die französischen und italienischen Standardformen repräsentiert; so können z. B. alle phonetischen Typen, die Varianten von beurre/burro 'Butter' sind, unter diesen beiden Formen aufgerufen werden; als Referenzwörterbücher fungieren u.a. TLF und Treccani. In entgegengesetzter Perspektive werden jeder Einzeläußerung alle drei Typen, ein Konzept sowie ein Verweis auf ein Referenzwörterbuch zugeordnet: :

Falls nur eine dieser beiden Standardsprachen eine passende Variante hat, erscheint nur diese, wie im Fall von ricotta (die Zugehörigkeit zum Italienischen wird durch die Notationskonvention -/ricotta angezeigt). Wenn in keiner der beiden romanischen Referenzsprachen eine Variante des Typs existiert, wird auf den Eintrag eines dialektalen Referenzwörterbuchs zurückgegriffen, etwa auf LSI. Für den Fall, dass keine verlässlichen Einträge in Dialektwörterbüchern verfügbar sind, schlägt VerbaAlpina einen Basistyp mitsamt grafischer Repräsentation ('VA') vor.
Im Gesamtkonzept und der technischen Umsetzung vorgesehen, jedoch peripher und demnach nicht konsequent umgesetzt, ist die phonetische Typisierung des Sprachmaterials. Die entsprechende Kategorie ist vor allem deswegen unentbehrlich, weil Sprachatlanten bisweilen (z. B. SDS und VALTS) und Wörterbücher ausschließlich phonetische Typen dokumentieren. Bei der phonetischen Typisierung durch VerbaAlpina werden die Tokens nach Kriterien der historischen Phonetik in phonetische Typen eingeteilt (Datenbankfeld 'phon_typ'). Dazu ein charakteristisches Beispiel (aus AIS 1204 LA PANNA | RAHM | CRÈME):

Nach Maßgabe der Phonetik ist es sinnvoll, die Anlautvarianten [kr-] und [gr-] sowie die Tonvokalvarianten [a], [e] und [o] vor [m] zu differenzieren. Sie erscheinen daher als unterschiedliche 'phonetische Typen'. Gleichzeitig ist es klar, dass es sich um lautliche Varianten ein und desselben morpho-lexikalischen Typs handelt, denn es gibt zahlreiche analoge Fälle von Lautwandel. Da sich jedoch keinerlei Evidenz für einen Wandl von [kr-] > [br-] findet, wäre es nicht sinnvoll die entsprechenden dolomitenladinischen Formen (brama) ebenfalls dazu zu stellen. Sie repräsentieren daher trotz der Ähnlichkeiten im Tonvokal und im Silbenauslaut [-ama] einen anderen morpho-lexikalischen Typ.

Eine Automatisierung der phonetischen Typisierung auf Basis von Levenshtein- und soundex-Algorithmen wird untersucht und wenn möglich umgesetzt werden; allerdings wird in jedem Fall ein starker Korrekturaufwand entstehen. Etwa die beiden historisch zusammengehörigen Formen krama und gromma unterscheiden sich rein numerisch im Sinn der Levenshtein-Distanz durch Menge an Zeichenersetzungen die durchgeführt werden müssen, um eine Form in die andere zu transformieren, stärker als die nicht zusammengehörigen Formen krama und brama.

Durch die Typisierung (Klassenbildung) wird die Datenvielfalt zunehmend übersichtlich; es gilt also in der Regel: Zahl der Tokens > Zahl der phonetischen Typen > Zahl der morpho-lexikalischen Typen > Basistyp. Man beachte jedoch den Extremfall eines einzigen Belegs (Hapax), der einem Token, einem phonetischem Typ und einem morpho-lexikalischen Typ als einzigem Vertreter eines Basistyps entspricht. U.U. ist es sinnvoll, solche Hapax-Formen in der Darstellung herauszufiltern.
(auct. Thomas Krefeld | Stephan Lücke)
Tags: Dokumentation
Uniform Resource Name (URN)
(Zitieren)
Untersuchungsgebiet
(Zitieren)
(auct. Thomas Krefeld)
Tags: Dokumentation
Versionierung
(Zitieren)

- VA_DB: Datenbestand in der (MySQL-)Projekt-Datenbank (va_xxx)
- VA_WEB: Programmcode der Webschnittstelle des Projektportals www.verba-alpina.gwi.uni-muenchen.de samt zugehöriger Wordpress-Datenbank (va_wp)
- VA_MT: Mediendateien (Photos, Filme, Text- und Tondokumente), die sich in der Medienbibliothek der Webschnittstelle befinden
Alle drei Module bilden ein konsistentes Ganzes mit wechselseitigen Verknüpfungen und Abhängigkeiten und können daher nicht voneinander getrennt werden. Während der Projektlaufzeit wird in regelmäßigen Abständen simultan der jeweils aktuelle Status der Module VA_DB und VA_WEB in Gestalt einer elektronischen Kopie gleichsam "eingefroren". Diese eingefrorenen Kopien erhalten Versionsnummern nach dem Schema [Kalenderjahr]/[laufende Nummer] (z .B. 15/1). Die jeweils produktive VA-Version erhält die Bezeichnung XXX.
Die Erzeugung von Kopien der VA-Mediathek (VA_MT) verbietet sich aufgrund der üblicherweise enormen Größe von Mediendateien. Aus diesem Grund wird von diesem Modul im Zuge eines Versionierungsvorgangs keine Kopie erzeugt. Einmal dort abgelegte Elemente können daher, sofern auch nur eine einzige VA-Version mit ihnen verknüpft ist, nicht aus der VA-Mediathek entfernt werden.
Im Projektportal besteht die Möglichkeit, zwischen der jeweils "produktiven" und daher ständigen Änderungen unterworfenen VA-Version sowie den archivierten, "eingefrorenen" Versionen zu wechseln. Im Projektportal wird durch geeignete Farbgebung des Hintergrunds bzw. bestimmter Bedienelemente angezeigt, ob man sich in der produktiven oder einer archivierten Version von VA befindet. Zitierfähig sind *ausschließlich* die archivierten Versionen von VA.
(auct. Stephan Lücke)
Tags: Publikation
Wissenschaftskommunikation im Web
(Zitieren)
- Der Wissenschaftler sucht Informanten.
- Die Informanten liefern dem Wissenschaftler Rohdaten.
- Der Wissenschaftler gibt eine bestimmte Menge der erhobenen Daten, die im Lichte theoretischer Annahmen selektiert und modelliert wurde, an ein im Wesentlichen wissenschaftliches Publikum weiter.

Die drei Schritte der traditionellen Wissenschaftskommunikation
Die Neuen Medien haben die Rahmenbedingungen für die Wissenschaftkommunikation revolutioniert: die skizzierte Unidirektionalität der Informationsflusses ist ebenso aufgehoben wie die Bindung der Rolle (INFORMANT, AUTOR, LESER) an unterschiedliche Personen; grundsätzlich kann sich ein und dieselbe Person in schnell wechselnden Funktionen an der Kommunikation beteiligen. Von Grund auf verändert ist im Hinblick auf die Kommunikanten die Funktion INFORMANT, da die Behandlung der gelieferten Daten transparent bleibt und kontinuierlich verfolgt werden kann. Der INFORMANT wird so zum LESER seiner eigenen DATEN – ganz unabhängig davon, ob er die wissenschaftliche Intention überhaupt versteht; gleichzeitig eröffnet sich ihm die Möglichkeit, dazu als AUTOR Stellung zu nehmen. Nicht weniger radikal verändert sich unter diesen Bedingungen der Status Daten selbst, da sie in grundsätzlich dynamischen Datenbank abgelegt werden, deren Umfang und Struktur Veränderungen unterworfen bleibt.

Wissenschaftskommunikation unter den Bedingungen des Internet
In diesem Sinn sind in VerbaAlpina unterschiedliche, aber eng miteinander verflochtene Funktionsbereiche angelegt.
(auct. Thomas Krefeld)
Tags: Kooperation Publikation Crowdsourcing
Wissenshorizont
(Zitieren)
(1) über außersprachliche Realität (‘Sachen’),
(2) über Konzepte, oder: inhaltliche, bzw. onomasiologische Kategorien, die nicht an einzelne Sprachen oder Dialekte gebunden sind,
(3) über sprachliche Ausdrücke der untersuchten Sprachen und Dialekte.
Die getrennte Behandlung von (2) und (3) ist grundlegend, da ja die relevanten Konzepte durchaus nicht immer im gesamten Untersuchungsgebiet mit spezifischen Bezeichnungen belegt (‘lexikalisiert’) sind; so gibt es z. B. in weiten Teilen des bairischen Gebiets kein Wort für den aus Molke hergestellten so genannten Käse (vgl. dafür alem. Ziger, ital. ricotta, fr. sérac), während es z.B. für die frische, noch ungeformte Käsemasse (bair. Topfen, dt. Quark) in den romanischen Dialekten oft, so wie auch im Standarditalienischen, keine Bezeichnung gibt. Das Verhältnis von (1) auf der einen Seite und (2) und (3) auf der anderen ist gelegentlich auch problematischer als es auf den ersten Blick erscheint; so finden sich manchmal sprachliche Ausdrücke mit unklarem semiotischen Status, weil aus den Belegen nicht hervorgeht, ob es sich um Bezeichnungen von Konzepten oder aber womöglich um Namen für Dinge handelt; das ist z. B. der Fall, wenn ein Sprecher eine ganz bestimmte Alm, etwa diejenige, die er selbst nutzt, mit einem generischen Wort als munt wörtlich ‘Berg‘ oder als pastüra ‘Weide‘ tituliert.
(auct. Thomas Krefeld)
Tags: Publikation
Zitierweise
(Zitieren)
- Eintrag von VerbaAlpina in einer Bibliographie
Die Nennung des Datums des letzten Zugriffs ist entbehrlich, da die Zitierversionen (im Unterschied zur Arbeitsversion XXX) stabil sind und nicht mehr verändert werden (vgl. Versionierung).
Beispiel:
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.
- Zitat eines Methodologiebeitrages:
Beispiel:
Krefeld, T. / Lücke, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.
Als Autoren sind stets die unter dem Glossareintrag aufgeführten und mit "auct." gekennzeichneten Personen zu nennen.
- Zitat eines Einzelbelegs:
Beispiele:
Hütte|morphTyp|Herisau|SDS#VII_244_1|VA_15/1
Chääsera|phonTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Käserei|BasisTyp|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Hinweis 1: Das Trennzeichen Pipe | erhalten Sie auf Windows-Computern durch Drücken von Strg+Alt zusammen mit der Taste, auf der sich neben der Pipe die Größer/Kleiner-Zeichen <> befinden. Auf Apple-Geräten ist die Tastenkombination Alt+fn+7 zu drücken.
Hinweis 2: Die folgenden Sprachkürzel nach ISO 639-1 sind zu verwenden: für Deutsch de, für Französisch fr, für Italienisch it, für Rätoromanisch rm, für Slowenisch sl.
(auct. Stephan Lücke | Susanne Oberholzer)
Tags: Publikation