$\"\"$ <\/a>

Zusammenhang zwischen Bezeichnungen und Konzepten<\/p><\/div>\n

Dieses zun\u00e4chst sehr simpel anmutende Basismodell erlangt sehr schnell hohe Komplexit\u00e4t durch die Hinzuf\u00fcgung der Dimensionen von Raum und Zeit. Denn bestimmte Bezeichnungen f\u00fcr bestimmte Konzepte sind nur in bestimmten Regionen gebr\u00e4uchlich. Dabei k\u00f6nnen Lage und Gr\u00f6\u00dfe dieser Regionen sich \u00fcber die Zeit ver\u00e4ndern oder auch ganz und gar verschwinden.<\/p>\n

Die Fragestellung lautet also:<\/p>\n

Welche W\u00f6rter<\/strong> werden oder wurden<\/li>\n

an welchen Orten<\/strong><\/li>\n

zu welcher Zeit<\/strong> zur Bezeichnung<\/li>\n

welcher Konzepte<\/strong> verwendet?<\/li>\n<\/ul>\n
Da die Dimension des Raumes<\/strong> einen der zentralen Faktoren darstellt, sammelt VerbaAlpina ausschlie\u00dflich Sprachmaterial mit Georeferenzierung, wie dies etwa in Sprachatlanten oder in manchen W\u00f6rterb\u00fcchern vorliegt.<\/p>\n
Der Rahmen der r\u00e4umlichen Dimension ist von VerbaAlpina durch das Perimeter der sog.<\/span> Alpenkonvention abgesteckt. Die Alpenkonvention ist ein v\u00f6lkerrechtlicher Vertrag der Alpenanrainerstaaten. Das Perimeter ist eine von dieser Organisation gezogene Grenze, die die Ausdehnung der Alpen administrativ definiert. VerbaAlpina orientiert sich aus rein pragmatischen Gr\u00fcnden an dieser Grenze, da eine klare Abgrenzung des Untersuchungsgebiets\u00a0 organisatorisch unerl\u00e4sslich und anders kaum m\u00f6glich ist. Allerdings bedingt die gew\u00e4hlte Definition des Untersuchungsgebiets gewisse Asymmetrien, wie etwa die Tatsache, dass das Schweizerische Emmental, ber\u00fchmt f\u00fcr seinen K\u00e4se, au\u00dferhalb der Alpenkonvention liegt und daher nicht von VerbaAlpina erfasst wird, obwohl diese Region in wirtschaftlicher wie auch naturr\u00e4umlicher Hinsicht sehr wohl zum Alpenraum gerechnet werden k\u00f6nnte.<\/p>\n
Innerhalb des Untersuchungsgebiets stellen f\u00fcr VerbaAlpina die politischen Gemeinden das zentrale Referenzsystem dar: S\u00e4mtliches gesammeltes und georeferenziertes Sprachmaterial wird auf das Raster der politischen Gemeinden bezogen. Bei gro\u00dffl\u00e4chigen Verbreitungsangaben wie etwa \"Tessin\" oder \"Vorarlberg\" werden die entsprechenden Sprachbelege auf s\u00e4mtliche Gemeinden dieser Regionen \u00fcbertragen. Ausgehend von der feinen Granulierung der politischen Gemeinden kann das Sprachmaterial bei sp\u00e4teren Analysen nach \u00fcbergeordneten politischen Einheiten wie etwa Kantonen, D\u00e9partments, Regierungsbezirken oder Regionen gruppiert und auf einer Karte visualisiert werden.<\/p>\n
Ein wenig problematisch ist aus Sicht von VerbaAlpina die Dimension der Zeit<\/strong>, da\u00a0das Datennetz im Hinblick auf die chronologische Streuung bislang noch sehr d\u00fcnn und bezogen auf den gesamten Alpenraum unausgewogen ist. Manche der von VerbaAlpina ausgewerteten Quellen geben den Zeitpunkt der Erhebung eines Einzelbelegs sehr exakt, manchmal sogar tagesgenau, an, bei anderen Quellen liefert das Jahr der Publikation lediglich einen Terminus ante quem f\u00fcr die darin erfassten Sprachdaten.<\/p>\n
Das Datenmaterial von VerbaAlpina erh\u00e4lt historische Tiefe durch die Verklammerung der aus den Quellen gesch\u00f6pften W\u00f6rter durch die Feststellung von Gemeinsamkeiten bez\u00fcglich der lexikalischen Basis. So besitzen franz\u00f6sisch salamandre<\/em>, italienisch salamandra<\/em> und deutsch Salamander<\/em> dieselbe lexikalische Basis. Hier einen historischen Zusammenhang zu vermuten, liegt nahe. Es l\u00e4sst sich jedoch nicht ohne weiteres entscheiden, ob z.B. das deutsche Wort aus einem der beiden romanischen W\u00f6rter hervorgegangen ist (Entlehnungsszenario), oder ob alle drei Varianten unabh\u00e4ngig von einander auf einen gemeinsamen Vorl\u00e4ufer zur\u00fcckzuf\u00fchren sind. Um dennoch erfassen zu k\u00f6nnen, *dass* zwischen den drei genannten W\u00f6rtern ein Zusammenhang besteht, identifiziert VerbaAlpina in solchen F\u00e4llen einen lexikalischen Vorl\u00e4ufer aus einer fr\u00fcheren im Alpenraum verbreiteten Sprache und weist diesen den modernen W\u00f6rtern zu. VerbaAlpina bezeichnet solche Vorl\u00e4ufer als \"Basistypen\". Im Fall des Beispiels w\u00e4re dies das lateinische salamandra<\/em>.<\/p>\n
Der Grund f\u00fcr diese Vereinfachung ist ein doppelter: Zum einen ist vielfach nicht zu entscheiden, welche der genannten Varianten im Einzelfall vorliegt, zum anderen sind entsprechende Recherchen unter Umst\u00e4nden sehr aufwendig, so dass sie im Rahmen des Projekts aus Zeitgr\u00fcnden nicht betrieben werden k\u00f6nnen. Die VA<\/span>-Basistypen haben den gro\u00dfen Vorteil, dass sie offenkundig bestehende Zusammenh\u00e4nge datentechnisch abbilden lassen, *ohne* zur Spezifizierung der Zusammenh\u00e4nge im einzelnen zu zwingen.<\/p>\n
Die zentrale Bezugsgr\u00f6\u00dfe von VerbaAlpina sind die sog.<\/span> \"morpholexikalischen Typen<\/strong>\", im folgenden kurz \"Morphtypen\" genannt. Dabei handelt es sich um lexikalische Einheiten, die bez\u00fcglich ihrer Sprachfamilienzugeh\u00f6rigkeit, ihrer Schreibung, des Genus und der Frage, ob sie eine Affigierung aufweisen oder nicht, distinkt, also unverwechselbar sind. Insofern entsprechen die Morphtypen in etwa den Lemmata der traditionellen W\u00f6rterb\u00fccher. Dabei handelt es sich ganz \u00fcberwiegend um Nomina, Verben spielen bei VerbaAlpina bislang eine untergeordnete Rolle.<\/p>\n
Bei der Typisierung orientiert sich VerbaAlpina zun\u00e4chst an sog.<\/span> Referenzw\u00f6rterb\u00fcchern. Sofern in diesen W\u00f6rterb\u00fcchern ein passender Eintrag vorhanden ist, wird dieser den ausgew\u00e4hlten Tokens zugewiesen. Existiert der Typ in mehreren Referenzlexika, erfolgen Mehrfachzuordnungen. Sollte ein Morphtyp in keinem Referenzlexikon vorhanden sein, erzeugt VerbaAlpina einen eigenen, neuen Morphtypen, der dann zugewiesen wird.<\/p>\n
F\u00fcr die aus Sprachatlanten und W\u00f6rterb\u00fcchern erfassten Daten muss jeweils im Einzelfall entschieden werden, welchen Morphtypen sie repr\u00e4sentieren. Eine automatische Zuweisung erscheint unm\u00f6glich. F\u00fcr die manuelle Typisierung hat VerbaAlpina ein eigenes Tool entwickelt, in dem die transkribierten und anschlie\u00dfend tokenisierten \u00c4u\u00dferungen Morphtypen zugeordnet werden k\u00f6nnen.<\/p>\n
VerbaAlpina verzichtet bewusst auf die Zuweisung der Morphtypen zu Einzelsprachen oder gar Dialekten. Der Grund ist, dass sich Sprachlandschaften und so auch der Alpenraum grunds\u00e4tzlich als Kontinua darstellen, innerhalb derer klare Abgrenzungen praktisch unm\u00f6glich sind. Streng genommen kann jede Ortschaft ihren eigenen Dialekt besitzen. Bei der Definition der Morphtypen erfolgt daher lediglich die Zuweisung zu einer der drei im Alpenraum vorhandenen Sprachfamilien. Die Zuordnung zu einer Sprachfamilie wird dabei von den Quellen vererbt, aus denen die Belege stammen, die dem jeweiligen Morphtypen angeh\u00f6ren.<\/p>\n
Die phonetische Dimension wird von VerbaAlpina weitgehend ausgeblendet, ist im Datenmodell von VerbaAlpina jedoch abbildbar und punktuell im Datenbestand auch schon pr\u00e4sent.<\/p>\n
Die Entwicklung der Sprache im Raum ist stets mehr oder minder stark beeinflusst von einer ganzen Reihe dynamischer Prozesse. Dazu geh\u00f6ren etwa Wanderungsbewegungen, Verdr\u00e4ngungen, Landnahmen, der Wandel von Wirtschaftsformen oder auch der klimatischen Rahmenbedingungen. Aus diesem Grund sammelt VerbaAlpina \u2013 allerdings unsystematisch und selektiv \u2013 auch nicht-sprachliche Daten, die die genannten Ph\u00e4nomene dokumentieren. Als Beispiel k\u00f6nnen Daten zu arch\u00e4ologischen Fundst\u00e4tten der V\u00f6lkerwanderungszeit oder auch die Informationen zu Verkehrswegen und Ortschaften genannt werden, die der Tabula Peutingeriana entnommen werden k\u00f6nnen. Auch die Daten dieser au\u00dfersprachlichen Peripherie m\u00fcssen georeferenzierbar sein. VerbaAlpina bietet den Nutzern die M\u00f6glichkeit, diese Daten in Beziehung zur Verbreitung sprachlicher Ph\u00e4nomene zu setzen und auf diese Weise historische Zusammenh\u00e4nge sichtbar werden zu lassen.<\/p>\n
Technical Aspects<\/h1>\nVA<\/span>-Tools<\/h2>\n
VerbaAlpina setzt nach M\u00f6glichkeit weit verbreitete Standardsoftware ein, die au\u00dferdem open source sein muss. Im Wesentlichen handelt es sich um das Datenbankmanagementsystem (DBMS<\/span>) MySQL zur Verwaltung des zentralen Datenbestands sowie um das PHP-Framework WordPress. F\u00fcr die spezifischen Anforderungen des Projekts wurden jedoch \u00fcberwiegend auf den genannten Basistechnologien aufbauende Tools entwickelt, die allesamt auf Github zur freien Nachnutzung unter der CC-BY-SA-Lizenz verf\u00fcgbar sind (https:\/\/github.com\/VerbaAlpina?tab=repositories<\/a>).<\/p>\n
Der VA<\/span>-Betacode und das VA<\/span>-Tanskriptionstool<\/h3>\n
Betacode<\/h4>\n
F\u00fcr die Transkription von \"exotischen\" Schriftsystemen, wie sie h\u00e4ufig gerade in Sprachatlanten anzutreffen ist, setzt VerbaAlpina ein Verfahren ein, das bereits in den 1970er Jahren f\u00fcr den Thesaurus Linguae Graecae (TLG<\/span>) entwickelt und erfolgreich eingesetzt worden war. Im Kern geht es darum, beliebige Schriftzeichen durch definierte und dokumentierte Sequenzen von ASCII<\/span>-Zeichen zu ersetzen. Die Regeln folgen m\u00f6glichst einfachen und mnemotechnisch g\u00fcnstigen Mustern. So wird z.B. ein Akut auf einem Basiszeichen durch einen Slash hinter dem Basiszeichen transkribiert.<\/p>\n
Die \u00c4u\u00dferung 1<\/a><\/sup><\/p>\n
$\"\"$ <\/p>\n
wird gem\u00e4\u00df den Transkriptionsregeln folgenderma\u00dfen transkribiert:<\/p>\n
la lac\/a\/<\/span><\/p>\n
Dabei spielt der mit einem Zeichen bezeichnete Lautwert keine Rolle. Das bedeutet auch, dass identische Zeichen wie z.B. der Akut vollkommen unabh\u00e4ngig von der transkribierten Vorlage und der m\u00f6glicherweise spezifischen phonetischen Bedeutung stets gleich, n\u00e4mlich mit einem nachgestellten Slash transkribiert wird. Erst ein vorlagenspezifisches Konvertierungsverfahren, bei dem s\u00e4mtliche Transkriptionen in das IPA<\/span>-System \u00fcbertragen werden, ber\u00fccksichtigt die Lautwerte der urspr\u00fcnglichen Quelle.<\/p>\n
Diese Methode besitzt gleich mehrere Vorteile:<\/p>\n
\n
Es ist die Transkription von Zeichen m\u00f6glich, die bislang noch nicht unicode-kodiert sind<\/li>\n
Die Transkription kann bequem mit Standardtastaturen und ohne komplizierte Tastenkombinationen erfolgen<\/li>\n
Die Transkriptoren ben\u00f6tigen keine Kenntnisse \u00fcber die Bedeutung der Zeichen<\/li>\n
Die Transkriptionen sind \u2013 anders als Multi-Byte-Characters von UTF-8 \u2013 technisch robust gegen ungewollte Ver\u00e4nderung<\/li>\n
Die Transkription erfolgt ohne Informationsverlust (was z.B. der Fall w\u00e4re, wenn anstelle des vorliegenden B\u00f6hmer-Ascoli-Systems direkt in IPA<\/span> transkribiert werden w\u00fcrde, da IPA<\/span> keine so feine Unterscheidung hinsichtlich der Einzellaute erlaubt wie B\u00f6hmer-Ascoli)<\/li>\n<\/ul>\n
VA<\/span>-Transkriptionstool<\/h4>\n
Speziell die automatische strukturierte Erfassung von lexikalischem Material aus Sprachatlanten stellt ein erhebliches technisches Problem dar. Dabei geht es nicht um die Verwandlung der, wie wir am Beispiel des AIS gesehen haben, teils exotischen Schriftsysteme, die dort bisweilen Verwendung finden. OCR-Programme wie z.B. Abbyy Finereader lassen sich so trainieren, dass sie auch solche Schriftsysteme korrekt erfassen und sogar den VerbaAlpina-spezifischen Betacode produzieren.<\/p>\n
Im Fall der Sprachatlanten der romanistischen Tradition besteht die eigentliche Schwierigkeit darin, die direkt auf der Karte eingetragenen \u00c4u\u00dferungen jeweils der richtigen Nummer zuzuordnen. Maschinen sind mit dieser Aufgabe immer dann \u00fcberfordert, wenn die Eintragungen auf der Karte zu dicht beieinander liegen, wie dies z.B. im AIS im Bereich der S\u00fcdschweiz und dem angrenzenden Italien der Fall ist. Am Institut f\u00fcr Informatik der LMU<\/span> ist soeben eine Masterarbeit abgeschlossen worden, die eine algorithmische L\u00f6sung f\u00fcr dieses Problem entwerfen sollte. Dabei wurde u.a. mit Deep-Learning-Verfahren gearbeitet. Soweit VerbaAlpina es einsch\u00e4tzen kann, ist aber auch auf diesem Wege kein Erfolg in Sicht. Von einer technischen Verf\u00fcgbarkeit eines entsprechenden Tools kann auf keinen Fall die Rede sein.<\/p>\n
Aus Sicht der automatischen Datenerfassung noch komplizierter erscheinen die im Bereich der Germanistik verbreiteten Sprachatlanten mit Punktsymbolkarten, bei denen bestimmte Merkmalsauspr\u00e4gungen als Symbole auf der Karte dargestellt werden. Anders als bei den romanistischen Atlanten werden hier auch zumeist typisierte Daten abgebildet, konkrete Einzelbelege der Informanten werden nur in Ausnahmef\u00e4llen pr\u00e4sentiert.<\/p>\n
<\/p>
$\"\"$ <\/a>
Punktsymbolkarte germanistischer Tradition (VALTS<\/span> IV 73: Die SENNH\u00dcTTE)<\/p><\/div>Die strukturierte Erfassung der Daten aus diesen Sprachatlanten kann also nur manuell erfolgen. Das Problem dabei besteht dann wiederum darin, dass die konsistente fehlerfreie Datenerfassung ein hohes Ma\u00df an Konzentration und Disziplin erfordert. Zur Erleichterung dieser Arbeit, und um die Fehleranf\u00e4lligkeit zu verringern und au\u00dferdem ein m\u00f6glichst systematisches Vorgehen zu gew\u00e4hrleisten, hat VerbaAlpina ein spezielles Transkriptionstool entwickelt.\n\n
Das Tool integriert einen Scan der zu transkribierenden Karte in das Formular, in das die Transkriptionen eingetragen werden. Bereits transkribierte Karten werden entsprechend farblich markiert, und auch die Doppelerfassung einzelner Eintragungen auf der Karte werden vom System verhindert. Dem Transkriptor werden vom System nacheinander die Nummern oder Siglen der Ortspunkte auf der Karte vorgegeben. Die Transkription erfolgt dann in das daf\u00fcr vorgesehen Feld des Formulars. Die anderen Parameter wie Kartennummer, Ortspunktnummer und Konzeptzuweisung sind vom System jeweils vorgegeben und werden gemeinsam mit der Transkription in der Datenbank abgespeichert. Die Eingabemaske pr\u00e4sentiert in einem Teilfenster rechts oben die allgemeinen Transkriptionsregeln f\u00fcr die Datenerfassung im Betacode, so dass der Transkriptor sie mit m\u00f6glichst geringem Aufwand konsultieren kann.\u00a0Zur Kontrolle f\u00fcr den Transkriptor wird rechts vom Eingabefeld simultan mit der Transkription die Originalschreibweise der Vorlage eingeblendet.<\/p>\n
Crowdsourcingtool<\/h3>\n
Der von VerbaAlpina aus Sprachatlanten und W\u00f6rterb\u00fcchern zusammengetragene Datenbestand weist in mehrfacher Hinsicht Inkonsistenzen auf. Diese ergeben sich z.B. dadurch, dass die Sprachatlanten, die jeweils nur einen Teil des Alpenraums abdecken, nicht alle dieselben Konzepte dokumentieren, wie dies die folgende Abbildung ersichtlich macht:<\/p>\n
[Screenshot]<\/p>\n
In der Folge liegen also f\u00fcr eine bestimmte Region Bezeichnungen f\u00fcr Konzepte vor, die an anderer Stelle gar nicht abgefragt wurden \u2013 was nicht hei\u00dft, dass diese dort nicht existieren.<\/p>\n
Die Durchf\u00fchrung von Nacherhebungen vor Ort ist nicht durchf\u00fchrbar. Daher setzt VerbaAlpina die Idee des Crowdsourcings ein, um den Datenbestand zu arrondieren. Die Idee ist, dass User im Internet bislang nicht dokumentierte Bezeichnungen f\u00fcr ausgew\u00e4hlte Konzepte beisteuern. Zu diesem Zweck hat VerbaAlpina ein spezielles Crowdsourcing-Tool (CS-Tool) entwickelt. Die Funktionalit\u00e4t ist bewusst simpel gehalten, um potentielle \"Crowder\" nicht abzuschrecken.<\/p>\n
Jeder \"Crowder\" wird zu Beginn gefragt, welchem Dialekt seine Beitr\u00e4ge zuzuordnen sind. Anschlie\u00dfend muss er auf einer Karte einen Ort ausw\u00e4hlen und gibt dann nach seiner Meinung an diesem Ort gebr\u00e4uchliche Bezeichnungen f\u00fcr ausgew\u00e4hlte Konzepte ein. Das auf diese Weise gesammelte Material wird von VerbaAlpina ebenso typisiert wie die Daten aus Atlanten und Lexica. Eine Validierung des Crowd-Materials ist rein theoretisch durch das Prinzip der Fremdbest\u00e4tigung m\u00f6glich (Motto: Einmal ist kein Mal, zweimal ist immer), wird aktuell von VerbaAlpina aber nicht durchgef\u00fchrt, nicht zuletzt, weil die Datenmenge bislang noch zu gering ist.<\/p>\n
Die Erfahrung der vergangenen Jahre hat gezeigt, dass die Vitalit\u00e4t des Croudsourcing-Tools, also die Menge der Eintragungen, ganz entscheidend von entsprechenden Werbeaktivit\u00e4ten abh\u00e4ngt. Nach Medien-Berichten \u00fcber VerbaAlpina und sein Crowdsourcing-Tool oder entsprechende Propaganda in den sozialen Medien, steigen die Eintragungen jeweils stark an, sinken jedoch bald wieder ab.<\/p>\n
Auch das CS-Tool kann unter der CC-BY-SA-Lizenz nachgenutzt werden.<\/p>\n
Kartentool<\/h3>\n
Gleichsam das Schaufenster des Projekts bildet die interaktive Online-Karte. Sie ist als der zentrale Datenzugriffspunkt f\u00fcr die \u00d6ffentlichkeit konzipiert, der die Abbildung der Sprachdaten in der Dimension des Raums erm\u00f6glicht und somit Zusammenh\u00e4nge offenbaren kann, die bei Betrachtung der Daten in Tabellen- oder Listenform h\u00e4ufig verborgen bleiben.<\/p>\n
Die digitale Karte bietet sowohl die M\u00f6glichkeit, auf den Datenbestand aus der Perspektive der W\u00f6rter zuzugreifen, also sich die verschiedenen Konzepte kartieren zu lassen, die mit einem bestimmten Wort bezeichnet werden k\u00f6nnen, wie auch die Option, die umgekehrte Frage zu stellen: Welche Konzepte werden wo mit welchen W\u00f6rtern bezeichnet. Im traditionellen Publikationswesen konnten diese beiden Perspektiven nur durch zwei unterschiedliche Genera bedient werden: Den Sprachatlas und das W\u00f6rterbuch. Die digitale Online-Karte bietet sogar die M\u00f6glichkeit, beide Perspektiven synoptisch zu kartieren.<\/p>\n
Die Karte bietet im wesentlichen zwei unterschiedliche Formen der Visualisierung an. Standard ist die qualitative Kartierung, bei der die Einzeldaten geb\u00fcndelt nach politischen Gemeinden zun\u00e4chst durch Symbole auf der Karte abgebildet werden. Das nachfolgende Beispiel zeigt die Kartierung der Verbreitung des romanischen Worttyps malga<\/em>, gruppiert nach dessen regional unterschiedlichen Bedeutungen:<\/p>\n
https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=191&tk=2414<\/a><\/p>\n
Ein Klick auf die Kartensymbole \u00f6ffnet ein Info-Window, in dem die zugrundeliegenden Sprachdaten pr\u00e4sentiert werden. Neben der Quelle werden auch das mit dem Wort bezeichnete Konzept, der Basistyp sowie der Einzelbeleg der jeweiligen Quelle in IPA<\/span>-Transkription angezeigt. Die umrahmten Buchstaben hinter Morph- und Basistypen verweisen auf die entsprechenden Eintr\u00e4ge in den Referenzw\u00f6rterb\u00fcchern und sind z.T. interaktiv; ein Klick auf das Symbol f\u00fchrt dann direkt zum entsprechenden Eintrag im Referenzw\u00f6rterbuch. In das Info-Window sind au\u00dferdem Normdaten eingebunden und entsprechend verlinkt. So f\u00fchrt ein Klick auf das Erdkugelsymbol neben oder unter dem Gemeindenamen auf die entsprechende Seite von Geonames, die Konzeptnamen sind mit den Eintr\u00e4gen bei Wikidata verkn\u00fcpft.<\/p>\n
Neben der qualitativen Kartierung bietet VerbaAlpina auch eine quantifizierende Darstellung an. Ein Klick auf das Q im Kreis neben dem Men\u00fcpunkt \"Fl\u00e4chen und Regionen\" kumuliert die im Moment kartierten Elemente nach Regionen und f\u00e4rbt diese entsprechend der Anzahl der dort kartierten Elemente unterschiedlich ein. In der Grundeinstellung bilden die gro\u00dfr\u00e4umigen Sprachgebiete den Referenzrahmen. Durch entsprechende Auswahl \u00fcber den Men\u00fcpunkt \"Fl\u00e4chen und Regionen\" kann die Kumulierung und Kartierung der Daten auch auf Basis kleinerer administrativer Einheiten erfolgen.<\/p>\n
Neben der realit\u00e4tstreuen Abbildung der geographischen Grenzverl\u00e4ufe kann die quantifizierende Darstellung auch auf der Grundlage einer Hexagonkarte erfolgen. Bei dieser Art der Kartendarstellung werden die geographischen Einheiten durch Hexagone mit jeweils identischer Gr\u00f6\u00dfe dargestellt. Dadurch werden visuelle Verzerrungseffekte vermieden, die sich durch die in der Realit\u00e4t stark von einander unterscheidenden Fl\u00e4chengr\u00f6\u00dfen ergeben. Nat\u00fcrlich ergibt sich bei dieser Art der Kartierung wiederum der Nachteil, dass die geographische Anordnung der Fl\u00e4chen und vor allem die Anzahl angrenzender Fl\u00e4chen in den meisten F\u00e4llen nicht mehr der Realit\u00e4t entspricht. Der Mehrwert besteht sicherlich in der M\u00f6glichkeit, zwischen den verschiedenen Kartierungsvarianten wechseln zu k\u00f6nnen und auf diese Weise einen ann\u00e4hernd objektiven Eindruck gewinnen zu k\u00f6nnen.<\/p>\n
Das Teilensymbol am rechten oberen Rand der Karte erlaubt den Abruf eines persistenten Links, der stabil auf die aktuelle Kartenansicht verweist und z.B. \u00fcber Mails versandt oder in Texte eingesetzt werden kann. Au\u00dferdem k\u00f6nnen ganz bestimmte Kartenansichten mit einer spezifischen Art und Anzahl von ausgew\u00e4hlten Daten als synoptische Karten unter einem frei w\u00e4hlbaren Namen gespeichert und mit einem ausf\u00fchrlichen Kommentar versehen werden. Anschlie\u00dfend erscheinen diese Karten im Men\u00fc \"synoptische Karte\". Allerdings ist diese Funktion registrierten Benutzern vorbehalten.<\/p>\n
Die Realisierung der Online-Karte basiert auf modernster Graphiktechnologie (WebGL) und ist extrem leistungsf\u00e4hig. Sichtbar wird diese Leistungsf\u00e4higkeit vor allem bei Zoom-Vorg\u00e4ngen mit einer gro\u00dfen Anzahl von Kartensymbolen und Grenzverl\u00e4ufen, die dem Computer eine hohe Rechenleistung abverlangen. Der Einsatz von WebGL erlaubt die erforderlichen Berechnungen auf dem Prozessor der Graphikkarte, was den entscheidenden Leistungsgewinn mit sich bringt.<\/p>\n
Vernetzung und Nachhaltigkeit<\/h3>\n
Zugriffsm\u00f6glichkeiten von au\u00dferhalb<\/h4>\n
Der Zugriff auf die Daten von VerbaAlpina ist auf verschiedene Weise m\u00f6glich:<\/p>\n
\n
\u00dcber das im Internet frei zug\u00e4ngliche Projektportal und dort vor allem \u00fcber die interaktive Online-Karte und das Lexicon alpinum<\/li>\n
\u00dcber die, ebenfalls frei zug\u00e4ngliche, API<\/li>\n
\u00dcber die PMA-Schnittstelle der MySQL-Datenbank<\/li>\n<\/ul>\n
Die API erlaubt den Download des sprachlichen Kernmaterials in einer Reihe unterschiedlicher Formate und in unterschiedlicher Aggregierung. Der Zugriff \u00fcber die PMA-Schnittstelle ist den offiziellen Kooperationspartnern von VerbaAlpina vorbehalten. Die PMA-Schnittstelle erlaubt Datenanalysen unter Einsatz der Sprache SQL<\/span>.<\/p>\n
Der Kerndatenbestand von VerbaAlpina ist sehr fein granuliert und die Einzelelemente sind mit persistenten Identifikatoren eindeutig identifiziert und somit pr\u00e4zise ansprechbar. Letztlich erf\u00fcllen diese alphanumerischen Identifikatoren die Funktion von VerbaAlpina-spezifischen Normdaten. Konkret erhalten unter anderem alle Morphtypen, Konzepte und politischen Gemeinden eine eindeutige Nummer, unter deren Verwendung dann auf unterschiedlichen Wegen auf die spezifischen Daten zugegriffen werden bzw. von externer Seite darauf referenziert werden kann. Identifikatoren der Morphtypen tragen das Pr\u00e4fix L, Konzepte C und Gemeinden A. Die ID<\/span> L1435 steht beispielsweise f\u00fcr den Morphtypen \"babeurre (m.<\/span>) (roa.<\/span>)\". Die Adresse db=191&single=L1435\" target=\"_BLANK\">https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=133&db=191<\/span><\/strong>&single=L1435<\/a> ruft sodann eine Kartierung der Verbreitung dieses Morphtyps auf, der Link version=191&format=xml&empty=0\" target=\"_BLANK\">https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?api=1&action=getRecord&id=L1435&version=191<\/span><\/strong>&format=xml&empty=0<\/a> f\u00fchrt zum Download der zu diesem Morphtyp gespeicherten Daten im XML-Format und der Link db=191#L1435\" target=\"_BLANK\">https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=2374&db=191<\/span><\/strong>#L1435<\/a> schlie\u00dflich auf den Kommentar im Lexicon Alpinum (sofern vorhanden).<\/p>\n
Mit wenigen Ausnahmen enthalten alle URLs, die sich auf Inhalte von VerbaAlpina beziehen, einen \u2013 in den Beispielen von gerade eben rot<\/span> markierten \u2013 Parameter, der sich auf eine ganz bestimmte Version von VerbaAlpina bezieht. Die beiden ersten Ziffern stehen jeweils f\u00fcr das Jahr, die letzte f\u00fcr Versionsnummer im Jahr (191: Erste Version im Jahr 2019). W\u00e4hrend der Datenbestand der Arbeitsversion, die an der Zeichenfolge xxx erkennbar ist, permanenten \u00c4nderungen unterliegt, sind die Inhalte der anderen Versionen jeweils stabil. Dadurch ist sichergestellt, dass Verweise auf diese URLs stets dieselben Inhalte aufrufen und Zitationssicherheit gew\u00e4hrleistet ist. Die Versionierung der VerbaAlpina-Daten erfolgt zweimal im Jahr, jeweils zu Jahresmitte und zu Jahresende. Auf der Homepage ist die Auswahl zwischen den vorhandenen Versionen m\u00f6glich. F\u00fcr alle Inhalte von VerbaAlpina sind auch DOIs verf\u00fcgbar.2<\/a><\/sup><\/p>\n
Demn\u00e4chst werden die VerbaAlpina-Daten auch in das RDF-Schema des Semantic Web \u00fcbertragen. Die Einrichtung eines SPARQL-Endpoints ist jedoch zun\u00e4chst nicht vorgesehen; die entsprechende Umsetzung ist mit einigem Aufwand verbunden und erscheint entbehrlich, da es eine Reihe anderer Zugriffsm\u00f6glichkeiten auf die VerbaAlpina-Daten gibt. Immerhin erf\u00fcllt VerbaAlpina die Kriterien der \"Linguistic linked open data\"-Bewegung (LLOD; http:\/\/linguistic-lod.org\/<\/a>).3<\/a><\/sup>, und die VerbaAlpina-Daten werden bald auch in die LLOD-Cloud eingebunden sein.4<\/a><\/sup><\/p>\n
Verkn\u00fcpfung mit externen Ressourcen<\/h4>\n
VerbaAlpina verkn\u00fcpft die drei Kernkategorien seines Datenbestands \u00fcber die Einbindung geeigneter Normdaten mit externen Datenbest\u00e4nden.<\/p>\n
Im Fall der Morphtypen werden entsprechende Verbindungen zu den Referenzlexika hergestellt. Ein interessanter Nebeneffekt ist, dass dabei die unterschiedliche Eignung der entsprechenden Ressourcen deutlich wird. Im Sinne maximaler Interoperabilit\u00e4t sind bislang die Inhalte nur weniger der von VerbaAlpina erfassten Referenzw\u00f6rterb\u00fccher adressierbar. Positive Beispiele w\u00e4ren etwa das Portal des\u00a0Centre National de Ressources Textuelles et Lexicales ([Bibl:CNRTL]) oder die italienische Treccani, die jeweils transparente URLs f\u00fcr jeden lexikalischen Eintrag anbieten (z.B.:\u00a0 https:\/\/www.cnrtl.fr\/definition\/beurre<\/a>, http:\/\/www.treccani.it\/vocabolario\/burro\/<\/a>). In manch anderen F\u00e4llen sind Referenzierungen entweder nur mit gro\u00dfer Ungenauigkeit oder auch gar nicht m\u00f6glich. Nicht selten begegnet man dem Ph\u00e4nomen, dass sich die Adressierbarkeit der Inhalte noch an der herk\u00f6mmlichen Seitenlogik des Buchdrucks und auf PDF-Dokumente oder Bilddateien bezieht. Dies ist etwa der Fall beim Franz\u00f6sischen etymologischen W\u00f6rterbuch, urspr\u00fcnglich von Walter Warburg (FEW<\/span>).<\/p>\n
F\u00fcr die Konzepte verweist VerbaAlpina bislang ausschlie\u00dflich auf die sog.<\/span> Wikidata-Datenobjekte. Jedem Konzept ist in der VerbaAlpina-Datenbank die jeweilige Q-ID<\/span> der Wikidata zugeordnet. Der entsprechende Link f\u00fchrt auf die Datenobjektseite bei Wikidata. Dort wiederum befinden sich Links zu den Artikeln in den verschiedensprachigen Wikipedien zu diesem Konzept. Bereits erw\u00e4hnt wurde die Verkn\u00fcpfung mit den Normdaten von geonames. Links f\u00fcr alle Normdaten der genannten Kategorien werden dem Nutzer in den Info-Windows auf der Online-Karte pr\u00e4sentiert.<\/p>\n
Some organizational stuff<\/h1>\n
VerbaAlpina started in 2014 and is funded by the German Research Foundation (DFG) with a perspective until 2025. The individual project terms comprise 3 years each. At the moment we are heading towards the last year of the second term and are about to prepare the application for the funding of the third term.<\/p>\n
Der Mitarbeiterstab ist zweigeteilt: Es gibt drei Sprachwissenschaftler und zwei Informatiker, die jeweils noch von Hilfskr\u00e4ften unterst\u00fctzt werden. Unter den Sprachwissenschaftlern befinden sich zwei Romanisten und ein Germanist, von den Informatikern ist einer haupts\u00e4chlich f\u00fcr alle Belange der Kerndaten zust\u00e4ndig (Datenmodellierung, Schnittstellen, u.a. API), der andere \u00fcberwiegend f\u00fcr alle Fragen der Visualisierung, haupts\u00e4chlich die interaktive Online-Karte.<\/p>\n
VerbaAlpina stellt somit ein interdisziplin\u00e4res DH-Unternehmen mit Anteilen in den klassischen Geisteswissenschaften und in der Informatik dar. Der informatische Teil ist an der IT-Gruppe Geisteswissenschaften (ITG<\/span>) angesiedelt. Diese Einrichtung besteht seit dem Jahr 2000, wird getragen von den sechs geisteswissenschaftlichen Fakult\u00e4ten der LMU<\/span> und besitzt eine unbefristete Existenzperspektive. Die ITG<\/span> ist zust\u00e4ndig f\u00fcr Planung und Betrieb der IT-Infrastruktur im Bereich der Humanities. Einen stetig wachsenden Aufgabenbereich der ITG<\/span> stellt die Unterst\u00fctzung bei Planung und Durchf\u00fchrung von DH-Projekten dar. VerbaAlpina stellt aus Sicht der ITG<\/span> also nur eines von zahlreichen Projekten dar, dessen Projektdaten im Kontext eines heterogenen, jedoch einheitlich \u2013 n\u00e4mlich relational \u2013 strukturierten Gesamtdatenbestand verwaltet werden. Dieser im Lauf der Jahre auf beachtliche Gr\u00f6\u00dfe und Vielfalt angewachsene Datenpool bietet zumindest theoretisch die Perspektive der Datenanalyse \u00fcber Projektgrenzen hinweg. Vor diesem Hintergrund entwickelt sich zur Zeit eine Kooperation der ITG<\/span> mit dem Master-Studiengang Data Science, der Anfang 2017 ins Leben gerufen wurde.<\/p>\n
Die ITG<\/span> spielt auch im Hinblick auf die Nachhaltigkeit der von VerbaAlpina erarbeiteten Ergebnisse eine wichtige Rolle. Nach dem Ende der Projektf\u00f6rderung wird die ITG<\/span> das Projektportal im Rahmen ihrer M\u00f6glichkeiten weiter betreiben und das f\u00fcr den Betrieb erforderliche Minimum an Wartungsarbeit leisten.<\/p>\n
\n
* Given at the colloqium\u00a0\u201e NEW WAYS OF ANALYZING DIALECTAL VARIATION<\/a>\u201c, held at Sorbonne University, Paris, 21-23 November 2019<\/p>\n
AIS 1218_1, 129 ↩<\/a><\/p><\/li>
Fragezeichen und\u00a0Ampersands (&) m\u00fcssen dabei durch den jeweiligen Hexadezimalwert des Zeichens in der Unicode-Tabelle (? = 3f<\/span><\/strong>, & = 26<\/strong><\/span>) mit vorangestelltem % ersetzt werden. Die DOI<\/span> der URL<\/span>\u00a0https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?<\/span><\/strong>page_id=133&<\/span><\/strong>db=191&<\/span><\/strong>single=L1435<\/a> liest sich wie folgt: https:\/\/dx.doi.org\/10.5282\/verba-alpina?urlappend=\/%3f<\/span><\/strong>page_id=133%26<\/span><\/strong>db=191%26<\/span><\/strong>single=L1435<\/a> ↩<\/a><\/p><\/li>
S.<\/span> Chiarcos, Christian; McCrae, John; Cimiano, Philipp; Fellbaum, Christiane (2013). Towards open data for linguistics: Lexical Linked Data (PDF<\/a>). Heidelberg, in: Alessandro Oltramari, Piek Vossen, Lu Qin, and Eduard Hovy (Hrsgg.), New Trends of Research in Ontologies and Lexical Resources. Springer. ↩<\/a><\/p><\/li>
Die Erzeugung der RDF-Struktur wird derzeit vorbereitet. Die Registrierung erfolgt anschlie\u00dfend unter der Adresse https:\/\/lod-cloud.net\/add-dataset<\/a> ↩<\/a><\/p><\/li><\/ol>
Bibliographie<\/h3>
FEW<\/b> = Wartburg, Walter (1922-1967): Franz\u00f6sisches etymologisches W\u00f6rterbuch. Eine Darstellung des galloromanischen Sprachschatzes , Basel, vol. 20, Zbinden. Link<\/a><\/li>
VALTS<\/b> = Gabriel, Eugen (1985-2004): Vorarlberger Sprachatlas mit Einschluss des F\u00fcrstentums Liechtenstein, Westtirols und des Allg\u00e4us , vol. 1-5, Bregenz, vol. 1-5, Vorarlberger Landesbibliothek<\/li><\/ul>Wartburg, Walter (1922-1967): Franz\u00f6sisches etymologisches W\u00f6rterbuch. Eine Darstellung des galloromanischen Sprachschatzes , Basel, vol. 20, Zbinden\n

\n Link<\/a><\/div>
Gabriel, Eugen (1985-2004): Vorarlberger Sprachatlas mit Einschluss des F\u00fcrstentums Liechtenstein, Westtirols und des Allg\u00e4us , vol. 1-5, Bregenz, vol. 1-5, Vorarlberger Landesbibliothek<\/div>
VerbaAlpina<\/div>
Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div>
sogenannt<\/div>
Datenbankmanagementsystem<\/div>
Thesaurus Linguae Graecae<\/div>
American Standard Code for Information Interchange<\/div>
International Phonetic Alphabet<\/div>
structured query language<\/div>
Identifikationsnummer<\/div>
Maskulinum<\/div>
Romanisch (ISO 639-5)<\/div>
IT-Gruppe Geisteswissenschaften (LMU<\/span> Center for Digital Humanities)
Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div><\/div>
Digital Object Identifier<\/div>
Uniform Resource Locator<\/div>
Seite<\/div>","protected":false},"excerpt":{"rendered":"
Abstract Since 2014 the DFG-funded long term project VerbaAlpina (VA) is run at the Ludwig-Maximilians-University of Munich (LMU). VA is a cooperation of the Institute of Romance Studies and the LMU Center for Digital Humanities (DH; IT-Gruppe Geisteswissenschaften). The project focuses on lexical variation throughout the Alpine area as defined by the so-called Alpine Convention […]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"btdb_keywords":[],"coauthors":[],"class_list":["post-10522","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/10522","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=10522"}],"version-history":[{"count":52,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/10522\/revisions"}],"predecessor-version":[{"id":10716,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/10522\/revisions\/10716"}],"wp:attachment":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=10522"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=10522"},{"taxonomy":"btdb_keywords","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fbtdb_keywords&post=10522"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcoauthors&post=10522"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}