VerbaAlpina – interlinguale Geolinguistik und Digital Humanities


Thomas Krefeld

Dieser Beitrag wurde anlässlich eines Vortrags an der Alpen-Adria-Universität Klagenfurt redigiert; es handelt sich um eine modifizierte und aktualisierte Fassung von Krefeld 2018a;  alles ist vor dem Hintergrund von Stephan Lückes eher informationstechnisch  ausgerichteten Ausführungen zu sehen. Für die Einladung danke ich Luca Melchior.

1. Die Sprachwissenschaft auf dem Weg in die digital humanities

Seit ca. 15 Jahren, d.h. seit der zügigen Durchsetzung interaktiver und kollaborativer Strukturen im Internet Web 2.0  durchlaufen zahlreiche wissenschaftliche Disziplinen einen Prozess tiefgreifenden Wandels, denn im Gefolge der medialen Revolution haben sich die Rahmenbedingungen der Wissenschaftskommunikation im Web substantiell verändert; symptomatisch ist  die oben auf dieser Seite angebrachte Einladung Schreibe eine Antwort. In den Disziplinen, die sich mit kulturellen Techniken und ihrer geschichtlichen Entwicklung befassen, kann dieser Wandel mit dem Schlagwort der digital humanities identifiziert werden. Es ist dennoch nicht überraschend, dass die Wissenschaftler unterschiedlich auf diese Situation reagieren, nämlich teils mit

  • offensiver Ablehnung (Motto: „Das bedeutet den Ausverkauf der akademischen Fächer“),
  • nonchalanter Indifferenz (Motto: „Der kindische Unfug lässt mich kalt“),
  • konstruktiver Akzeptanz (Motto: „Endlich wird möglich, was ich immer schon wollte“).

Nicht im Sinn eines missionarischen Eifers, sondern aus rein forschungspraktischer Überzeugung sei festgestellt, dass für datenorientierte Disziplinen, wie zum Beispiel für diejenigen Bereiche der Sprachwissenschaft, die sich mit Variation und historischen Prozessen befassen, eigentlich nurmehr die dritte Haltung in Frage kommt. Wenn man die mediale Herausforderung jedoch in diesem Sinn annimmt, ändert sich methodologisch fast Alles.

2. Geolinguistik

Die Geolinguistik1 ist in geradezu idealer Weise geeignet, um die Notwendigkeit des skizzierten Transfers zu illustrieren. Zunächst ist diese Subdisziplin von Anfang an mit dem Anspruch entstanden, gesprochene Sprache zu dokumentieren; sie stand, mit anderen Worten, zu Beginn nicht in der text- und editionsorientierten Tradition der Philologie (vgl. Krefeld 2007).  Ausserdem entwickelte sich die Geolinguistik vor allem dank der teils monumentalen Sprachatlanten  zu einer Art Korpuslinguistik avant la lettre. Der AIS2, den man als den gattungsprägenden romanischen Vertreter der Tradition ansehen darf, versammelt in 1681 Karten, 20 Konjugationstabellen und zahlreichen ergänzenden Listen Belege aus 416 Aufnahmeorten (vgl. die Beschreibung in Krefeld 2017c); das entspricht mindestens einer Million Tokens. Immerhin wurde das gesamte Material 20 Jahre später Jahre durch einen gedruckten Index aufgeschlüsselt (vgl. Jaberg/Jud 1960), der sich selbst als Ein propädeutisches etymologisches Wörterbuch der italienischen Mundarten bezeichnet.3 Auf geradezu selbstverständliche Art wurden daher Autoren von Sprachatlanten zu Pionieren der sprachwissenschaftlichen Digitalisierung (vgl. dazu Hans Goebls Bemerkungen in Goebl 2018). Insgesamt ist der Alpenraum recht gut durch Sprachatlanten erschlossen, wie eine Karte aller Informanten im Überblick zeigt. 

Das zweite Forschungsinstrument der traditionellen Geolinguistik, das in repräsentativen Fällen ebenfalls monumentale Ausmaße annimmt,  ist das Wörterbuch; seine herausragenden Vertreter operieren ebenfalls in der Logik von Atlanten, d.h. auf der Basis eines mehr oder weniger engmaschigen Netzes von Aufnahmeorten. So sind u.a. die exhaustiv intendierten Lexika der Schweizer Landessprachen (vgl. DRG, GPSRIdiotikonVSI) und das Wörterbuch der bairischen Mundarten in Oesterreich WBOE angelegt (vgl. die Kartierung der Ortsnetze dieser alpinen Dialektwörterbücher in der Darstellung durch VerbaAlpina). Vor dem Hintergrund der digital humanities erscheint es nun nicht nur realistisch sondern geradezu geboten, diese unterschiedlichen Datenquellen zusammenzuführen und in ein Gesamtkorpus zu verwandeln. Diesen Versuch unternimmt in onomasiologisch definierten Ausschnitten des Wortschatzes das Projekt VerbaAlpina, das als virtuelle, webbasierte Forschungsumgebung beschrieben werden kann.

3. VerbaAlpina als Beispiel einer Forschungsumgebung

Genauer gesagt ist die Korpuserstellung Gegenstand eines als ‘Dokumentation’ bezeichneteten Funktionsbereichs, der in enger Verflechtung mit vier anderen Funktionalitäten zu sehen ist:

  • Dokumentation,
  • Publikation,
  • Kooperation,
  • Datenerhebung durch Crowdsourcing,
  • Forschungslaboratorium.

Alle genannten Bereiche sollen im Folgenden projektbezogen konkretisiert werden. Zum Verständnis ist jedoch vorab eine Skizze des erforschten Raums erforderlich.

3.1. Das Untersuchungsgebiet

Das Projekt VerbaAlpina, das der Verfasser dieses Beitrags gemeinsam mit Stephan Lücke von der ITG der LMU leitet, wird seit 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Gegenstand ist die Mehrsprachigkeit des Alpenraums4, in dem sich die drei großen europäischen Sprachfamilien, Germanisch, Romanisch und Slawisch getroffen haben und seit ca. 1500 Jahren neben-, mit- und unter Umständen auch gegeneinander existieren (vgl. Karte).

Die Sprachverhältnisse sind erheblich komplizierter als die Rede von den drei ‚Familien‘ sowie die suggestive Flächigkeit ihrer kartographischen Darstellung andeutet, denn dazu gehören im Romanischen eine ganze Reihe von staatlich implementierten Sprachen mit jeweils sehr verschiedenen Dialekten; im Germanischen und Slawischen gibt es zwar jeweils nur eine Sprache (Deutsch und Slowenisch); beide sind jedoch ebenfalls durch ganz unterschiedliche, lokale Dialekte, genauer gesagt: durch Dialektkontinua5 vertreten.

Es im Hinblick auf das zugrunde liegende Verständnis des sprachlichen Raums wichtig, darauf hinzuweisen, dass ausschließlich georeferenzierbare Daten berücksichtigt werden; Bezugsgröße für die empirischen Belege ist in Regel die politische Gemeinde, gelegentlich ist es sinnvoll oder erforderlich auf kleinere Einheiten zu referenzieren6, niemals jedoch auf größere Gebiete. Die Dokumentation zielt nicht auf vermeintliche Dialekträume (Puter |  Lombardisch | Venezianisch | Ladinisch etc.) und ihre mutmaßlichen Grenzen; vielmehr werden bottom up Verbreitungsgebiete lokal belegter Varianten abgebildet, die nicht selten über die Grenzen der Sprachen und Sprachfamilien hinausreichen. In diesem Sinn steht der Projektname VerbaAlpina in der Tradition des Konzepts der Alpenwörter (vgl. die klassischen Arbeiten von Jud 1911aJud 1911b, Jud 1924, Stampa 1937, Hubschmid 1950 und Hubschmid 1951). In synchroner Perspektive lässt sich die Vorgehensweise als eine übereinzelsprachliche oder interlinguale Geolinguistik fassen.

In diachroner Perspektive setzen Alpenwörter, die per definitionem in mehr als einer Sprachfamilie verbreitet sind, notwendigerweise Entlehnungsprozesse voraus. Der Entlehnungsweg ist dabei keineswegs immer eindeutig; er kann auch indirekt sein, etwa wenn ein ursprünglich lat.-romanischer Typ nicht direkt ins Slowenische gelangt ist, sondern den Umweg über das Deutsche genommen hat. Es ist daher Aufgabe der Wortgeschichte, die Entlehnungswege in der sprachlichen Stratigraphie des Alpenraums zu verorten, die sich so schematisieren lässt: Konstitutiv sind die Romanisierung des gesamten Gebiets (seit 15 vor Chr.) und seine nachfolgende teilweise Germanisierung und Slawisierung. Damit ist zwar stets eine  eine areale Verdrängung der jeweils früheren Sprachen verbunden, insofern das Lateinisch-Romanische  die vorrömischen Sprachen verdrängt und  seinerseits in manchen Gebieten durch das Germanische und Slawische verdrängt wird. Aber der Verdrängung geht eine mehr oder weniger lang andauernde lokale Zweisprachigkeit voraus (in der Graphik durch die Punkte symbolisiert), die sich in Entlehnungen aus den verdrängten in die verdrängenden Sprachen niederschlägt, so dass sich die erwähnten sprachgrenzüberschreitenden Verbreitungsgebiete ergeben.

AKTUELLE ALPINE
SPRACHAREALE
romanisches
STRATUM
germanisches
STRATUM
slaw.
STRATUM  ●●●
●●● deu. SUPERSTRAT ●●●
●●● ●●● SUBSTR. ●●●
germ. SUPERSTRAT ●●● SUBSTRAT
SPÄTANTIKE
SPRACHAREALE
 Lat.-romanisches STRATUM ●●●
vorrömische SUBSTRATE 
rot=vorrömisch, grau=lat.-romanisch, blau=germanisch, gelb=slawisch
Sprachliche Stratigraphie des Alpenraums

Ausgehend von den Sprachfamilien lasen sich die direkten Kontaktszenarien wie folgt typisieren:

Alpenwörter: diachrone Typologie der Stratigraphie
Herkunft des Basistyps stratigraphischer Bezug aktuelle Sprachfamile
vorrömisch – Substrat – → romanisch
romanisch – Substrat, Adstrat – → germanisch
→ slawisch
germanisch – Superstrat, Adstrat – → romanisch
→ slawisch
slawisch – Adstrat – → romanisch
– Substrat, Adstrat – → germanisch

Exemplarische wortgeschichtliche Beispiele aus unterschiedlichen Konstellationen finden sich hier.

Es ist nun aber von vornherein klar, dass die Dokumentation eines so komplexen Sprachraums mit der skizzierten historischen Tiefe durch das Medium des gedruckten Buchs kaum, wenn überhaupt, zu leisten ist. Ein Zugriff im Sinne der digital humanities drängt sich deshalb schon rein sachlich auf.7

3.2. Funktionsbereich Dokumentation

Die Dokumentation erfasst unabhängig von der Quellengattung und ganz im Sinne der klassischen Dialektologie, ausschließlich georeferenzierbares oder bereits georeferenziertes Material; es werden also Atlas– und (wenngleich weniger) Wörterbuchdaten aufgenommen. Einen maximalen Überblick über die einschlägigen Erhebungsorte (Stand 2018) zeigt diese Karte. Praktisch alle Belege sind über das Erhebungsdatum im Übrigen auch chronoreferenziert8; allerdings ist die Chronoreferenzierung derzeit (März 2019) noch nicht interaktiv implementiert.

Eine weitere, informationstechnisch grundlegende Bedingung des Transfers ist die Strukturierung der Daten. Materialien aus älteren Quellen werden in der Regel erst von VA im Zuge der Retrodigitalisierung, also mit  ihrer Umwandlung in Daten,  strukturiert; strenggenommen wird Retrodigitalisierung überhaupt erst dann wirklich sinnvoll, da sie nur so eine digitale Nachnutzung analogen Materials  gestattet.

Die grundlegende Herausforderung besteht darin die unterschiedlichen semiotischen Dimensionen der Quellen zu sezieren. Das ist insbesondere im Fall der Sprachatlanten nicht immer leicht, denn eine analoge Karte, wie z.B. AIS 1192a LA CASCINA DI MONTAGNA, informiert über Sprache, außersprachliche Konzepte/Kategorien und singuläre Dinge, ohne dass der Status einer Information immer ganz eindeutig wäre. So finden sich in VA (Stand vom 1.4.2019) 1270 dialektale Bezeichnungen (Tokens) des Konzepts ALMHÜTTE; sehr häufig wird die Art des Gebäudes spezifiziert, so dass etliche Unterkonzepte unterschieden werden müssen. Beispielsweise haben die Informanten des VALTS in drei Orten darauf hingewiesen, dass die Bezeichnungen des Typs Tieje/Teie(n) eine PRIMITIVE SENNHÜTTE AUF MAIENSÄSSEN bezeichnen. In anderen Orten steht derselbe Typ für andere Unterkonzepte bzw. für das taxonomisch übergeordnete, alllgemeine Konzept HÜTTE. Ob sich die Spezifizierungen jedoch wirklich auf die Wortsemantik, bzw. eine feste konzeptuelle Kategorie oder womöglich auf die Qualität eines bestimmten Referenten bezieht, die der individuelle Informant mit dem Wort assoziiert, ist unklar. Das Problem wird ganz evident, wenn singuläre außersprachliche Realitäten detailliert abgebildet werden, wie im Fall der folgenden Grundrisse einer Sennhütte aus dem engadinischen Zernez (AIS, P 19):

AIS 1192a

Handelt es sich hier um einen weit verbreiteten Bautyp im Sinne einer außersprachlichen Kategorie oder um einen idiosynkratischen Fall?

Schließlich liefern manche Quellen auch Informationen über ihre Informanten. Grundsätzlich sind bestimmte Charakteristika für die richtige Beurteilung der sprachlichen Belege wichtig; dazu zählen vor allem die Sprachkompetenz (Standard, evtuelle Kontaktsprachen), das Alter und das Mobilitätsprofil (vgl. die Fallbeispiele in Krefeld 2018). Auch in dieser Hinsicht war bereits der AIS wegweisend, denn er teilt in den Aufnahmeprotokollen relevante biographische Daten mit, allerdings ohne sie bei der Kartierung zu berücksichtigen9. Obwohl die Sprachkompetenz des Sprechers also zu den Dimensionen möglicher Variation gerechnet werden muss, wurde in der interaktiven Karte von VerbaAlpina auf die Einrichtung eines entsprechenden Filters verzichtet, denn die meisten Quellen geben keine diesbezüglichen Informationen.

Strukturierung ist Voraussetzung für die Erstellung eines Korpus im Sinne der zeitgenössischen Linguistik; sie erlaubt auch die Entwicklung einer interaktiven Oberfläche mit sehr benutzerfreundlichen Suchfiltern, wie in Gestalt der interaktiven Karte . Ein wichtiger Schritt der Dokumentation besteht in der Vereinheitlichung der Transkription; die unterschiedlichen Systeme der Quellen werden allesamt durch einen eigens definierten Betacode  in den international weit verbreiteten Standard IPA übersetzt (vgl. die vollständige Übersicht). Die Konversion der Transkription impliziert keinen Informationsverlust, denn auch die Originaltranskription (=“DST QUELLE …“) wird sichtbar, sobald man mit dem Mauspfeil auf den ‚Einzelbeleg‘ oben links im Belegfenster fährt. Das zeigt der folgende Screenshot:

VA-Transkription in IPA und Sichtbarkeit des Originals

Wenn möglich werden alle dialektalen Sprachbelege als Varianten weiter verbreiteter Typen identifiziert und auf große Referenzwörterbücher bezogen (hier L = LSI und H = HdR). Schwieriger ist die Verknüpfung der KONZEPTE mit einem allgemein  etablierten, außersprachlichen Referenzsystem; de facto ist  etwas Derartiges mit dem umfassenden, kontinuierlich wachsenden  Wikidata-Projekt entstanden. Dort wird die gemeinsame außersprachliche Referenz der verschiedenen, oft sehr zahlreichen einzelsprachlichen Wikipedia mit einer Identifikation (ID) versehen; sie kann aus jedem Wikipidia-Eintrag über die Funktion Wikidata-Datenobjekt aufgerufen werden. Dieser Dienst beinhaltet auch bereits seit langem übliche Taxonomien, wie etwa im Bereich der Flora die auf Carl von Linné zurückgehende Nomenklatur. So kann das Konzept BUTTER , das in 134 verschiedenen Sprachversionen der Wikipedia behandelt wird über die ID Q34172 identifiziert werden.

Qualitative und quantitative Kartierung

Grundsätzlich lassen sich strukturierte Daten sowohl qualitativ als auch quantitativ (oder: metrisch) erschließen. Hier stellen sich aus geolinguistischer Sicht sehr unterschiedliche Fragen, die sowohl die statistische Modellierung als auch die Visualisierung betreffen. Eine dialektometrische Funktion zur Bestimmung der relativen Ähnlichkeit wurde bislang noch nicht entwickelt; sie wäre vor allem für die Verbreitung von Basistypen über die Grenzen der  Sprachfamilien hinaus sehr aufschlussreich. Elementare Bezugseinheit der Georeferenzierung ist für VerbaAlpina die politische Gemeinde. Eine flächige Visualisierung auf dieser Basis von 6990 Einheiten ist jedoch nicht in jeder Hinsicht ideal, denn die Unterschiede hinsichtlich ihrer Fläche wie ihrer Bevölkerung können zu manchen Verzerrungen führen (vgl. diese Bemerkungen). Darüberhinaus kann es gelegentlich, z.B. bei der Berücksichtigung von Toponymen, wichtig werden, präziser zu georeferenzieren oder aber die Gemeinden zu größeren Einheiten zu clustern; dazu bieten sich die von der Europäischen Gemeinschaft konzipierten NUTS-3-Regionen oder gar die alpinen Sprachgebiete als ganze an; illustrativ ist die Darstellung der lateinischen Inschriften im Bezug auf NUTS-3 einerseits und die Sprachgebiete andererseits.

Von autonomen Gattungen zu verschränkten Funktionen

Ein großer Vorteil virtueller Dokumentation besteht in der Überwindung der traditionellen Gattungen, die sich im Universum der gedruckten Veröffentlichungen etabliert haben. Sprachwissenschaftlich relevante, publikationstechnisch oft eigenständige Gattungen sind zum Beispiel die Abhandlung, das Textkorpus oder die bereits genannten Sprachatlanten und Wörterbücher. Jede Gattung erfüllt einen bestimmten Zweck, der auf keinen Fall aufgegeben werden sollte. Jedoch werden diese Zwecke aus ihrer Isolierung befreit und in untereinander verknüpfte Funktionen verwandelt, so dass es möglich ist ohne weiteres zwischen ihnen hin und her zu wechseln.

Einen unmittelbaren Zugang zum dokumentierten Materials bietet der Reiter ‚Interaktive Karte‘ auf der Homeseite. Er führt zu einer kartographischen Präsentation, die über mehrere Filter gesteuert wird. Der Filter KONZEPTE erschließt sämtliche Sachen und Vorgänge, deren Bezeichnungen erfasst sind (vgl. die Hinweise zur Notation), so zum Beispiel BUTTER. Die hier zahlreich belegten Bezeichnungstypen können ebenfalls als einzelne herausgefiltert werden; falls ein Typ noch andere Konzepte bezeichnet, tauchen diese ebenfalls auf der Karte auf, wenn sie zu den relevanten Konzepten von VA gehören.  So wird die BUTTER mit Ausdrücken bezeichnet, die auf lateinisch flōrem (Akk. zu flōs), eigentlich ‚Blume‘, zurückgehen und dem fra. fleur bzw. dem ita. fiore entsprechen. Dieser Typ bezeichnet aber außer BUTTER noch RAHM und anderes mehr (vgl. diese Karte).

Weiterhin ist es möglich von der  Karte aus direkt zu den eventuell zugehörigen lexikologischen Kommentar zu gelangen; die Verfügbarkeit wird in der Legende durch einen Button mit dem Buchstaben ‚i‘ angezeigt. Ein solcher Button findet sich in diesem Fall u.a. in der ersten Zeile der Legende hinter  ‚Konzept BUTTER‘; er gibt enzyklopädische Informationen zur Geschichte des Produkts.  In der entgegengesetzten Verweisrichtung ist es möglich den Reiter ‚Lexicon Alpinum‘ zu konsultieren; dort findet sich derselbe Kommentar zum Konzept Butter, der  über die Funktion ‚Auf Karte visualisieren‘ zur genannten Karte leitet  – ‚Atlas‘ und ‚Wörterbuch‘ haben sich also in  systematisch verschränkte Funktionen ein und derselben Forschungsumgebung verwandelt.

Von der Philologie zu den Humanities

Zur historischen Profilierung von Sprachräumen ist es sinnvoll die Verbreitungsareale dialektaler Formen mit anderen  georeferenzierbaren Informationen zu kombinieren. Im Hinblick auf die Romanisierung des Alpenraums im Gefolge der römischen Eroberung sind vor allem antike Quellen von Bedeutung.; aus diesem Grund wurden auch die gesicherten Inschriften und römerzeitlichen Ortsnamen aufgenommen (vgl. die Karte CIL und Tabula Peutingeriana sowie die Hinweise zu den historischen Daten); vor diesem Hintergrund ist es interessant zu sehen, dass sich oft alte Bedeutungen aus der Antike bis heute gerade da erhalten haben, wo auch bereits römische Inschriften und antike Ortsnamen bezeugt sind. Ein sehr schönes Beispiel liefert der auf den ersten Blick ganz unauffällige Worttyp Keller < lat. cellarium . Er bezeichnet im Gegensatz zum Hochdeutschen im deutschsprachigen Alpenraum in der Regel keineswegs einen RAUM UNTER DEM ERDGESCHOSS, sondern – wie das Grundwort lat. cella – den VORRATS- bzw. LAGERRAUM. Hier liegt es im Hinblick auf die römerzeitlichen Zeugnisse im dialektalen Verbreitungsgebiet  an Konservation der lateinischen Bedeutung zu denken und nicht an sekundäre Rückentwicklung zur alten Bedeutung; besonders prägnant sind die drei steirischen Belege von Keller in der Bedeutung ‚Almhütte‘.

3.3. Funktionsbereich Kooperation

Im Sinn der digital humanities hat VerbaAlpina ein dichtes Netz von  Partnern geknüpft. Darunter sind manche – und an allererster Stelle sind ALD-I und ALD-II zu nennen -, die bereits eindeutig strukturiertes Material zur Verfügung stellen, das von VA über eine Datenschnittstelle integriert werden kann; bisweilen, wie im Fall des WBOE liegen auch rudimentäre und inkonsistente Strukturen vor, die nur mit großem Aufwand konvertiert werden können. Jedenfalls lassen sich die Partnerdaten in Verbindung mit den durch Retrodigitialisierung gewonnenen Daten zu einem umfassenden und mehrsprachigen Dialektmosaik des ganzen Alpenbogens zusammengefügen, wie die maximalistische Übersicht der prinzipiell verfügbaren VA-Informanten zeigt. Man beachte, dass die Berücksichtigung des WBOE mindestens theoretisch eine umfangreich Atlaslücke in den österreichischen Ostalpen schliesst (vgl. VA-Informanten ohne Berücksichtigung des WBOE.

Wirklich unvereinbar mit dem erstrebenswerten kollaborativen Aufbau umfassender und gut nachnutzbarer Datenbestände ist die Verwendung kommerzieller und privatwirtschaftlicher Dienste, auch , oder besser: gerade dann, wenn sie  das Etikett open access sozusagen im Stil einer feindlichen Übernahme für sich reklamieren, wie es die zunehmend monopolistisch auftretenden Verlage praktizieren (vgl. dieses Beispiel).

3.4. Funktionsbereich Datenerhebung

Crowdsourcing als Technik der Datenerhebung ist eine Option, die sich webbasierter Forschung  grundsätzlich bietet; selbstverständlich taugt das Verfahren nicht für Daten, die Expertenwissen erfordern; so kann ein Sprecher zwar Ausdrücke und Konstruktionen in geschriebener und mündlicher Realisierung liefern, jedoch keine Transkription, die den Ansprüchen der Phonetik genügt. Sehr wohl ist ein Sprecher jedoch im Stande, markante lautliche Besonderheiten (z.B. Diphthongierungen, Palatalisierungen) zu unterscheiden. Im Rahmen von VerbaAlpina wurde ein Crowdsourcing-Tool designed, mit dem interessierte Nutzer für alle politischen Gemeinden des Alpenraums (im Sinn der Alpenkonvention) Bezeichnungen der von uns vorgegebenen Konzepte schriftlich eingeben oder darüber hinaus auch neue Konzepte hinzufügen. Bislang sind seit dem 10.2.2017 immerhin 11534 (Stand vom 1. April 2019) Belege erhoben worden. Es wird erwogen, unter Umständen auch mit der Erhebung gesprochener Audiodaten zu beginnen; die technischen Probleme sind grundsätzlich gelöst.

Das grundlegende Problem beim Einsatz von Crowdsourcing liegt jedoch darin, dass es sich um eine mediales Verfahren handelt, das auf eine hinreichende Sichtbarkeit und Bereitwilligkeit der Mediennutzer angewiesen ist. Es muss – mit anderen Worten – für hinreichende Publizität gesorgt werden. In aller Regel sind Projekte aus den humanities keine Selbstläufer und können daher Unterstützung durch Öffentlichkeitsarbeit einschließlich nicht digitaler Medien gebrauchen. Pressemitteilungen bilden sich im positiven Fall direkt in der Nutzeraktivität ab, wie drei punktuelle Einblicke in die Statistik des VerbaAlpina-Crowdsourcings zeigen:

Öffentlichkeitsarbeit und Echo im Crowdsourcing: A – kein eindeutiges Echo: Vortrag vor Almbauern  |  B – schwaches Echo: Bericht in einer Schweizer Lokalzeitung | C – starkes Echo: Homepage des Bayerischen Rundfunks (BR 2)

Aber es scheint sehr problematisch, wenn nicht unmöglich Nutzerinteresse zu prognostizieren. Sehr schwer einzuschätzen ist insbesondere die Gewichtung des individuellen Sachinteresses auf Seiten des Nutzers und sowie der Attraktivität des Web-Auftritts. Womöglich besteht auch ein Zusammenhang beider Parameter, insofern fehlendes Sachinteresse eventuell durch eine unterhaltsame, z.B. als Spiel gestaltete Oberfläche (‚gamification‘) kompensiert werden kann. 10 Es kann jedoch auch nicht übersehen werden, dass es durchaus sehr erfolgreiche CS-Kampagnen gibt, in denen der zweite Parameter keine und der erste bestenfalls eine unklare Rolle spielt (vgl. die Übersicht der Zooniverse-Projekte).

3.5. Funktionsbereich Forschungslabor

Forschungsumgebungen im Rahmen der Digital Humanities sind in der Lage eine Option anzubieten, für die es in der Welt, die ausschließlich auf den Druck ‘fertiger’ Ergebnisse zielt, keine Entsprechung geben kann. Gemeint ist die Einrichtung eines mehr oder weniger offenen digitalen ‘Raums’, in dem registrierte Partner, Nutzer und/oder Interessenten überhaupt die Möglichkeit haben, sich mit den Inhalten und dem Quellcode des Projekts zu befassen. Diese Auseinandersetzung kann analytisch erfolgen, aber auch in Vorschlägen, das Vorhandene um Inhalt und/oder Code zu erweitern. Dazu müssen Upload-, Download- und Kommentar- bzw. Chatfunktionen eingerichtet werden. Dieser Funktionsbereich, für den sich die Bezeichnung ‘Labor’ anbietet, wurde in VerbaAlpina bislang noch nicht ausgebaut; immerhin haben registrierte Nutzer auf der ‘Interaktiven Karte’ schon die Möglichkeit, beliebige Daten, die über die Filter angezeigt werden können, gemeinsam aufzurufen und in Gestalt sogenannter  ‘Synoptischer Karten’ zu fixieren und zu kommentieren. Das jeweils Erzeugte kann über einen Share-Button weitergeleitet werden, so dass Interessentengruppen gebildet werden können.

3.6. Funktionsbereich Publikation

Eine probate Strategie zur Durchsetzung kollaborativer Forschungsumgebungen ist der parallele Aufbau von Publikationsplattformen, die denselben Anforderungen  entsprechen, an denen auch gedruckte Veröffentlichungen gemessen werden: dauerhafte Zitierfähigkeit und Recherchierbarkeit. Verlässlich zitierfähig in lwissenschaftlichem Kontex sind nur stabile Text. Für VerbaAlpina wurde eine technische  Versionierung entwickelt, die in ähnlicher Weise auch in anderen Münchner Plattformen verwandt wird. Sie beruht im Wesentlichen darauf, dass die jeweilige Version in der URL des Textes spezifiziert wird. Jede Änderung des Textes setzt die Erzeugung einer neuen Version voraus, die jedoch die vorhergehende nicht ersetzt, sondern ergänzt. Die älteren Versionen bleiben erhalten, so dass ihre eventuellen Zitate durch neuere Versionen nicht gefährdet werden. Für den oben erwähnten Kommentar zum Konzept BUTTER wird die folgende Zitierweise empfohlen, in der die Version 17/2 in der URL in Gestalt der Ziffer 172 repräsentiert wird:

  • Krefeld, T.: s.v. “BUTTER”, in: VA-de 17/2, Lexicon alpinum, https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=2374&db=172#C156

Diese Zitierbarkeit wurde in den Portalen KiT und DH–Lehre entwickelt. Um in längeren versionierten Texten gezielt auf einen bestimmten Abschnitt referenzieren zu können, wurde die Textformatierung so eingestellt, dass alle Absatzes fortlaufend nummeriert werden und die jeweilige Nummer durch Klicken der URL hinzugefuegt wird. Die folgende URL:

verweist also auf den 8. Absatz eines Beitrags von Hans Goebl in der ersten Version des Sammelbandes Berichte aus der digitalen Geolinguistik : Thomas Krefeld | Stephan Lücke (2018): Berichte aus der digitalen Geolinguistik. Korpus im Text. Version 1 (12.05.2018, 10:20). url: http://www.kit.gwi.uni-muenchen.de/?p=4498&v=1]].

Die Recherchierbarkeit des Projekts VerbaAlpina als ganzem ist nicht nur in den Suchmaschinen, sondern auch im Verbundkatalog der öffentlichen bayerischen Bibliotheken (OPAC) gewährleistet; es wurde durch die UB der LMU mit einem Digital Object Identifier (doi:10.5282/verba-alpina) versehen, über das es auch jenseits der Kataloge und herkömmlichen Suchmaschinen auffindbar ist (vgl. DOI). Darüber hinaus wurde auf dem Server der Deutschen Nationalbibliothek ein sogenannter Uniform Resource Name (URN) hinterlegt, der Ähnliches wie die DOI leistet (vgl. [[Lücke 2017|https://www.verba-alpina.gwi.uni-


  1. Vgl. zur Bezeichnung die Bemerkungen  in Krefeld 2017c

  2. vgl. die Darstellung des Unternehmens in Krefeld 2017g

  3. Dieser Ausdruck ist insofern gerechtfertigt, als ein sehr großer Teil der im Atlas veröffentlichten Formen typisiert wird, allerdings ohne diesen Typen ein konkretes Etymon zuzuweisen. Diese Verknüpfung interaktiv zu realisieren wäre eine sehr schöne Unternehmung der Digital Romance Humanities

  4. Das Gebiet wird aus rein pragmatischen Gründen über die Zugehörigkeit der politischen Gemeinden zur Interessenvereinigung der Alpenkonvention abgegrenzt. 

  5. Vgl. zu diesem Konzept aus romanistischer Sicht

  6. Das ist zum Beispiel immer dann agebracht, wenn Quellen sich auf  Gemeinden beziehen, die im Zuge von administrativen Neuordnungen mit anderen Gemeinden zusammengelegt wurden. 

  7. Aus kommunikationsräumlicher Perspektive fallen jedem Romanisten sofort zahlreiche andere faszinierende Konstellationen eine: die Romania Thyrrenica (Korsica, Elba, Sardinien, die Balearen mit den jeweils nächstgelegenenen kontinentalen Küstenstreifen), die Sprachgebiete beiderseits der Adria, das Verbreitungsgebiet der Aromunen, Meglenorumänen und Rumänen; die Gegenden Afrikas, wo auch romanische Sprachen gesprochen; der Indische Ozean, Amerika usw.). Unser aller indivuiduelle Interessenthorizonte stoßen ja ständig an die Grenzen unserer individuellen Sprachkompetenzen, so dass nur aus der Kollaboration sinnvolle und notwendige Großprojekte entstehen können. 

  8. Darüber hinaus müsste auch das Alter in die Chronoreferenzierung eingehen; im VerbaAlpina-Gebiet lagen im Fall des AIS mehr als 60 Jahre Altersunterschied zwischen den Informanten; die Sprecherin aus Lanzada (AIS 216)  war bei der Erhebung, 1921, erst 22 Jahre alt, der Sprecher aus Surrhein (AIS 11) dagegen im Jahre 1920 bereits 84; vgl. Jaberg/Jud 1928, 40, 63. 

  9. Vgl. zur Informantenmobilität Krefeld 2002 und zum Problem der nicht alphabetisierten Informanten Krefeld 2007b und Krefeld 2007c

  10. Diese Komponente tritt im Projekt VerbaAlpina fast vollkommen zurück; allenfalls ist die Nennung der aktivsten (registrierten) User, Gemeinden und der beliebtesten Begriffe in der Crowdsourcing-Funktion  zu erwähnen; diese Zurückhaltung ist eine Reaktion auf die schwache Resonanz, die das dezidiert spielerisch ausgerichtete Projekt ]Metropolitalia gefunden hat. 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.