VA_Phase3 (Zitieren)


(3820 Wörter)

Thomas Krefeld | Stephan Lücke (LMU)

1. Vorbemerkung

Der vorliegende Antrag zielt auf die Gewährung einer dritten Förderungsphase des DFG-Langzeitvorhabens VerbaAlpina (VA); er folgt grundsätzlich dem ursprünglichen Plan des Erstantrags, will jedoch ausdrücklich auch Ergebnisse, methodologische Entwicklungen und Erfahrungen der 2. Phase (=VA_2) weiterführen, die zu Beginn noch nicht absehbar waren.

2. Ergebnisse aus der 2. Förderungsphase (VA_2): FAIR ‚ladinia‘?

Bei Beurteilung des Projektfortschritts sind zwei Persepktiven zu unterscheiden:

  • die Kumulation des dokumentierten Sprachmaterials und die Konsolidierung seiner  lexikographischen Erschließung durch Referenzwörterbücher;
  • die methodologische Elaboration.

2.1 Kumulation sprachlicher Daten und ihre lexikographische Konsolidierung

Wie im Erstantrag vorgesehen, dient die aktuelle Förderungsphase der Erschließung eines zweiten großen Gegenstandsbereichs, nämlich der Natur, und zielt auf Bezeichnungen von Witterungserscheinungen, Landschaftsformationen, Fauna und Flora; zudem ist es es nach wie vor möglich, Daten zu den Sachgebieten von VA_1 hinzuzufügen (so im Crowdsourcing-Verfahren aber auch durch systematische, manuelle Auswertung des DizMT).

#wieviele neue Konzepte, Belege # Zahlen#.

Der Fortschritt ist vollkommen transparent und lässt sich dank der halbjährigen Versionierung leicht nachvollziehen (s.u.#).

2.2 Methodologische Elaboration: FAIR

In der zweiten Förderungsphase wurde VerbaAlpina zu einer vielseitigen und in mancher Hinsicht modellhaften Forschungsumgebung für die virtuelle Geolinguistik ausgebaut, so dass die Überführung der Geolinguistik in die Digital Humanities durchaus vorangetrieben werden konnte. Insbesondere wurde viel Arbeit in die Konzeption und praktische Umsetzung von verlässlichen Prozeduren des Datenmanagements in webbasierten Forschungsprojekten  investiert. Von grundlegender Bedeutung ist in dieser Hinsicht die Beachtung einiger elementarer Regeln, die kurz vor dem Auslaufen der ersten Förderungsphase von einer wichtigen Initiative in Gestalt der Sigle FAIR lanciert wurden (🔗). Mit dieser Abkürzung werden vier grundlegende ethische Prinzipien für die Wissenschaftskommunikation unter den Bedingungen der Neuen Medien identifiziert. Ihnen zufolge müssen Forschungsdaten

  • F_indable (‘auffindbar’),
  • A_ccessible (‘zugänglich’),
  • I_nteroperable (‘kompatibel’),
  • R_eusable (‘nachnutzbar’)

sein (🔗). Diese Prinzipien lieferten, erstens, (im Nachhinein) griffige Labels für das methodologische Fundament , auf dem VA von Beginn an errichtet worden war und stimulierten, zweitens, die systematische und sehr fein granulierte Verknüpfung der VA-Daten mit Normdaten.  

Die Anforderungen von drei  (F, A, R) der vier Prinzipien zielen darauf, sowohl human readable als auch machine readable zu sein; sie gelten also sowohl für die Mensch-Maschine-Mensch-Kommunikation als auch für die Maschine-Maschine-Kommunikation. Das vierte Prinzip (I) gilt nur für letztere; es ist jedoch im skizzierten virtuell-medialen Rahmen zentral für den Fortschritt der Forschung und repräsentiert insofern die Unverzichtbarkeit der technologischen Komponente ebenso wie Transformation des LESERs zu einem interaktiven NUTZER, der auf einem Kontinuum zwischen hochspezialisierten Experten und völligen Laien abgebildet werden kann und der sich den Daten nicht nur lesenden Auges nähert, sondern womöglich mit der Absicht, sie für eigene Forschungszwecke zu nutzen und dafür maschinelle ‘Erntehelfer’ (zum sog. harvesting) einzusetzen.

Die Operationalisierung der FAIR-Prinzipien erfordert zunächst ihre trennscharfe Definition; sie erfolgt im Rahmen von VA durch jeweils ein spezifisches Kriterium:

  • Findability ist gegeben, wenn die Daten aufgrund möglichst fein granulierter und eindeutiger Identifikatoren (IDs) und ihrer Verknüpfung mit Norm- und Metadaten im Internet identitifiziert werden können.
  • Accessibility  ist gegeben, wenn die Zugänglichkeit der Daten aufgrund geeigneter Lizenzierungen (z.B. im Sinne der Creative Commons-Organisation rechtlich ausdrücklich erlaubt ist (z.B. CC-BY-SA).
  • Interoperability ist gegeben, wenn die Primärdaten eines Projekts anderen Projekten zum Export angeboten werden.
  • Reusability  ist gegeben, wenn der entwickelte Code, insbesondere auch spezifische Verarbeitungs- und Analysetools, in einem Standardformat über geeignete Schnittstellen angeboten werden.

Erfordert wird darüber hinaus ein komplexes Zusammenspiel von Forschern, das heißt de facto von befristeter und deshalb mehr oder weniger prekärer Projektarbeit einerseits und andererseits von Institutionen, die Dauerhaftigkeit in Aussicht stellen können; das sind in allererster Linie die großen Bibliotheken. Die Entwicklung von Prozeduren für diese ganz spezielle Art der Kooperation gehört zu den aktuellen Herausforderungen der Forschung, die mit dem Ausdruck Forschungsdatenmanagement (FDM) bezeichnet werden. Damit sind wichtige Eckpunkte der Wissenschaftskommunikation im Web markiert, die den Horizont von VA abstecken.

FAIRness in einer web-basierten Forschungsumgebung

Das Projekt VerbaAlpina (VA) versucht, die Forschungskommunikation im oben skizzierten Sinne konsequent nach den FAIR-Prinzipien zu gestalten.  Dabei ist ihre Anwendung in den folgenden fünf komplementär angelegten und eng miteinander verflochtenen Funktionsbereichen (🔗) zu unterscheiden:

  • Dokumentation;
  • Publikation;
  • Kooperation;
  • Datenerhebung durch crowdsourcing;
  • Forschungslabor.

FAIRness der Publikation

Der Begriff der ‚Publikation‘ muss unter Web-Bedingungen präzisert werden: Von VerbaAlpina  werden

  • semantischer Inhalt (Dialektformen, analytischer wissenschaftlicher Text),
  • Metadaten,
  • Software und Code

veröffentlicht (🔗).

Produziert werden dabei ausnahmslos stabile Daten und Textdateien, da die gesamte Plattform (Benutzeroberfläche und Datenbanken) alle sechs Monate ‘eingefroren’, oder: versioniert wird; zusätzlich besteht jeweils eine aktuelle Arbeitsversion (Version xxx), die noch Änderungen unterliegt und daher nicht zitiert werden sollte (🔗). Die jeweils jüngste Version (die aktuelle trägt die laufende Nr. 19/2; Reiter auf der Homepage oben rechts unter dem DFG-Logoersetzt jedoch nicht die vorige, sondern ergänzt sie; alle früheren Versionen bleiben erhalten, so dass sämtliche Zitate und Verlinkungen innerhalb des Projekts sowie von außen auf das Projekt stets zugänglich sind. (Übrigens wurde das im Rahmen von VA entwickelte Versionierungssystem zu einem Prinzip der Publikationsplattform KiT erhoben. )

Es ist weiterhin sichergestellt, dass die Versionen gut auffindbar sind, denn ihnen wird von der UB der LMU ein DOI zugewiesen (http://dx.doi.org/10.5282/verba-alpina); gleichzeitig findet VA als Ganzes damit Eingang in die Biblibliothekskataloge (🔗).

Auf dieselbe Weise lassen sich auch alle thematischen Textbeiträge identifizieren, die auf der Projektseite unter den Reitern Lexicon alpinum, Methodologie und Beiträge  publiziert werden; sie erhalten ebenfalls einen DOI und sind daher direkt zitierfähig (vgl. z.B.: Krefeld, T. / Lücke, S.: s.v. “butyru(m)”, in: VA-de 18/2, Lexicon alpinum, http://dx.doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D2374%26db%3D182%23B128).

Eine vergleichbare Funktion leistet der URN, der bei der Deutschen Nationalbibliothek in Frankfurt registriert wird. Schließlich ist auch der gesamte Quellcode von VA mit allen programmierten Tools unter github auffindbar und zugänglich. Technisch gesehen liegt dem Verfahren ein Export aller VA-Daten in ein Repositorium der UB zu Grunde (open data lmu), in dem auch Metadaten im Format DataCite zugewiesen werden.

Eine große Rolle bei der Ausgestaltung der Metadatenschemata spielen die Normdaten, die eine eindeutige und fein granulierte Identifikation der Forschungsdaten erlauben. VA unterscheidet drei Datenkategorien (oder: Entitäten), für die eigene Identifikatoren vergeben werden, die in Verbindung mit den Daten abrufbar sind:  ‘Konzept’, ‘morpholexikalischer Typ’ (s. Typisierung) und ‘Gemeinde’. So ergeben sich sehr spezifizierte Metadaten (vgl. das DataCite Beispiel für das Konzept SENNHÜTTE, das neben dem VA-Identifikator C1 auch die in VA ebenfalls vorhandenen onomasiologischen Identifikatoren des Wikidata-Projekts enthält:  Q136689, Q27849269, Q2649726), die grundsätzlich die eindeutige Referenzierung auf Einzeldaten definierter Objektklassen über Projektgrenzen hinweg erlauben.

Dieser Export gewährleistet die Zugänglichkeit und Nachnutzbarkeit der Daten nach dem Auslaufen der Projektförderung. Der Datenexport erfolgt über eine API-Schnittstelle (vgl. API Dokumentation), die im Internet öffentlich zugänglich ist und auch für die  Ausgabe in anderen Formaten und angereichert um Metadaten von im Grunde beliebigen anderen Standards, z.B. gemäß CLARIN-D, genutzt werden kann. Einen groben Überblick des im Entstehen begriffenen Forschungsdatenmanagements (Stand vom 11.3.2019) gibt das folgende Schema:

Forschungsdatenmanagement zwischen Projekten, Institutionen und Öffentlichkeit

Im Hinblick auf die Auffindbarkeit und Zugänglichkeit sind noch zwei grundsätzliche Bemerkungen angebracht:

  1. Da bislang in der Wissenschaftsgemeinde weder ein Standard-Metadatenschema verbindlich festgelegt noch die Frage geklärt ist, welche Institutionen über deren Einhaltung und die dauerhafte Bewahrung von Daten und Metadaten wachen sollen, hat sich VA zum einen für ein flexibles Schnittstellenkonzept entschieden, das die Nutzung im Grunde beliebiger Metadatenschemata erlaubt. Außerdem beteiligt sich VA an zwei aktuell laufenden Forschungsprojekten, die sich mit dieser Problematik auseinandersetzen: der Initiative (GeRDI) des LRZ und dem von der Bayerischen Staatsregierung geförderten Projekts „eHumanities – interdisziplinär. Im Projekt GeRDI sollen Daten ganz unterschiedlicher Disziplinen über Metadaten verknüpft werden, indem gemeinsame Attribute festgelegt werden (was z.B. im Fall von Geo- und Chronoreferenzierungen sehr einfach und häufig auch sinnvoll ist).
  2. Abgesehen von den Metadaten, die auf die spezifischen Projektdaten referenzieren, ist es im Sinn von Auffindbarkeit und technischer Interoperabilität unbedingt ratsam, Identifikatoren und Normdaten zu verwenden, die außerhalb des Projekts etabliert sind. VA verwendet daher seit kurzem die Identifikatoren der sogenannten Wikidata-Datenobjekte. Sie liefern Referenzen für außersprachliche Realitäten und Konzepte und damit einen gemeinsamen Bezugsrahmen für viele unterschiedliche Sprachen; so gibt es derzeit (14.12.2018) Wikipedia-Artikel in 133 Sprachen über das Milchprodukt Butter. Die sehr unterschiedlichen Artikel werden verknüpft, indem sie alle auf den eindeutigen Identifikator des entsprechenden Wikidata-Datenobjekts referenzieren (Q34172). Eine Suchmaschine, die danach sucht, ist also in der Lage, alle zugehörigen 133 Bezeichnungen zu finden – und so, zumindest theoretisch, demnächst auch die in VA dokumentierten, zahlreichen Dialektformen (1926 Belege). Ein ähnliches System für Bezeichnungstypen, d.h. für Wörter (L-ID), ist bei Wikidata im Aufbau.

2.2. FAIRness der Dokumentation

VA dokumentiert Dialektbelege der drei großen europäischen Sprachfamilien, die sich in ethnolinguistischer Hinsicht  als spezifisch alpin erweisen.

Das Material wurde in einen systematisch strukturierten Datenbestand überführt und nach sprachlichen (‘morpho-lexikalische Typen’, ‘Basistypen’) und außersprachlichen (‘Konzepte’) Kritierien annotiert; neben dem maschinenlesbaren Zugang über die oben erwähnte API-Schnittstelle gibt es einen menschenlesbaren Zugang, der in sehr anschaulicher Weise über eine interaktive Karte erfolgt. Die dafür in VA_1 genutzte Google Maps-Karte wurde in VA_2 (2019)  durch Karte mit stark verbesserter Funktionalität ersetzt. Die neue Karte basiert auf:

  •  frei verfügbaren  Tile-Services (Stamen : Terrain, OSM : Open Street Map, OpenTopo : OpenTopoMap, Stamen : Toner Light, CartoDB : Carto Light, CartoDB : Carto Dark), die der Nutzer alternativ wählen kann (Icon oben rechts auf der interaktiven Karte);
  • der Karten-API Leaflet, mit der die Kartierungslogik umgesetzt wird;
  • der Grafik-API WebGL, die die genutzt wird, um den Aufbau und die Funktionalität der virtuellen Karten zu optimieren; es ist jetzt möglich, auch noch erheblich größere Datenvolumina abzubilden.

Die genannten Kategorien der Datenstrukturierung  fungieren an der Kartenoberfläche als Filter. Bereits auf dieser nutzerfreundlichen, insbesondere laientauglichen Oberfläche wurde eine ebenso einfache wie elementare Funktion der reusability implementiert, denn es ist möglich, alle Karten, die man sich anzeigen lässt, in exakt der angezeigten Form (mit der entsprechenden Zoomstufe, jeweils geöffneten Fenstern usw.) mit anderen zu teilen oder sie in Publikationen usw. einzubauen, denn durch Klicken auf einen ’share button‘ wird für die jeweils aktuell angezeigte Karte eine versendbare URL erzeugt; so führt der folgende Link zu einer Karte aller in VA vorhandenen dialektalen Bezeichnungen von BUTTER.

Das vorhandene Sprachmaterial stammt aus zwei Quellen: Ein kleinerer Teil des Materials, das VA anbietet, wurde durch  das Projekt selbst im Crowdsourcing-Verfahren (s.u. 2.4.) erhoben. Der größte Teil wurde jedoch aus gedruckten oder für den Druck vorgesehenen Arbeiten gewonnen, so finden sich auch Formen, die uns im Rahmen von Partnerschaftsabkommen aus noch nicht abgeschlossenen Projekten zur Verfügung gestellt wurden (vgl. zum Beispiel das Punktnetz des Sprachatlas von Oberösterreich). Berücksichtigt wird auch Wörterbuchmaterial, unter der Bedingung, dass die sprachlichen Belege georeferenzierbar sind; das ist bei guten Dialektwörterbüchern wie zum Beispiel dem DRG, dem VSI oder auch dem DizMT der Fall. De facto ist jede Quelle überdies auch chronoreferenzierbar, allerdings wurde diese Funktion noch nicht implementiert.

Durch die Retrodigitalisierung und den Webauftritt werden zahlreiche, in teils schwer zugänglichen Publikationen ‘schlafende’ Dialektausdrücke leicht auffindbar (F), zugänglich (A), interoperabel (I) und in allgemein kompatibler Weise nachnutzbar (R) gemacht; denn alle verfügbaren Formen erhalten einen persistenten Identifikator und werden in Kürze auch über einen Digital Object Identifier (DOI) ansprechbar sein. Hier ein Beispiel aus dem Sprach- und Sachatlas Italiens und der SüdschweizAIS (1928-1940).

VA produziert also gewissermaßen FAIRen Output, auch wenn die allermeisten Quellen, der Input, von FAIRness noch meilenweit entfernt sind (vgl. die FAIR-orientierte Kritik der aktuellen Dialektlexikographie und -kartographie in Krefeld/Lücke ##).

2.3. FAIRness der Kooperation

VA wird von zahlreichen Partner-Projekten unterstützt; das große Potential dieser Kooperation ist selbstverständlich und bedarf eigentlich keiner Erläuterung. Grundsätzlich wurde die konstruktive Perspektive der mehrfachen und komplementären Nachnutzung kompatibler Partnerprojekte bereits in VA_1 eröffnet, wie der Import der Daten aus  Archivio lessicale dei dialetti trentini (ALTR) gezeigt hat.

Als interoperabel und als wiederverwendbar (reusable) in der Kooperation haben sich in VA_2 auch die Projektarchitektur und die entsprechende Software erwiesen; so konnte probeweise das sizilianische Regional- und Spezialwörterbuch von Sottile 2002 ohne Schwierigkeiten nachgenutzt und als Atlas dargestellt werden (vgl. den Atlante linguistico della Sicilia online, der seit 2019 durch die sizilianischen Partner ausgebaut wird). Auch der im Entstehen begriffene Atlas des Pikardischen in Nordfrankreich und Belgien greift seit dem Herbst 2018 auf die Konzeption und Technologie von VA zurück (vgl. Verba Picardia; weitere Anfragen von #Remysen zum Québec#Enkeleida Kapia zu Albanien# liegen vor.

2.4. FAIRness im Crowdsourcing

Crowdsourcing-Verfahren richten sich in allererster Linie, wenngleich nicht ausschließlich, an Laien; sie setzen deshalb eine intuitiv leichte Auffindbarkeit und Zugänglichkeit zentraler Datenbereiche für menschliche Nutzer voraus. Die Daten werden durch die Art der Erhebung in ein strukturiertes und interoperables Format gebracht, das Nachnutzung gestattet. VA nutzt Crowdsourcing in doppelter Weise: Zunächst wurde ein ästhetisch ansprechendes und einfach zu bedienendes Tool zur Datenerhebung programmiert (Mitmachen!); dafür wurde auch ein Tutorial auf Youtube gepostet. Ferner wurde soeben ein Zooniverse-Auftritt eingerichtet, um die für Retrodigitalisierung erforderliche Transkriptionsarbeit wenigstens teilweise an die Crowd weiterzugeben (🔗). Auch dafür ist Interoperabilität der VA-Datenbasis die Voraussetzung.

Das Erhebungstool wurde durch populärwissenschaftliche Vorträge in der Erwachsenenfortbildung einschlägiger Berufsgruppen (am 20.4.2018, 26.2.2018, 7.10.2017) beworben und fand daneben auch ein schönes massenmediales Echo. Die Auswertung ist interessant, denn es zeigt sich, dass vor allem Projektberichte im Internet relevant sind, da dort über einen Link ein direkter, sozusagen intramedialer Zugang angeboten werden kann: Das mit Abstand stärkste Echo fand deshalb ein Post auf der Internetseite des Bayerischen Rundfunks (am 27.4.2018); insgesamt wurden durch die 1064 ‘Crowder’ bislang  14965 Dialektformen (Stand: 28.11.2019) beigesteuert  (🔗).

3. Arbeitsprogramm VA-3

In der beantragten Förderungsphase sollen zwei unterschiedliche inhaltliche Bereiche bearbeitet werden.

3.1. Moderne Lebenswelt

Zunächst werden, wie im Erstantrag bereits avisiert, mit der ÖKOLOGIE (Wasserbau, Lawinensicherung, Bannwald, Wildschutz usw.) und dem TOURISMUS (vor allem Wintersport) zwei onomasiologische Domänen erfasst, die zwar den Bereich der modernen Lebenswelt repräsentieren, aber dennoch einen klaren Bezug zum alpinen Raum aufweisen. Damit werden zwei geolinguistisch kaum untersuchte Fragen verfolgt: Zunächst wird allgemein erforscht, in welchem Maße die Bezeichnung moderner Konzepte räumlicher Variation unterliegt und ob sich im Fall von Variation Areale ergeben, die den Verbreitungsarealen der bereits erfassten traditionellen Lexik entsprechen#dafür ist Dialektometrie von VA_1/2 analog http://www.asd.gwi.uni-muenchen.de/?karte=quant erforderlich#. Die Ergebnisse des  Atlante della Lingua Italiana QUOTidiana (ALIQUOT) zeigen, dass grundsätzlich durchaus mit Variation zu rechnen (vgl. MÜLLCONTAINER oder TINTENKILLER.  Im Hinblick auf die zahlreichen sogenannten ‚kleinen‘ Sprachen Valdostanisch, Bündnerromanisch (Surselvisch, Puter, Vallader), Ladinisch (Ghërdeina, Badiot, Fascian usw.), Friaulisch wird sich sodann zeigen, ob und in welchem Maße überhaupt spezifische Bezeichnungen lexikalisiert wurden, oder ob nicht vielmehr mit einer gewissen Selbstverständlichkeit die Bezeichnungen der (oft ohnehin dominanten)  ‚großen‘ Sprachen Deutsch und Italienisch übernommen werden. Es wird sich so auch ein Einblick in die areale Mehrsprachigkeit des Alpenraums  gegeben.

Da entsprechende Bezeichnungen durch die bislang ausgewerteten Datenquellen (Sprachatlanten, Dialektwörterbücher) nicht erfasst werden (konnten), steht kein retrodigitalisierbares Material zur Verfügung. Aus diesem Grund wird die Erhebung über Crowdsourcing im Unterschied zu VA_1 und VA_2 eine ganz zentrale Rolle spielen.  Es ist im Umgang mit diesem Erhebungsverfahren allerdings sinnvoll aus den bisherigen Erfahrungen zu lernen. Grundsätzlich darf man sagen, dass sich der Einsatz des entwickelten Tools Mitmachen! bewährt hat; bis zum 4.12.2019 (O8:57) wurden von 1069 Nutzern 15784 Belege eingegeben. Allerdings ist das Nutzerecho praktisch nicht zu kontrollieren. In jedem Fall ist intensive Bewerbung angebracht; sie schlägt sich oft – aber keineswegs automatisch – in deutlicher Nutzeraktivität nieder, am deutlichsten dann, wenn das Tool online durch einen einfachen Klick erreichbar ist; den größten Erfolg brachten ein verlinkter Beitrag auf der Homepage des Bayerischen Rundfunks (27.4.2018) sowie eine konzertierte Kampagne mit mehreren Pressemitteilungen und Flyerausgaben in den Dolomiten (23.7.-30.8.2019). Vor allem ist die regional sehr unterschiedliche Akzeptanz unübersehbar: im südlichen Teil der französischen Westalpen ist die Resonanz bislang äußerst gering.

VA wird daher eine Anregung durch den sogenannten Concours Cerlogne aufnehmen, der im Aostatal jährlich durch den Assessorat de l’Éducation et de la Culture in Verbindung mit dem Centre d’Études Francoprovençales René Willien in Saint-Nicolas organisiert wird. In diesem ganz Wettbewerb, der keineswegs online, sondern vollkommen face to face durchgeführt wird, werden Schüler von ihren Lehrern gebeten, zu bestimmten Themenbereichen Dialektmaterial zu sammeln. VA wird sich flächendeckend weiterführende Schulen wenden und um Unterstützung des Vorhabens bitten. Dabei entstehen zwei im HInblick auf das Alter möglichst homogene Informantengruppen:
(1) 16-19jährige Schüler*innen der weiterführenden Schulen;
(2) ca. 55-65jährige Verwandte der Kohorte (1) aus der Generation der Großeltern. 

Das Crowdsourcing–Tool muss für diese Anwendung so adaptiert werden, dass die Anonymität der Teilnehmer*innen gewährleistet ist; sie werden durch die Geocodierung des Wohnorts, das Alter und einen Numerus Currens kodiert. Die Rolle der Lehrer besteht im Wesentlichen darin, den Hinweis auf das Projekt möglichst weit zu verbreiten; ein eventuelle Thematisierung des Projekts ist natürlich willkommen, wird aber nicht unbedingt erwartet.

3.2. Kontextualisierung in der Romania

Die zweite geplante Arbeitsbereich von VA_3 war im Erstantrag nicht vorgesehen; er ist aus der Kooperation mit einem Projektpartner, dem Atlante linguistico della Sicilia (ALS) entstanden und zielt darauf das bisher zusammengekommene spezifisch ethnographische Material des Projekts (Almwesen, Milchverarbeitung) durch romanische Daten aus ethnographisch vergleichbaren Gebieten zu erweitern und so die Lexik des Alpenraums romanisch zu kontextualisieren; das ist vor allem im Hinblick auf den vorrömischen Anteil des einschlägigen Vokabulars wichtig, denn die Akkulturation der Römer/Romanen an die Substratbevölkerung tritt in diesem zentralen Ausschnitt der traditionellen Lebenswelt exemplarisch klar hervor.

Vergleichsdaten sind nach Maßgabe möglicher Quellen und bestehender Kooperationen für die folgenden Gebiete geplant:

  • die Pyrenäen auf der Grundlage retrodigitalisierter Atlasdaten (ALF, ALG, ALPI) sowie unveröffentlichter Daten von Kooperationspartnern (Myriam Bras, Marianne Vergez-Couret),  #?baskische Dialektdaten?# -> Marianne/Myriam fragen#,
  • #?das südliche Zentralmassif?#,
  • Sardinien  auf der Grundlage retrodigitalisierter Atlasdaten (AIS), #wieviel haben wir da schon?#
  • die Gebirgsregion der Madonie auf Sizilien durch die wenig aufwändige Integration der Daten des Partnerprojekts  Atlante Linguistico della Sicilia online (Carta geo-etnolinguistica: pastorizia, caccia),
  • #?punktuell das Aromunische in Albanien und Griechenland durch Auswertung von Kahl 2008 (Hirten in Kontakt. Sprach- und Kulturwandel ehemaliger Wanderhirten in Epirus und Südalbanien. Münster, Wien, New York, 2008) sowie durch Daten von Kooperationspartner (Thede Kahl, Elton Prifti)?#.

Darüber hinaus werden für alle genannten Gebiete neue Daten über das bereits gut erprobte Crowdsourcing-Tool (mit entsprechend erweitertem Ortsnetz) erhoben.

mit erweiteretem   für Aromunen in SO-Europa (

Wie vorgesehen

im geplanten

Stellen / Volumen

(a) 1 Koordination 65%: Christina Mutter, Gesamtkoordination der am Projekt beteiligten Mitarbeiter; Etat- und Personalverwaltung; Überwachung von Workflows, Pflege des Projektportals (inkl. Anfertigung von Übersetzungen bzw. entsprechende Delegierung); Qualitätssicherung; Öffentlichkeitsarbeit; Verwaltung Crowdsourcing (Moderation, Kontaktpflege, Kooperation im romanischen Sprachgebiet in enger Abstimmung mit (b) ); Präsentation von Projektarbeit und -ergebnissen auf nationalen und internationalen Kongressen.

(b) 1 Germanistik 65%: Markus Kunzmann, Typisierung alemannischer, bairischer und slawischer Belege; Verwaltung Crowdsourcing (Moderation, Kontaktpflege, Kooperation im germanischen und slavischen Sprachgebiet in enger Abstimmung mit (a) ); wissenschaftliche Auswertung des gesammelten Materials (Publikationstätigkeit); Präsentation von Projektarbeit und -ergebnissen auf nationalen und internationalen Kongressen.

(c) 1 Romanistik 65%: Beatrice Colcuc, Typisierung romanischer Belege; wissenschaftliche Auswertung des gesammelten Materials (Publikationstätigkeit); Präsentation von Projektarbeit und -ergebnissen auf nationalen und internationalen Kongressen.

(d) 1 Informatik 65%: Florian Zacherl, Systemarchitektur, Datenmodellierung, Schnittstellenentwicklung (u.a. RDF-/LLOD-Export; Betrieb und Pflege der API), Entwicklung von Algorithmen zur Datenanalyse (u.a. Dialektometrie); Modellierung der Chronoreferenzierung; Konzeption und Umsetzung von Nachhaltigkeitsstrategien in enger (bereits bewährter) Zusammenarbeit mit der UB der LMU; Überwachung der Einhaltung der FAIR-Kriterien; Normdatenverwaltung; Dokumentation und Reflexion der entwickelten Verfahren sowie entsprechende Publikationstätigkeit.

(e) 1 Informatik 65%: David Englmeier, Webdesign: Visualisierung/Kartierung (u.a. der dialektometrischen Daten; Implementierung der Visualisierung der Chronoreferenzierung), Nutzerschnittstelle (inkl. Konzeption von Usability), Entwicklung von Konzepten des Crowdsourcings; Dokumentation und Reflexion der entwickelten Verfahren sowie entsprechende Publikationstätigkeit.

(f) 2 HK 10 Std/Woche: Transkription, Annotation, Typisierung, Übersetzung von Inhalten des Projektportals

Beginn: 1.10.2020, 3 Jahre = 12 Quartale (Q)

Arbeitsplan

Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 Q11 Q12
Öffentlichkeitsarbeit u. Kontaktpflege; Überwachung Workflows; Qualitätssicherung; allg. Verwaltung (a)
technische Anpassung
Crowdsourc.
(e)
Webdesign (e)
Systementw. (d)
Dialektometrie (d) (e)
Chronoref. (d) (e)
Verwaltung
Crowdsourc.
(a) (b)
Typis. Pyrenäen (c)
Typis. Sardinien (c)
Typis. Sizilien (c)
Typis. Aromunen (c)
Typis. Deu. Daten (b)
Typis. Slaw. Daten (b)
Dokumentation
Workflows u. Code
(d) (e)
Schnittstellenentw. u.
-pflege
Normdatenverwaltg.
(d)
Vortrags- u. Publikationstätigkeit (a) (b) (c) (d) (e)
Planung u. Durchführung: Nachhaltige Verfügbarkeit d. Projektdaten (d)
Transkr.
Übers.
(f)

RESTE###

Da die grundlegende Bedeutung dieser zweiten Thematik in der romanistischen und italianistischen Geolinguistik weithin noch nicht erkannt worden zu sein scheint, wurde er ganz entschieden in den Vordergrund dieses Arbeitsberichts gestellt

Prozeduren/Module #welche? PVA#

Tools #welche Transkriptionstool, CS-Tool, Typisierungstool, WebGL?#

F

A

– #auch I???# Die in VA1 noch durch Googlemaps gestützte Kartierung wurde durch eine Kartierung auf Basis des open source–Dienstes OpenStreetMaps, Leaflet WebGL ersetzt

  1. OSM: einer von 6 oder 7 Tile-Services, den VA nutzt: die Tile-Services werden sozusagen als Hintergrund für die Karte genutzt, sind alle frei verfügbar, die meisten sind open source

Leaflet: ist eine Karten-API, die die Logik für die Karte umsetzt

WebGL: ist eine Grafik-API, die genutzt wird, um größere Datenmengen darzustellen. Ist als Leaflet-Layer implementiert => Interaktion von Leaflet wird mit WebGL synchronisiert.

OSM = Anbieter
Leaflet + WebGL = Bibliotheken

I

durch API (Lücke, S.: s.v. “API”, in: VerbaAlpina-de 19/1, Methodologie, https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D493%26db%3D191%26letter%3DA%23138

  1. I: Die Konsistenz der Konzeption und die Leistungsfähigkeit der entwickelten Prozeduren und Tools zeigt sich in der Attraktibvität für andere Projekte, so im Fall des ALS online und des #APPI#. #andere, LEI online?#ALD neu#

R

?Die Öffentlichkeitsarbeit und wissenschaftliche Vortragstätigkeit wurden sehr aktiv fortgeführt.?

 

VerbaAlpina stellt jedem Projektpartner eine eigene MySQL-Datenbank zur Verfügung, die auf dem selben Datenbankcluster betrieben wird wie die VerbaAlpina-Datenbank. Art und Umfang der Nutzung dieser Datenbanken ist sehr unterschiedlich. Hervorzuheben ist, dass aktuell systematisch und in größerem Umfang lexikalisches Material aus dem Atlante linguistico della Sicilia (ALS) in die entsprechende Partnerdatenbank (PVA_ALS) übertragen wird. Dabei handelt es sich um Sprachdaten aus den Madonie, einem an der Nordküste Siziliens gelegenen Gebirge, in dem traditionell auch Vieh- und Milchwirtschaft betrieben wird. Die in die Partnerdatenbank übertragenen Daten werden automatisch auch auf dem von der ITG betriebenen online-Portal mit integrierter interaktiver Karte visualisiert (http://www.als-online.gwi.uni-muenchen.de/carta/). Aus onomasiologischer Perspektive ist das Material des ALS in weiten Teilen kongruent zu dem von VerbaAlpina gesammelten Material aus dem Alpenraum und eröffnet somit erweiterte Möglichkeiten, überregionale Zusammenhänge zu erkennen, wie dies im Rahmen des Projekts exemplarisch schon erfolgt ist (s. Krefeld, T.: s.v. “tomme / toma (f. (roa.)”, in: VerbaAlpina-de 18/2, Lexicon alpinum, https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D2374%26db%3D182%23L616 ). Die logische Verknüpfung zwischen dem Datenbestand in PVA_ALS mit dem VA-Datenbestand stellt allerdings eine große Herausforderung dar, die im Rahmen von VerbaAlpina bestenfalls skizzenhaft verwirklicht werden kann. In der Praxis würde die Verschränkung der beiden Datenbestände durch die wechselseitige Zuweisung der Konzepte und morpholexikalischen Typen zu einer gemeinsamen, zentralen Normdateninstanz erfolgen. Nach Vorstellung von VerbaAlpina könnte dies modellhaft für die Entwicklung einer universalen Lexikographie sein, die zeit- und raumübergreifend (nicht nur) lexikalische Zusammenhänge sichtbar werden lassen könnte.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.