Archiv des Autors: TKrefeld

VerbaAlpina erklärt sich selbst (in 10 Sätzen) (Zitieren)

Thomas Krefeld
(282 Wörter)

Dieser Beitrag versteht sich als eine Vorstellung des Projekts VerbaAlpina (VA) in 10 Kernsätzen; es handelt sich jedoch nicht um einen Beitrag ÜBER das Projekt, denn das Projekts präsentiert sich gewissermaßen selbst  in Gestalt ausgewählter Zitate und Materialien, die auch unabhängig von dieser Vorstellung über die Nutzeroberfläche abrufbar sind. Im Vordergrund steht die sprachwissenschaftliche Seite – die informationstechnische Seite wird im komplementären Vortrag von Stephan Lücke in den Vordergrund gestellt. Grundsätzlich handelt es sich jedoch um die beiden untrennbaren Seiten ein und derselben Medaille.

 

  1. VA ist eine webbasierte Forschungsumgebung.
  2. Gegenstand von VA ist der dialektale Wortschatz  der drei Sprachfamilien im Alpenraum (Karte).
  3. VA integriert unterschiedliche georeferenzierbare Quellen, nämlich Sprachatlanten, Wörterbücher und Crowdsourcing.
  4. VA dokumentiert Wortareale, die nicht selten die Grenzen einer der drei Sprachfamilien überschreiten und versteht sich daher als interlinguale Geolinguistik.
  5. Die Auswahl des dokumentierten Wortschatzes erfolgt in der Tradition der romanistischen Ethnolinguistik.
  6. VA visualisiert den erfassten Wortschatz durch eine interaktive Karte.
  7. Die interaktive Karte wird vom Nutzer über komplementäre Filter gesteuert, die einerseits von der Sache, dem außersprachlichen KONZEPT, und andererseits, vom Wort, der dialektalen Bezeichnung, ausgehen.
  8. Jede interaktive Karte verweist auf Referenzwörterbücher und vermittelt so vielfältige  lexikographische Hinweise zu jeder dokumentierten Form, wie z.B. alemannische Bezeichnung Anke(n) ‘Butter’ in Grindelwald (Berner Oberland) oder die romanische Bezeichnung barko ‘Almstall’ in Strigno (Trentino) zeigen.
  9. Das Lexicon Alpinum gibt gelegentlich auch projekteigene Kommentare, wie im Fall von Anke (m.) (gem.), in jedem Fall jedoch Normdaten (Q-IDs),  die das jeweilige außersprachliche Konzept identifizieren und die mit einem Link auf das Wikidata-Projekt hinterlegt sind, wie z.B. im Fall von BUTTERFASS.
  10. VerbaAlpina folgt den FAIR-Prinzipien und leistet dadurch einen konstruktiven Beitrag zur Überführung der Sprachwissenschaft in die Digital Humanities.

Neue Romania (Zitieren)

TKrefeld
(1984 Wörter)
  1. global#

Mit einem reichlich vagen Ausdruck werden Französisch, Spanisch und Portugiesisch daher auch als ‘Weltsprachen’ bezeichnet; damit wird in unklarer Weise sowohl auf ihre Verbreitung als Erstsprache (L1) wie als Fremdsprache (L2) angespielt.

  1. #

Für die Tatsache, dass es sich die Sprachen der europäischen Kolonisten im globalen Maßstab so massiv auf Kosten der präkolonialen Sprachen etablieren konnten, gibt es unterschiedliche Gründe, die mit der Kolonisierung zusammenhängen; sie lassen sich unter dem polemischen aber durchaus gerechtfertigten französischen Schlagwort der glottophagie ‚Sprachenfresserei‘ zusammenfassen, das von Jean-Louis Calvet 1974 geprägt wurde #Dieser Ausdruck wurde offenkundig nach dem Muster von fra. anthropophagie ‚Menschenfresserei‘ gebildet.#:

  • Die vorkoloniale Bevölkerung wurde je nach Zeit und Gegend verfolgt und war teils systematischem Genozid ausgesetzt (so vor allem in Uruguay).
  • Nach der Unabhängigkeit wurde der koloniale Gebrauch der europäischen Sprachen in Verwaltung, Bildungseinrichtungen und öffentlichen Medien fortgesetzt.
  • Ein Teil der kolonialen Bevölkerung indigener Herkunft vollzog im Zuge der Akkulturation einen Wechsel zu den europäischen Sprachen  der Kolonisten; aus dieser Tradition entwickelte sich im frankophonen Kontext  die politisch, ideologisch und literarisch auch über Frankeich hinaus einflussreiche négritude-Bewegung; das Kozept wurde 1935 von Aimé Césaire geprägt (« Conscience raciale et révolution sociale », L’Étudiant Noir, journal mensuel de l’association des étudiants martiniquais en France, mai-juin 1935 http://www.letudiantnoir.com/).
  • Die Territorien der postkolonialen Staaten sind historisch willkürlich zustande gekommen; sie lassen sich nicht auf einzelne Sprachgemeinschaften abbilden, sondern umfassen oft sehr vielsprachigen Regionen, ohne entwickelte Schriftlichkeit; die Beibehaltung des kolonialen Sprachgebrauchs beugt Konflikten zwischen Gemeinschaften vor, die entstünden (und teils auch entstanden sind), wenn jeweils eine spezifische indigene Sprache auf Kosten anderer implementiert und offizialisiert würde; allein in Brasilien werden 160 unterschiedliche indigene Sprachen gesprochen, die zu 19 Sprachfamilien gruppiert werden können Überblick und in den beiden benachbarten République du Congo und République démocractique du Conge( früher: Zaire)  mehr als 200 Sprachen und .
  • Manche Kolonien wechselten im Laufe der Geschichte (auch mehrfach) den Besitzer bzw. ihre staatliche Zugehörigkeit, so dass unter Umständen sogar mehrere europäische Sprachen als Staatssprachen eingesetzt wurden (so zum Beispiel Spanisch und Englisch in Puerto Rico; Französisch und Englisch in Kamerun; Spanisch, Portugiesisch und Französisch in Äquatorialguinea).

Auf der Basis der romanischen Sprachen – das gilt vor allem für das Französische und das Portugiesische – haben sich vor allem in manchen Gebieten während der Kolonialzeit Sprachen  so genannte Kreolsprachen entwickelt (vgl. Vorlesung vom ##), die nicht mehr zu den romanischen Sprachen gerechnet werden. Allerdings sind die Sprecher der Kreolsprachen  zunehmend zweisprachig, was zu ausgeprägtem Sprachkontakt und einer strukturellen und lexikalischen Wiederannäherung der Kreolsprachen an die historisch´zu Grunde liegenden Sprachen der ehemaligen Kolonialmächte führt; diese Konstellationen, die in erster Linie die französisch basierten Kreols betreffen, werden als post-creole continuum bezeichnet.

Die Unterschiede zwischen den spanisch-, portugiesisch- und französischsprachigen Gebieten der Neuen Romania einerseits und innerhalb der drei genannten Gebiete andererseits sind so erheblich, dass es jeder Staat für sich untersucht werden müsste. Dabei sollten in jedem Fall die folgenden Parameter berücksichtigt werden:

  • Mit welche indigenen und womöglich später hinzugekommenen Sprachen stehen die romanischen Sprachen in Kontakt?
  • Wie ist das Verhältnis von L1- und L2-Sprechern?
  • Gibt es zusätzlich zur jeweiligen romanischen Sprache eine romanisch basierte Kreolsprache?
  1. Spanisch#

Aus den ehemals spanischen Kolonialgebieten entstanden Nationalstaaten, die mit wenigen Ausnahmen (wie z.B. die Philippinen seit 1987) das Spanische als Staatssprache beibehalten haben; in einigen Fällen wurden indigene Sprachen kooffizialisiert #einfügen#.

  1. Portugiesisch#

Überblick Im Fall des Portugiesischen ist das

Die lusophonen Staaten sind in der Comunidade dos Paises de Lingua Portuguesa, der Gemeinschaft_der_Portugiesischsprachigen_L%C3%A4nder, zusammengeschlossen; im Hinblick auf die Größe und kulturelle Vielfalt der vertretenen Weltregionen spielt das historische Ausgangsland, Portugal, nurmehr eine eine periphere Rolle.

Allerdings ist bemerkenswert, dass es selbst in der portugiesischsprachigen Welt und hier speziell in Brasilien, ebenso wenig wie in der frankophonen oder hispanophonen, bislang noch nicht zur expliziten Kodifizierung und Implementierung nationaler Sprachstandards gekommen ist.

  1. Französisch#

Die ehemals französischen Kolonialgebiete nahmen eine divergente Entwicklung (Überblick) , denn aus ihnen wurden teils eigene Nationalstaaten (so überall in Afrika), teils Provinzen von Nationalstaaten (Québec, Lousiana), teils aber auch französische Departements (Guadeloupe, Französisch-Guayana, Martinique, Mayotte, La Réunion) oder weitgehend autonome Gebiete (die sogenannten Collecitivités d’outre mermit enger politischer Anbindung an Frankreich (z.B. Französisch-Polynesien). Im Unterschied zu den portugiesisch- und spanischsprachigen Gebieten der Neuen Romania sind die französischsprachigen Gegenden mindestens teilweise in die nach wie vor stark zentralistischen Strukturen Frankreichs eingebunden.  

https://en.wikipedia.org/wiki/Louisiana_French

Obwohl die teils kleinen frankophonen Gebiete außerordentlich weit voneinander entfernt sind gibt es gelegentlich bemerkenswerte, durchaus standardferne Parallelen, wie an einem toponomastischen Beispiel angedeutet werden soll; sowohl in der Karibik wie auch im Indischen Ozean sehr weit verbreitet sind zwei Landschaftsbezeichnungen, die in Frankreich selbst zwar vorkommen, aber nur sehr selten belegt sind: morne ‘Hügel’ und piton ‘(spitzer) Gipfel’:

MORNE2, subst. masc.
[Principalement dans une île ou sur un littoral] Colline, montagne. Un gros morne la termine [une île] à chacune de ses extrémités; et un pic, ou plutôt un volcan, à en juger par sa forme, s’élève au milieu (Voy. La Pérouse, t.3, 1797, p.96). Aux Gonaïves, près du Port-au-Prince. On voit une habitation en ruine sur les flancs élevés d’un morne qui domine une rade (LAMART., T. Louverture, 1850, I, 1, p.1263). Le côté de l’est est barré par de hauts mornes ferrugineux qu’enserre et couronne le bleu de la mer (T’SERSTEVENS, Itinér. esp., 1933, p.88).
Prononc. et Orth.: []. Att. ds Ac. dep. 1798. Étymol. et Hist. 1640 (BOUTON, Relation de l’establissement des François depuis l’an 1635 dans l’Isle de la Martinique, p.30). Mot du créole des Antilles qui s’est répandu ensuite aux créoles de la Réunion, d’Haïti et de la Martinique, d’orig. incertaine (cf. FEW t.21, p.15a). Peut-être issu, par altération, de l’esp. morro «monticule, rocher» (1591 ds COR.-PASC.) qui représente un type *murrum, du rad. prérom. *murr-, v.moraine et morion1Cf. BL.-W.1-5 et CHAUDENSON, Le Lex. du parler créole de la Réunion, t.1, p.619. Fréq. V. morne1Bbg. DULONG (G.). Le Mot morne en canad. fr. In: Congrès Internat. Des Sc. Onom. Wien, 1969, t.1, pp.255-258. (TLFI s.v. morne)

PITON, subst. masc.
I. Clou ou vis à tête recourbée ou en forme d’anneau servant à recevoir un crochet, l’anse d’un cadenas, une tringle, etc. Fixer, planter, visser un piton au mur. Il tailla le bois du pupitre avec son canif, et fit tant qu’il déchaussa le piton de fer dans lequel le cadenas était accroché (CHAMPFL., Souffr. profess. Delteil, 1853, p.35). Un de ces jeunes hommes blonds (…) était monté sur la table et glissait l’autre bout de la corde dans un gros piton qui était enfoncé dans une poutre du plafond (G. LEROUX, Roul. tsar, 1912, p.157). V. agripper ex. 7.
 ALPIN. ,,Broche métallique constituée d’une lame et d’une tête qui comporte un oeil pour le passage du mousqueton dans lequel coulisse la corde„ utilisée pour l’escalade artificielle (PETIOT 1982). Piton de rocher, piton à glace; piton d’assurance, de passage, de rappel, de renvoi, de sécurité. La corde, je l’avais montée au lac Noir, avec des pitons et des anneaux. Je voulais fixer les pitons à l’endroit d’où mon enfant avait roulé, et me laisser descendre moi-même le long de la corde jusqu’à ce que je le retrouve (PEYRÉ, Matterhorn, 1939, p.155):

[…] II. GÉOGR. Sommet pointu et dénudé d’une montagne, en partic., aux Antilles et à la Réunion. Le piton des Neiges à la Réunion. Bourbon n’est à vrai dire, qu’un cône immense (…) dont les gigantesques pitons s’élèvent à la hauteur de seize cents toises (SAND, Indiana, 1832, p.237). Au crépuscule on entendait un bourdonnement: c’était la tante de Charles Lacoste qui, désolée d’avoir quitté ses pitons et ses mornes, effleurait du doigt sa guitare (JAMMES, Mém., 1922, p.14).

 P. anal.
Relief isolé de forme conique, monticule aigu difficile à escalader. Piton rocheux, volcanique; escalader un piton. Un piton qui s’enlevait à brusques arêtes, une sorte de pyramide tronquée, au bout d’une longue falaise noire (VERCEL, Cap. Conan, 1934, p.205): […] Étymol. et Hist.I. 1. 1382 «clou dont la tête est en forme d’anneau» (Doc. ap. Ch. BRÉARD, Compte du Clos des Galées de Rouen, p.82); 2. 1884 alpin. (Annuaire du Club alpin fr., Année 1883 ds QUEM. DDL t.27); 3. région. a) 1930 «bouton de sonnette, de montre» (Canada); b) 1930 être sur le piton (ibid.)II. 1640 [éd.] géogr. (BOUTON, Relation de l’establissement des Français depuis l’an 1635 en l’isle de la Martinique, p.31); 1862 arg. (LARCH., p.250). I piton «clou» a été introduit dans le nord de la France par les constructeurs de bateaux du Midi; dér. du prov. pitar «picorer, picoter», lui-même dér. du rad. pitt-, désignant quelque chose de pointu (v. pite1); suff. -on1*. II prob. issu, par l’intermédiaire du parler de la Martinique (cf. BOUTON, supra) où le mot semble avoir été apporté par les colonisateurs venus de Gascogne ou éventuellement du nord de l’Espagne (cf. béarnais pitoû «élévation» ds FEW t.8, p.612b), du sens de «corne qui commence à pousser (chez les chevreaux, les agneaux), pointe de la corne du taureau; rejeton d’un arbre qui commence à bourgeonner» qu’a l’esp. piton au XVIIes. (v. COR.-PASC., s.v. pito et AL.), lui-même dér. de pitt-, v. supra. Voir FEW t.8, pp.612a-614b. Fréq. abs. littér.: 73. Bbg. QUEM. DDL t.27. WEIL (A.). En Marge d’un nouv. dict. R. Philol. fr. 1932, t.45, pp.31-32. (TLFi, s.v. piton) #http://stella.atilf.fr/#

Karibik/Indischer Ozean

[map lat=“5.32036″ lng=“-4.01611″]

[marker lat=“14.69493″ lng=“-61.11460″]Morne Chapeau Nègre[/marker]

[marker lat=“14.70153″ lng=“-61.11441″ colour=“blue“]Petit Piton[/marker]

[marker lat=“15.86873″ lng=“-61.57628″]Morne Rouge[/marker]

[marker lat=“16.28008″ lng=“-61.76034″ colour=“blue“]Piton Grand Fond[/marker]

[marker lat=“16.28874″ lng=“-61.76544″]Morne Mazeau[/marker]

[/map]

[marker lat=“-20.09585″ lng=“57.63497″ colour=“blue“]Piton, Dorf (Mautitius)[/marker]

[marker lat=“-20.44063006 lng=“57.33358973″]Le Morne, Berg (Mauritius)[/marker]

[marker lat=“-20.4586107″ lng=“57.4933333″]Piton Poule, Berg (Mauritius)[/marker]

[marker lat=“-17.58373″ lng=“-149.49182″ colour=“blue“]Piton de Pirae, Berg (Tahiti, Französisch Polynesien)[/marker]

morne in Québec

[marker lat =“49.22748″ lng=“-65.57430″]Le Morne[/marker]

[marker lat =“46.47171″ lng=“-70.45107″]Le Morne[/marker]

[marker lat=“46.31399″ lng=“-70.50604″]Le Morne[/marker]

in F nur ganz selten, morne auf OSM 4 Treffer, piton af OSM 6 Treffer

[marker lat =“44.39464″ lng=“2.61096″]La Morne[/marker]

[marker lat =“45.52332″ lng=“4.92062″]Le Morne[/marker]

[marker lat =“46.75534″ lng=“-1.14601″]Le Morne[/marker]

[marker lat=“47.08685″ lng=“-1.70430″]La Morne (Sumpf)][/marker]

 

[marker lat=“44.06317″ lng=“1.93696″ colour=“blue“]Le Piton[/marker]

[marker lat=“43.71739″ lng=“-0.29694″ colour=“blue“]Piton[/marker]

[marker lat=“44.38814″ lng=“-0.98994″ colour=“blue“]Piton[/marker]

[marker lat=“43.71739″ lng=“-0.29694″ colour=“blue“]Piton[/marker]

[marker lat=“44.32880″ lng=“0.14894″ colour=“blue“]Piton[/marker]

[marker lat=“44.21269″ lng=“0.31209″ colour=“blue“]Piton[/marker]

[marker lat=““ lng=““ colour=“blue“][/marker]

Die Erklärung dieser ‘kolonialfranzösischen’ Gemeinsamkeiten ist nicht leicht; die im zitierten Artikel des Trésor de la langue française vorgeschlagene Ausbreitung („Mot du créole des Antilles qui s’est répandu ensuite aux créoles de la Réunion, d’Haïti et de la Martinique“) ist jedenfalls historisch nicht sehr plausibel; es liegt näher an eine größere Verbreitung der einschlägigen Formen im gesprochenen Französischen des 17. Jahrhunderts zu denken.

 

https://fr.wikipedia.org/wiki/Fran%C3%A7ais_qu%C3%A9b%C3%A9cois#Phonologie_et_phon%C3%A9tique

  • tu se prononce [t͡sy]
  • dîner se prononce [d͡zine]
  • lit [lit], moi [mwε] anstatt [mwa] oder froid [frεt]

https://apps.atilf.fr/lecteurFEW/index.php/page/lire/e/173651

 

nicht sehr wahrscheinlich , d’orig. incertaine (cf. FEW t.21, p.15a). Peut-être issu, par altération, de l’esp. morro «monticule, rocher» (1591 ds COR.-PASC.) qui représente un type *murrum, du rad. prérom. *murr-, v.moraine et morion1.

portunhol (https://de.wikipedia.org/wiki/Portu%C3%B1ol), lumfardo (< ita. lombardo ‘lombardisch’ ) https://en.wikipedia.org/wiki/Rioplatense_Spanish, porteño

Biblio

Povos indígenas no Brasil

Kassel_Reste (Zitieren)

TKrefeld
(214 Wörter)

Die einzelnen Schriftvarietäten werden darüber hinaus in englischer Bezeichnung aufgeführt und durch einen speziellen ; aber sie lassen nicht mehr durch einen Code identifizieren Glottolog. Im Unterschied zum Ethnologue fehlen auch die Selbstbezeichnungen (vgl. Link).

Die darstellung im  ist grundsätzlich ähnlich, aber sc

https://www.ethnologue.com/language/roh

 

deu und L 482

Dialekt (unvollständig) ISO-693.3 Sprache Sprachfamilie
Tirolerisch Bairisch Deutsch
Walserisch ger
Zimbrisch

Es ist also kein Wunder, dass es in informationstechnischer Sicht ebenfalls an eindeutigen und brauchbaren Identifikatoren mangelt.

nicht accessible disqulifizieren sich hier selbst

roh https://iso639-3.sil.org/code/roh (=romansh)

  1. nicht bsi zur eigentlich basalen Int´stanz, dem Sprecher, sondern bis LokDial, Typis.

 

selva di Progno, cimbri ob minderheit oder nicht ist unerneblich

Walsergemeinden

 

val resia Benacchio 2011

per def. keine standardformen

  1. markanter Unterschied: Territorial#
Dialekt (unvollständig) ISO-693.3 Sprache Sprachfamilie
Valdostano / Valdôtain  Valdostano / Valdôtain  rom
Occitan  Okzitanisch
Francoprovençal  Frankoprovenzalisch
Puter Bündnerromanisch Rätoromanisch
Surmiran
Sursilvan
Sutsilvan
Vallader
Jauer
Badiot Dolomitenladinisch
Maréo
Gherdëina
Fascian
Anpezan
Fodom
Furlan  Friaulisch

 

 

einer  Grundprinzip

Geolinguistik, Kleinsprachen und die FAIR-Prinzipien (am Beispiel von VerbaAlpina) (Zitieren)

Thomas Krefeld | Stephan Lücke
(1788 Wörter)

Dieser Beitrag wurde für die Sektion Rekonstruktion und Erneuerung romanischer Regional- oder Minderheitensprachen im Zeitalter der Digital Humanities des XXXVI. Deutschen Romanistentags verfasst. Der genannte Sektionstitel eröffnet einen außerordentlich weiten Horizont; denn die Ausdrücke, die er zusammenbringt, weisen

  • in die Sprachgeschichte (‘Rekonstruktion’);
  • in die Sprachplanung (‘Erneuerung’);
  • in den Sprachvergleich (‘romanisch’);
  • in die Geolinguistik (‘Regional-’);
  • in die Sprachpolitik (‘Minderheiten-’);
  • in die Sprachsoziologie (‘-sprache)’);
  • in die Neuen Medien (‘Digital Humanities’).

Unser Beitrag ist zwar in der Geolinguistik und in den Neuen Medien zentriert, aber Perspektiven für die anderen Felder lassen sich leicht daraus ableiten, wie angedeutet werden wird.

Romanische Geolinguistik

Ziel des Projekts VerbaAlpina (VA) ist die kleinräumige, d.h. lokale Erfassung des spezifisch alpinen Wortschatzes in den drei im Untersuchungsgebiet gesprochenen Sprachfamilien (Germanisch, Romanisch, Slawisch). Diese systematische Erweiterung der traditionell einzelsprachlichen Dialektologie ist sinnvoll, da zahlreiche Bezeichnungstypen über die Grenzen nur einer Sprachfamilie hinaus verbreitet sind; diese Ausdrücke wurden daher nicht zu Unrecht als Alpenwörter bezeichnet. Die Konzeption, der VA verpflichtet ist, lässt sich als interlinguale Geolinguistik charakterisieren, da Varianten aus mehreren Einzelsprachen zusammengebracht werden; Berücksichtigung finden jedoch ausschließlich georeferenzierbare Belege, wobei  die politische Gemeinde als Bezugseinheit der  Georeferenzierung fungiert. Das potentielle Netz umfasst alle 6990 Gemeinden der so genannten Alpenkonvention.

Dieser Voraussetzung genügen im wesentlichen zwei Typen von Quellen: grundsätzlich die Sprachatlanten und – wenngleich nicht im Grundsatz, sondern im Idealfall – die dialektale Lexikographie. Sobald diese gemeinsame Voraussetzung der Georeferenzierbarkeit gegeben ist, lassen sich beide Quellentypen auch komplementär darstellen, wie es auf den VA-Karten geschieht. So illustriert dieser Kartenausschnitt den Einbezug des DizMT, der einen einzigen Lokaldialekt thesauriert.

Überblicksartige Darstellungen, wie auf der gerade genannten Beispielkarte, sind jedoch nur möglich, wenn die nicht selten zahlreichen lokalen Einheiten zu Gruppen zusammengefasst werden, so wie formˈavo, fromˈazo, fryˈmai, furˈmaj, furmˈaʧ usw., die alle das Konzept KÄSE bezeichnen. Durch die Gruppierung werden die Belege zu Varianten abstrakterer Typen. Systematisch unterschieden werden in VA sogenannte ‘morpho-lexikalische Typen’ und ‘Basistypen’ (vgl. Typisierung; die morpholexikalischen Typen definieren sich über die Wortart, die Konstituenten des Worts (Basis [+ Wortbildungsmorphem]), im Fall von Nomina zudem über das Genus sowie über die Sprachfamilie; nun ist es praktisch, die Typen (d.h. die Klassen von Varianten) auch durch sprachliche Einheiten identifizieren zu können; dazu werden in VA die am besten bekannten/am weitesten verbreiteten Varianten gewählt, also die standardsprachlichen Äquivalente. So wird der morpholexikalische Typ, zu dem alle genannten Beispiele sowie 368 weitere (Stand: 17.9.2019) gehören, durch standardfra. fromage/standardita. formaggio identifiziert.

Noch abstrakter sind die Basistypen; sie gestatten es morpho-lexikalische Typen zu gruppieren, wenn sie eine gemeinsame historische Basis haben; das gilt auch für morpho-lexikalische Typen unterschiedlicher Sprachfamilien, also im Fall von Entlehnungen.   So werden die morpho-lexikalischen Typen fra. fromage/ita. formaggio (m.), formaggia (f.), fra. forme/ita. forma zum Basistyp lat. forma(m) gebündelt oder schweizerdeu. staafel, fra. étable (f.), ita. stabbio (m.) zum Basistyp lat. stabulum.

FAIR

  1. auf der Basis des Ladinia-Arbeitsberichts
  1. Stephan#

Lokale Belege, Typen virtuelle Repräsentation#

Wie die FAIR-Kriterien nun im Einzelnen ausbuchstabiert werden sollten, ist jedoch nicht eindeutig zu beantworten, denn es ergeben sich unterschiedliche Möglichkeiten. Ein geolinguistisches Modell für die virtuelle Abbildung dialektaler Kontinua wird von VerbaAlpina entwickelt. Grundlegend für die Identifikation der Daten ist darin die Georeferenzierung, die auf der Ebene der politischen Gemeinde erfolgt. Zusätzlich zu den Geodaten wird jeder Sprachbeleg einer der drei alpinen Sprachfamilien zugeordnet.

Die Zugehörigkeit kann übrigens nicht automatisch von der Gemeinde auf die Daten ‚vererbt‘ werden, denn es gibt durchaus zweisprachige Orte; so wurden für Selva di Progno oberhalb von Verona von Nutzern des CS–Tools germanische und romanische Belege geliefert, wie der Ausschnitt zeigt:

Zufälliger Ausschnitt aus den Crowd-Daten aus Selva di Progno

Zufälliger Ausschnitt aus den Crowd-Daten aus Selva di Progno

Die Zweisprachigkeit der gelieferten Materialien ist im Übrigen keineswegs überraschend, denn zur Gemeinde gehört die zimbrische Sprachinsel Ljetzan (ita. Giazza). Eine genauere Georeferenzierung auf diese frazione wäre übrigens auch keine Lösung, denn das Zimbrische ist in rapidem Rückgang begriffen, so dass auch im Ortsteil Ljetzan mittlerweile ganz überwiegend  eine romanische Varietät gesprochen wird.

Mit den Geokoordinaten und der Zuweisung einer Sprachfamilie ist eine lokal erhobene sprachliche Einheit hinreichend charakterisiert, um sie eindeutig im Dialektkontinuum zu verankern. Damit die lokalen sprachlichen Einheiten außerdem auch lexikologisch  identifiziert werden, weist VA ihnen (wie eingangs gesagt) einen möglichst weitverbreiteten, im Idealfall standardsprachlichen morpho-lexikalischen Typ zu, wie z.B. im Fall der im Ausschnitt gezeigten Form knest ‘Gehilfe des Hirten’ das deu. Knecht.

Geolinguistische Identifikatoren

Allerdings lassen sich aus der Tatsache, dass diese lokale Form  knest (sowie mehr oder weniger viele andere desselben Ortes auch) sich als Variante eines Typs erweist, für den es auch eine standarddeu. Variante gibt (Knecht) auch nicht im Ansatz Argumente gewinnen, ob man das lokale Zimbrische womöglich als eigenständige Sprache und nicht als Dialekt des Bairischen einstufen sollte.  Diese Frage stellt sich im germanisch- und slawischsprachigen Gebiet der Alpen ohnehin selten, allenfalls noch für das Walserische in manchen italienischen Walsergemeinden sowie für das  Rezijansko in der Val Resia.

Im Hinblick auf die geolinguistische Dokumentation, die in sprachwissenschaftlicher Perspektive unbedingt im Vordergrund stehen muss, ist der Unterschied sekundär und letztlich vollkommen unerheblich, denn jeder Erhebungsort hat potentiell ein mehr oder weniger spezifisches Idiom und alle diese lokalen Idiome sind im Hinblick auf das romanische Kontinuum gleichwertig – vollkommen unabhängig davon, ob ihr gesellschaftlicher Status als ‘Dialekt’ oder ‘Minderheitensprache’ eingestuft wird, oder ob sie in klassifikatorischer Absicht als ‘Kleinsprache’ oder ‘Subdialekt’ eines regional weiterverbreiteten Dialektverbunds eingeschätzt werden. Die romanische Situation muss man im Hinblick auf diese sprachsoziologischen und arealtypologischen Fragen als außerordentlich unübersichtlich bezeichnen. Ganz unterschiedlich motivierte Sprachnamen und klassifikatorische Kategorien werden oft vermischt.

Das Problem muss hier nicht im Detail beschrieben werden; es reicht ein Blick auf das Rätoromanische in der Schweiz.   Mit diesem Ausdruck wird in der Bundesverfassung eine der vier ‘Landessprachen’ bezeichnet. Im Art. 4  heißt es ganz lapidar:

„Die Landessprachen sind Deutsch, Französisch, Italienisch und Rätoromanisch.“1 (Bundesverfassung)

Es wird in Art. 70 weiterhin spezifiziert, dass diese Sprache auch ‘Amtssprache’ ist:

„Die Amtssprachen des Bundes sind Deutsch, Französisch und Italienisch. Im Verkehr mit Personen rätoromanischer Sprache ist auch das Rätoromanische Amtssprache des Bundes.“ (Art. 70 Sprachen)

Auch in der Verfassung des Kantons Graubünden ist vom ‘Rätoromanischen’ die Rede: 

„Art. 3 Sprachen
1 Deutsch, Rätoromanisch und Italienisch sind die gleichwertigen Landes- und Amtssprachen des Kantons.
[…]
3 Die Gemeinden bestimmen ihre Amts- und Schulsprachen im Rahmen ihrer Zuständigkeiten und im Zusammenwirken mit dem Kanton. Sie achten dabei auf die herkömmliche sprachliche Zusammensetzung und nehmen Rücksicht auf die angestammten sprachlichen Minderheiten.“ (VerfassungGR)

Dem verfassungsrechtlichen Gebrauch entspricht die Sprachkodierung in ISO 693-3 , denn dort ist ebenfalls für  ‚Rätoromanisch‘ (bzw. eng. Romansh) ein Identifikator vorgesehen, nämlich roh. Diese Kodierung lässt sich zwar als ein verlässliches Normdatum in geolinguistischen Metadatensätzen verwenden; es ist jedoch nicht genau genug, denn ‘das’ Rätoromanische in Graubünden existiert in Gestalt von mindestens 7 Varietäten, von denen 6 auch in der Schriftlichkeit ganz selbstverständlich und mit lang zurückreichender Tradition gebraucht werden.2 Daher sind weitere Sprachcodes erforderlich, die z.B. vom Wikidataprojekt oder vom Glottolog angeboten werden:3

Varietäten gemäß Lia Rumantscha Wikidata QID Glottolog Verfassungen CH, GR ISO-693.3
„Standardsprache“ Rumantsch Grischun „Rätoromanisch“ roh
„Schriftidiome“ Puter
Vallader Q690226 Lower Engadine
Surmiran Q690216 Surmiran-Albula
Sursilvan Q688348 Sursilvan
Sursilvan-Oberland
Sutsilvan Q688272 Sutsilvan
geprochener Dialekt Jauer Q690181

Man beachte, dass Wikidata das differenzierteste Angebot an IDs macht. Unabhängig davon, ob sie sich auf Dialekte oder (Klein)Sprachen beziehen, sind diese Codes mindestens dann für die geolinguistische Datenstrukturierung relevant, wenn sie in Referenzwörterbüchern explizit erscheinen, wie zum Beispiel in S, V oder P.

Glottolog identifiziert zwar die „Schriftidiome“, bezeichnet sie jedoch teils (Puter, Vallader) nur mit englischen Termini. Darüber werden die in der Tabelle (Spalte Glottolog) identifizierten Idiome weiterhin auf der spezifischsten Ebene einer zwölfstufigen Hierarchie positioniert, die teils auf rezent geographischen, teils auf genealogischen Kriterien beruht (in Klammern steht die Anzahl der erfassten Sprachen)4:

Taxonomie des Glottolog

1.▼Indo-European (588)
  • Albanian (4)
  • Anatolian (10)
  • Armenic (3)
  • Balto-Slavic (23)
  • Celtic (14)
  • Dacian
  • Germanic (106)
  • Graeco-Phrygian (11)
  • Indo-Iranian (324)
  • 2.▼Italic (86)
    • 3.▼Latino-Faliscan (83)
      • Faliscan
      • 4.▼Latinic (82)
        • Imperial Latin (81)
          • 5.►Latin
          • Romance (80)
            • Eastern Romance (5)
            • 6.▼Italo-Western Romance (70)
              • Italo-Dalmatian (5)
              • 7.▼Western Romance (65)
                • 8.▼Shifted Western Romance (63)
                  • 9.▼Northwestern Shifted Romance (31)
                    • Gallo-Italian (8)
                    • 10.▼Gallo-Rhaetian (23)
                      • Friulian
                      • Ladin
                      • Oil (20)
                      • 11.▼Romansh
                        • Lower Engadine
                        • Rumantsch Grischun
                        • Surmiran-Albula
                        • Sursilvan
                        • Sursilvan-Oberland
                        • Sutsilvan
                        • Upper Engadine

Jede taxonomische Ebene ist durch einen (hier nicht wiedergegebenen) Identifikator ansprechbar, so dass sich natürlich die Frage erhebt, ob diese auf den ersten Blick elaborierte Taxonomie, speziell die sechs romanischen Stufen für die digitale Strukturierung geolinguistischer Kontinua aus der Romania – im Sinne der FAIR-Kriterien F und I (Findable, Interoperable) – einen nützlichen Fortschritt bedeutet. Die Antwort ist ebenso klar wie kurz: nein.

Es fehlt den Kategorien jedenfalls am Ort, wo sie bereitgestellt werden, jegliche Transparenz, da keine Daten hinterlegt sind und keinerlei Kriterien mitgeliefert werden, die sich auf konkrete Daten anwenden ließen; dazu müsste gesagt werden, wo z.B. der Westen („Western Romance“) beginnt, wie eine alternative Trennung in ‚Gallo-Italian‘ und ‚Gallo-Rhaetian‘ abgeleitet wird usw. Von der fehlenden  Operationalisierung dieser klassifikatorischen Kategorien abgesehen muss ganz grundsätzlich bezweifelt werden, ob sich derartige top down formulierte trennscharfe Klassifikatoren überhaupt auf Kontinua anwenden lassen. Der einzig mögliche Weg für eine raumbezogene Klassifikation geht bottom up durch die metrische Bestimmung gemeinsamer bzw. nicht-gemeinsamer Merkmale, also im Sinne einer induktiven, datengetriebenen Dialektometrie, deren Präsentation stets gestattet zu den zugrunde liegenden Daten zurückzugehen und insofern auch reusability verspricht. Voraussetzung dafür ist jedoch, dass nicht nur die lokalen Idiome, sondern alle relevanten sprachlichen Merkmale mit eindeutigen Identifikatoren versehen werden; Ansätze dazu finden sich bereits im bereits erwähnten Wikidataprojekt in Gestalt von QIDs für grammatische Kategorien und LIDs für lexikalische Typen. Dieser Bestand sollte durch alle geolinguistischen Projekte im Sinne der FAIR-Prinzipien systematisch ausgebaut werden. Angesichts dieser eigentlich fundamentalen Herausforderung ist die skizzierte Taxonomie nicht nur unnütz sondern schädlich.


  1. Französisch: „<span style="font-size: 1rem;">Les langues nationales sont l’allemand, le français, l’italien et le romanche.</span><span style="font-size: 1rem;">“ | Italienisch: „</span><span style="font-size: 1rem;">Le lingue nazionali sono il tedesco, il francese, l’italiano e il romancio.</span><span style="font-size: 1rem;">“ | Rätoromanisch: „Las linguas naziunalas èn il tudestg, il franzos, il talian ed il rumantsch.“ 

  2. Weitaus schwieriger ist die Frage der Klassifikation im Hinblick auf das Dolomitenladinische, da die Extension dieses Klassifikators außerordentlich umstritten ist. 

  3. Außerdem ist der <span style="font-size: 1rem;"><a href="https://www.ethnologue.com/language/roh" target="_BLANK">Ethnologue</a> zu nennen.</span> 

  4. Die Ziffern wurden vom Verf. hinzugefügt. 

Stand der Dinge – 18. Juni 2019 (Zitieren)

TKrefeld
(31 Wörter)

Der ursprünglich unter dieser Adresse präsentierte Text ist nunmehr Teil der Kongressakten des zweiten VerbaAlpina-Arbeitstreffens und kann, minimal modifiziert, unter der Adresse http://www.kit.gwi.uni-muenchen.de/?p=45335 abgerufen werden.

VerbaAlpina – interlinguale Geolinguistik und Digital Humanities (Zitieren)

TKrefeld
(4631 Wörter)

Thomas Krefeld

Dieser Beitrag wurde anlässlich eines Vortrags an der Alpen-Adria-Universität Klagenfurt redigiert; es handelt sich um eine modifizierte und aktualisierte Fassung von Krefeld 2018a;  alles ist vor dem Hintergrund von Stephan Lückes eher informationstechnisch  ausgerichteten Ausführungen zu sehen. Für die Einladung danke ich Luca Melchior.

1. Die Sprachwissenschaft auf dem Weg in die digital humanities

Seit ca. 15 Jahren, d.h. seit der zügigen Durchsetzung interaktiver und kollaborativer Strukturen im Internet Web 2.0  durchlaufen zahlreiche wissenschaftliche Disziplinen einen Prozess tiefgreifenden Wandels, denn im Gefolge der medialen Revolution haben sich die Rahmenbedingungen der Wissenschaftskommunikation im Web substantiell verändert; symptomatisch ist  die oben auf dieser Seite angebrachte Einladung Schreibe eine Antwort. In den Disziplinen, die sich mit kulturellen Techniken und ihrer geschichtlichen Entwicklung befassen, kann dieser Wandel mit dem Schlagwort der digital humanities identifiziert werden. Es ist dennoch nicht überraschend, dass die Wissenschaftler unterschiedlich auf diese Situation reagieren, nämlich teils mit

  • offensiver Ablehnung (Motto: „Das bedeutet den Ausverkauf der akademischen Fächer“),
  • nonchalanter Indifferenz (Motto: „Der kindische Unfug lässt mich kalt“),
  • konstruktiver Akzeptanz (Motto: „Endlich wird möglich, was ich immer schon wollte“).

Nicht im Sinn eines missionarischen Eifers, sondern aus rein forschungspraktischer Überzeugung sei festgestellt, dass für datenorientierte Disziplinen, wie zum Beispiel für diejenigen Bereiche der Sprachwissenschaft, die sich mit Variation und historischen Prozessen befassen, eigentlich nurmehr die dritte Haltung in Frage kommt. Wenn man die mediale Herausforderung jedoch in diesem Sinn annimmt, ändert sich methodologisch fast Alles.

2. Geolinguistik

Die Geolinguistik1 ist in geradezu idealer Weise geeignet, um die Notwendigkeit des skizzierten Transfers zu illustrieren. Zunächst ist diese Subdisziplin von Anfang an mit dem Anspruch entstanden, gesprochene Sprache zu dokumentieren; sie stand, mit anderen Worten, zu Beginn nicht in der text- und editionsorientierten Tradition der Philologie (vgl. Krefeld 2007).  Ausserdem entwickelte sich die Geolinguistik vor allem dank der teils monumentalen Sprachatlanten  zu einer Art Korpuslinguistik avant la lettre. Der AIS2, den man als den gattungsprägenden romanischen Vertreter der Tradition ansehen darf, versammelt in 1681 Karten, 20 Konjugationstabellen und zahlreichen ergänzenden Listen Belege aus 416 Aufnahmeorten (vgl. die Beschreibung in Krefeld 2017c); das entspricht mindestens einer Million Tokens. Immerhin wurde das gesamte Material 20 Jahre später Jahre durch einen gedruckten Index aufgeschlüsselt (vgl. Jaberg/Jud 1960), der sich selbst als Ein propädeutisches etymologisches Wörterbuch der italienischen Mundarten bezeichnet.3 Auf geradezu selbstverständliche Art wurden daher Autoren von Sprachatlanten zu Pionieren der sprachwissenschaftlichen Digitalisierung (vgl. dazu Hans Goebls Bemerkungen in Goebl 2018). Insgesamt ist der Alpenraum recht gut durch Sprachatlanten erschlossen, wie eine Karte aller Informanten im Überblick zeigt. 

Das zweite Forschungsinstrument der traditionellen Geolinguistik, das in repräsentativen Fällen ebenfalls monumentale Ausmaße annimmt,  ist das Wörterbuch; seine herausragenden Vertreter operieren ebenfalls in der Logik von Atlanten, d.h. auf der Basis eines mehr oder weniger engmaschigen Netzes von Aufnahmeorten. So sind u.a. die exhaustiv intendierten Lexika der Schweizer Landessprachen (vgl. DRG, GPSRIdiotikonVSI) und das Wörterbuch der bairischen Mundarten in Oesterreich WBOE angelegt (vgl. die Kartierung der Ortsnetze dieser alpinen Dialektwörterbücher in der Darstellung durch VerbaAlpina). Vor dem Hintergrund der digital humanities erscheint es nun nicht nur realistisch sondern geradezu geboten, diese unterschiedlichen Datenquellen zusammenzuführen und in ein Gesamtkorpus zu verwandeln. Diesen Versuch unternimmt in onomasiologisch definierten Ausschnitten des Wortschatzes das Projekt VerbaAlpina, das als virtuelle, webbasierte Forschungsumgebung beschrieben werden kann.

3. VerbaAlpina als Beispiel einer Forschungsumgebung

Genauer gesagt ist die Korpuserstellung Gegenstand eines als ‘Dokumentation’ bezeichneteten Funktionsbereichs, der in enger Verflechtung mit vier anderen Funktionalitäten zu sehen ist:

  • Dokumentation,
  • Publikation,
  • Kooperation,
  • Datenerhebung durch Crowdsourcing,
  • Forschungslaboratorium.

Alle genannten Bereiche sollen im Folgenden projektbezogen konkretisiert werden. Zum Verständnis ist jedoch vorab eine Skizze des erforschten Raums erforderlich.

3.1. Das Untersuchungsgebiet

Das Projekt VerbaAlpina, das der Verfasser dieses Beitrags gemeinsam mit Stephan Lücke von der ITG der LMU leitet, wird seit 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Gegenstand ist die Mehrsprachigkeit des Alpenraums4, in dem sich die drei großen europäischen Sprachfamilien, Germanisch, Romanisch und Slawisch getroffen haben und seit ca. 1500 Jahren neben-, mit- und unter Umständen auch gegeneinander existieren (vgl. Karte).

Die Sprachverhältnisse sind erheblich komplizierter als die Rede von den drei ‚Familien‘ sowie die suggestive Flächigkeit ihrer kartographischen Darstellung andeutet, denn dazu gehören im Romanischen eine ganze Reihe von staatlich implementierten Sprachen mit jeweils sehr verschiedenen Dialekten; im Germanischen und Slawischen gibt es zwar jeweils nur eine Sprache (Deutsch und Slowenisch); beide sind jedoch ebenfalls durch ganz unterschiedliche, lokale Dialekte, genauer gesagt: durch Dialektkontinua5 vertreten.

Es im Hinblick auf das zugrunde liegende Verständnis des sprachlichen Raums wichtig, darauf hinzuweisen, dass ausschließlich georeferenzierbare Daten berücksichtigt werden; Bezugsgröße für die empirischen Belege ist in Regel die politische Gemeinde, gelegentlich ist es sinnvoll oder erforderlich auf kleinere Einheiten zu referenzieren6, niemals jedoch auf größere Gebiete. Die Dokumentation zielt nicht auf vermeintliche Dialekträume (Puter |  Lombardisch | Venezianisch | Ladinisch etc.) und ihre mutmaßlichen Grenzen; vielmehr werden bottom up Verbreitungsgebiete lokal belegter Varianten abgebildet, die nicht selten über die Grenzen der Sprachen und Sprachfamilien hinausreichen. In diesem Sinn steht der Projektname VerbaAlpina in der Tradition des Konzepts der Alpenwörter (vgl. die klassischen Arbeiten von Jud 1911aJud 1911b, Jud 1924, Stampa 1937, Hubschmid 1950 und Hubschmid 1951). In synchroner Perspektive lässt sich die Vorgehensweise als eine übereinzelsprachliche oder interlinguale Geolinguistik fassen.

In diachroner Perspektive setzen Alpenwörter, die per definitionem in mehr als einer Sprachfamilie verbreitet sind, notwendigerweise Entlehnungsprozesse voraus. Der Entlehnungsweg ist dabei keineswegs immer eindeutig; er kann auch indirekt sein, etwa wenn ein ursprünglich lat.-romanischer Typ nicht direkt ins Slowenische gelangt ist, sondern den Umweg über das Deutsche genommen hat. Es ist daher Aufgabe der Wortgeschichte, die Entlehnungswege in der sprachlichen Stratigraphie des Alpenraums zu verorten, die sich so schematisieren lässt: Konstitutiv sind die Romanisierung des gesamten Gebiets (seit 15 vor Chr.) und seine nachfolgende teilweise Germanisierung und Slawisierung. Damit ist zwar stets eine  eine areale Verdrängung der jeweils früheren Sprachen verbunden, insofern das Lateinisch-Romanische  die vorrömischen Sprachen verdrängt und  seinerseits in manchen Gebieten durch das Germanische und Slawische verdrängt wird. Aber der Verdrängung geht eine mehr oder weniger lang andauernde lokale Zweisprachigkeit voraus (in der Graphik durch die Punkte symbolisiert), die sich in Entlehnungen aus den verdrängten in die verdrängenden Sprachen niederschlägt, so dass sich die erwähnten sprachgrenzüberschreitenden Verbreitungsgebiete ergeben.

AKTUELLE ALPINE
SPRACHAREALE
romanisches
STRATUM
germanisches
STRATUM
slaw.
STRATUM  ●●●
●●● deu. SUPERSTRAT ●●●
●●● ●●● SUBSTR. ●●●
germ. SUPERSTRAT ●●● SUBSTRAT
SPÄTANTIKE
SPRACHAREALE
 Lat.-romanisches STRATUM ●●●
vorrömische SUBSTRATE 
rot=vorrömisch, grau=lat.-romanisch, blau=germanisch, gelb=slawisch
Sprachliche Stratigraphie des Alpenraums

Ausgehend von den Sprachfamilien lasen sich die direkten Kontaktszenarien wie folgt typisieren:

Alpenwörter: diachrone Typologie der Stratigraphie
Herkunft des Basistyps stratigraphischer Bezug aktuelle Sprachfamile
vorrömisch – Substrat – → romanisch
romanisch – Substrat, Adstrat – → germanisch
→ slawisch
germanisch – Superstrat, Adstrat – → romanisch
→ slawisch
slawisch – Adstrat – → romanisch
– Substrat, Adstrat – → germanisch

Exemplarische wortgeschichtliche Beispiele aus unterschiedlichen Konstellationen finden sich hier.

Es ist nun aber von vornherein klar, dass die Dokumentation eines so komplexen Sprachraums mit der skizzierten historischen Tiefe durch das Medium des gedruckten Buchs kaum, wenn überhaupt, zu leisten ist. Ein Zugriff im Sinne der digital humanities drängt sich deshalb schon rein sachlich auf.7

3.2. Funktionsbereich Dokumentation

Die Dokumentation erfasst unabhängig von der Quellengattung und ganz im Sinne der klassischen Dialektologie, ausschließlich georeferenzierbares oder bereits georeferenziertes Material; es werden also Atlas– und (wenngleich weniger) Wörterbuchdaten aufgenommen. Einen maximalen Überblick über die einschlägigen Erhebungsorte (Stand 2018) zeigt diese Karte. Praktisch alle Belege sind über das Erhebungsdatum im Übrigen auch chronoreferenziert8; allerdings ist die Chronoreferenzierung derzeit (März 2019) noch nicht interaktiv implementiert.

Eine weitere, informationstechnisch grundlegende Bedingung des Transfers ist die Strukturierung der Daten. Materialien aus älteren Quellen werden in der Regel erst von VA im Zuge der Retrodigitalisierung, also mit  ihrer Umwandlung in Daten,  strukturiert; strenggenommen wird Retrodigitalisierung überhaupt erst dann wirklich sinnvoll, da sie nur so eine digitale Nachnutzung analogen Materials  gestattet.

Die grundlegende Herausforderung besteht darin die unterschiedlichen semiotischen Dimensionen der Quellen zu sezieren. Das ist insbesondere im Fall der Sprachatlanten nicht immer leicht, denn eine analoge Karte, wie z.B. AIS 1192a LA CASCINA DI MONTAGNA, informiert über Sprache, außersprachliche Konzepte/Kategorien und singuläre Dinge, ohne dass der Status einer Information immer ganz eindeutig wäre. So finden sich in VA (Stand vom 1.4.2019) 1270 dialektale Bezeichnungen (Tokens) des Konzepts ALMHÜTTE; sehr häufig wird die Art des Gebäudes spezifiziert, so dass etliche Unterkonzepte unterschieden werden müssen. Beispielsweise haben die Informanten des VALTS in drei Orten darauf hingewiesen, dass die Bezeichnungen des Typs Tieje/Teie(n) eine PRIMITIVE SENNHÜTTE AUF MAIENSÄSSEN bezeichnen. In anderen Orten steht derselbe Typ für andere Unterkonzepte bzw. für das taxonomisch übergeordnete, alllgemeine Konzept HÜTTE. Ob sich die Spezifizierungen jedoch wirklich auf die Wortsemantik, bzw. eine feste konzeptuelle Kategorie oder womöglich auf die Qualität eines bestimmten Referenten bezieht, die der individuelle Informant mit dem Wort assoziiert, ist unklar. Das Problem wird ganz evident, wenn singuläre außersprachliche Realitäten detailliert abgebildet werden, wie im Fall der folgenden Grundrisse einer Sennhütte aus dem engadinischen Zernez (AIS, P 19):

AIS 1192a

Handelt es sich hier um einen weit verbreiteten Bautyp im Sinne einer außersprachlichen Kategorie oder um einen idiosynkratischen Fall?

Schließlich liefern manche Quellen auch Informationen über ihre Informanten. Grundsätzlich sind bestimmte Charakteristika für die richtige Beurteilung der sprachlichen Belege wichtig; dazu zählen vor allem die Sprachkompetenz (Standard, evtuelle Kontaktsprachen), das Alter und das Mobilitätsprofil (vgl. die Fallbeispiele in Krefeld 2018). Auch in dieser Hinsicht war bereits der AIS wegweisend, denn er teilt in den Aufnahmeprotokollen relevante biographische Daten mit, allerdings ohne sie bei der Kartierung zu berücksichtigen9. Obwohl die Sprachkompetenz des Sprechers also zu den Dimensionen möglicher Variation gerechnet werden muss, wurde in der interaktiven Karte von VerbaAlpina auf die Einrichtung eines entsprechenden Filters verzichtet, denn die meisten Quellen geben keine diesbezüglichen Informationen.

Strukturierung ist Voraussetzung für die Erstellung eines Korpus im Sinne der zeitgenössischen Linguistik; sie erlaubt auch die Entwicklung einer interaktiven Oberfläche mit sehr benutzerfreundlichen Suchfiltern, wie in Gestalt der interaktiven Karte . Ein wichtiger Schritt der Dokumentation besteht in der Vereinheitlichung der Transkription; die unterschiedlichen Systeme der Quellen werden allesamt durch einen eigens definierten Betacode  in den international weit verbreiteten Standard IPA übersetzt (vgl. die vollständige Übersicht). Die Konversion der Transkription impliziert keinen Informationsverlust, denn auch die Originaltranskription (=“DST QUELLE …“) wird sichtbar, sobald man mit dem Mauspfeil auf den ‚Einzelbeleg‘ oben links im Belegfenster fährt. Das zeigt der folgende Screenshot:

VA-Transkription in IPA und Sichtbarkeit des Originals

Wenn möglich werden alle dialektalen Sprachbelege als Varianten weiter verbreiteter Typen identifiziert und auf große Referenzwörterbücher bezogen (hier L = LSI und H = HdR). Schwieriger ist die Verknüpfung der KONZEPTE mit einem allgemein  etablierten, außersprachlichen Referenzsystem; de facto ist  etwas Derartiges mit dem umfassenden, kontinuierlich wachsenden  Wikidata-Projekt entstanden. Dort wird die gemeinsame außersprachliche Referenz der verschiedenen, oft sehr zahlreichen einzelsprachlichen Wikipedia mit einer Identifikation (ID) versehen; sie kann aus jedem Wikipidia-Eintrag über die Funktion Wikidata-Datenobjekt aufgerufen werden. Dieser Dienst beinhaltet auch bereits seit langem übliche Taxonomien, wie etwa im Bereich der Flora die auf Carl von Linné zurückgehende Nomenklatur. So kann das Konzept BUTTER , das in 134 verschiedenen Sprachversionen der Wikipedia behandelt wird über die ID Q34172 identifiziert werden.

Qualitative und quantitative Kartierung

Grundsätzlich lassen sich strukturierte Daten sowohl qualitativ als auch quantitativ (oder: metrisch) erschließen. Hier stellen sich aus geolinguistischer Sicht sehr unterschiedliche Fragen, die sowohl die statistische Modellierung als auch die Visualisierung betreffen. Eine dialektometrische Funktion zur Bestimmung der relativen Ähnlichkeit wurde bislang noch nicht entwickelt; sie wäre vor allem für die Verbreitung von Basistypen über die Grenzen der  Sprachfamilien hinaus sehr aufschlussreich. Elementare Bezugseinheit der Georeferenzierung ist für VerbaAlpina die politische Gemeinde. Eine flächige Visualisierung auf dieser Basis von 6990 Einheiten ist jedoch nicht in jeder Hinsicht ideal, denn die Unterschiede hinsichtlich ihrer Fläche wie ihrer Bevölkerung können zu manchen Verzerrungen führen (vgl. diese Bemerkungen). Darüberhinaus kann es gelegentlich, z.B. bei der Berücksichtigung von Toponymen, wichtig werden, präziser zu georeferenzieren oder aber die Gemeinden zu größeren Einheiten zu clustern; dazu bieten sich die von der Europäischen Gemeinschaft konzipierten NUTS-3-Regionen oder gar die alpinen Sprachgebiete als ganze an; illustrativ ist die Darstellung der lateinischen Inschriften im Bezug auf NUTS-3 einerseits und die Sprachgebiete andererseits.

Von autonomen Gattungen zu verschränkten Funktionen

Ein großer Vorteil virtueller Dokumentation besteht in der Überwindung der traditionellen Gattungen, die sich im Universum der gedruckten Veröffentlichungen etabliert haben. Sprachwissenschaftlich relevante, publikationstechnisch oft eigenständige Gattungen sind zum Beispiel die Abhandlung, das Textkorpus oder die bereits genannten Sprachatlanten und Wörterbücher. Jede Gattung erfüllt einen bestimmten Zweck, der auf keinen Fall aufgegeben werden sollte. Jedoch werden diese Zwecke aus ihrer Isolierung befreit und in untereinander verknüpfte Funktionen verwandelt, so dass es möglich ist ohne weiteres zwischen ihnen hin und her zu wechseln.

Einen unmittelbaren Zugang zum dokumentierten Materials bietet der Reiter ‚Interaktive Karte‘ auf der Homeseite. Er führt zu einer kartographischen Präsentation, die über mehrere Filter gesteuert wird. Der Filter KONZEPTE erschließt sämtliche Sachen und Vorgänge, deren Bezeichnungen erfasst sind (vgl. die Hinweise zur Notation), so zum Beispiel BUTTER. Die hier zahlreich belegten Bezeichnungstypen können ebenfalls als einzelne herausgefiltert werden; falls ein Typ noch andere Konzepte bezeichnet, tauchen diese ebenfalls auf der Karte auf, wenn sie zu den relevanten Konzepten von VA gehören.  So wird die BUTTER mit Ausdrücken bezeichnet, die auf lateinisch flōrem (Akk. zu flōs), eigentlich ‚Blume‘, zurückgehen und dem fra. fleur bzw. dem ita. fiore entsprechen. Dieser Typ bezeichnet aber außer BUTTER noch RAHM und anderes mehr (vgl. diese Karte).

Weiterhin ist es möglich von der  Karte aus direkt zu den eventuell zugehörigen lexikologischen Kommentar zu gelangen; die Verfügbarkeit wird in der Legende durch einen Button mit dem Buchstaben ‚i‘ angezeigt. Ein solcher Button findet sich in diesem Fall u.a. in der ersten Zeile der Legende hinter  ‚Konzept BUTTER‘; er gibt enzyklopädische Informationen zur Geschichte des Produkts.  In der entgegengesetzten Verweisrichtung ist es möglich den Reiter ‚Lexicon Alpinum‘ zu konsultieren; dort findet sich derselbe Kommentar zum Konzept Butter, der  über die Funktion ‚Auf Karte visualisieren‘ zur genannten Karte leitet  – ‚Atlas‘ und ‚Wörterbuch‘ haben sich also in  systematisch verschränkte Funktionen ein und derselben Forschungsumgebung verwandelt.

Von der Philologie zu den Humanities

Zur historischen Profilierung von Sprachräumen ist es sinnvoll die Verbreitungsareale dialektaler Formen mit anderen  georeferenzierbaren Informationen zu kombinieren. Im Hinblick auf die Romanisierung des Alpenraums im Gefolge der römischen Eroberung sind vor allem antike Quellen von Bedeutung.; aus diesem Grund wurden auch die gesicherten Inschriften und römerzeitlichen Ortsnamen aufgenommen (vgl. die Karte CIL und Tabula Peutingeriana sowie die Hinweise zu den historischen Daten); vor diesem Hintergrund ist es interessant zu sehen, dass sich oft alte Bedeutungen aus der Antike bis heute gerade da erhalten haben, wo auch bereits römische Inschriften und antike Ortsnamen bezeugt sind. Ein sehr schönes Beispiel liefert der auf den ersten Blick ganz unauffällige Worttyp Keller < lat. cellarium . Er bezeichnet im Gegensatz zum Hochdeutschen im deutschsprachigen Alpenraum in der Regel keineswegs einen RAUM UNTER DEM ERDGESCHOSS, sondern – wie das Grundwort lat. cella – den VORRATS- bzw. LAGERRAUM. Hier liegt es im Hinblick auf die römerzeitlichen Zeugnisse im dialektalen Verbreitungsgebiet  an Konservation der lateinischen Bedeutung zu denken und nicht an sekundäre Rückentwicklung zur alten Bedeutung; besonders prägnant sind die drei steirischen Belege von Keller in der Bedeutung ‚Almhütte‘.

3.3. Funktionsbereich Kooperation

Im Sinn der digital humanities hat VerbaAlpina ein dichtes Netz von  Partnern geknüpft. Darunter sind manche – und an allererster Stelle sind ALD-I und ALD-II zu nennen -, die bereits eindeutig strukturiertes Material zur Verfügung stellen, das von VA über eine Datenschnittstelle integriert werden kann; bisweilen, wie im Fall des WBOE liegen auch rudimentäre und inkonsistente Strukturen vor, die nur mit großem Aufwand konvertiert werden können. Jedenfalls lassen sich die Partnerdaten in Verbindung mit den durch Retrodigitialisierung gewonnenen Daten zu einem umfassenden und mehrsprachigen Dialektmosaik des ganzen Alpenbogens zusammengefügen, wie die maximalistische Übersicht der prinzipiell verfügbaren VA-Informanten zeigt. Man beachte, dass die Berücksichtigung des WBOE mindestens theoretisch eine umfangreich Atlaslücke in den österreichischen Ostalpen schliesst (vgl. VA-Informanten ohne Berücksichtigung des WBOE.

Wirklich unvereinbar mit dem erstrebenswerten kollaborativen Aufbau umfassender und gut nachnutzbarer Datenbestände ist die Verwendung kommerzieller und privatwirtschaftlicher Dienste, auch , oder besser: gerade dann, wenn sie  das Etikett open access sozusagen im Stil einer feindlichen Übernahme für sich reklamieren, wie es die zunehmend monopolistisch auftretenden Verlage praktizieren (vgl. dieses Beispiel).

3.4. Funktionsbereich Datenerhebung

Crowdsourcing als Technik der Datenerhebung ist eine Option, die sich webbasierter Forschung  grundsätzlich bietet; selbstverständlich taugt das Verfahren nicht für Daten, die Expertenwissen erfordern; so kann ein Sprecher zwar Ausdrücke und Konstruktionen in geschriebener und mündlicher Realisierung liefern, jedoch keine Transkription, die den Ansprüchen der Phonetik genügt. Sehr wohl ist ein Sprecher jedoch im Stande, markante lautliche Besonderheiten (z.B. Diphthongierungen, Palatalisierungen) zu unterscheiden. Im Rahmen von VerbaAlpina wurde ein Crowdsourcing-Tool designed, mit dem interessierte Nutzer für alle politischen Gemeinden des Alpenraums (im Sinn der Alpenkonvention) Bezeichnungen der von uns vorgegebenen Konzepte schriftlich eingeben oder darüber hinaus auch neue Konzepte hinzufügen. Bislang sind seit dem 10.2.2017 immerhin 11534 (Stand vom 1. April 2019) Belege erhoben worden. Es wird erwogen, unter Umständen auch mit der Erhebung gesprochener Audiodaten zu beginnen; die technischen Probleme sind grundsätzlich gelöst.

Das grundlegende Problem beim Einsatz von Crowdsourcing liegt jedoch darin, dass es sich um eine mediales Verfahren handelt, das auf eine hinreichende Sichtbarkeit und Bereitwilligkeit der Mediennutzer angewiesen ist. Es muss – mit anderen Worten – für hinreichende Publizität gesorgt werden. In aller Regel sind Projekte aus den humanities keine Selbstläufer und können daher Unterstützung durch Öffentlichkeitsarbeit einschließlich nicht digitaler Medien gebrauchen. Pressemitteilungen bilden sich im positiven Fall direkt in der Nutzeraktivität ab, wie drei punktuelle Einblicke in die Statistik des VerbaAlpina-Crowdsourcings zeigen:

Öffentlichkeitsarbeit und Echo im Crowdsourcing: A – kein eindeutiges Echo: Vortrag vor Almbauern  |  B – schwaches Echo: Bericht in einer Schweizer Lokalzeitung | C – starkes Echo: Homepage des Bayerischen Rundfunks (BR 2)

Aber es scheint sehr problematisch, wenn nicht unmöglich Nutzerinteresse zu prognostizieren. Sehr schwer einzuschätzen ist insbesondere die Gewichtung des individuellen Sachinteresses auf Seiten des Nutzers und sowie der Attraktivität des Web-Auftritts. Womöglich besteht auch ein Zusammenhang beider Parameter, insofern fehlendes Sachinteresse eventuell durch eine unterhaltsame, z.B. als Spiel gestaltete Oberfläche (‚gamification‘) kompensiert werden kann. 10 Es kann jedoch auch nicht übersehen werden, dass es durchaus sehr erfolgreiche CS-Kampagnen gibt, in denen der zweite Parameter keine und der erste bestenfalls eine unklare Rolle spielt (vgl. die Übersicht der Zooniverse-Projekte).

3.5. Funktionsbereich Forschungslabor

Forschungsumgebungen im Rahmen der Digital Humanities sind in der Lage eine Option anzubieten, für die es in der Welt, die ausschließlich auf den Druck ‘fertiger’ Ergebnisse zielt, keine Entsprechung geben kann. Gemeint ist die Einrichtung eines mehr oder weniger offenen digitalen ‘Raums’, in dem registrierte Partner, Nutzer und/oder Interessenten überhaupt die Möglichkeit haben, sich mit den Inhalten und dem Quellcode des Projekts zu befassen. Diese Auseinandersetzung kann analytisch erfolgen, aber auch in Vorschlägen, das Vorhandene um Inhalt und/oder Code zu erweitern. Dazu müssen Upload-, Download- und Kommentar- bzw. Chatfunktionen eingerichtet werden. Dieser Funktionsbereich, für den sich die Bezeichnung ‘Labor’ anbietet, wurde in VerbaAlpina bislang noch nicht ausgebaut; immerhin haben registrierte Nutzer auf der ‘Interaktiven Karte’ schon die Möglichkeit, beliebige Daten, die über die Filter angezeigt werden können, gemeinsam aufzurufen und in Gestalt sogenannter  ‘Synoptischer Karten’ zu fixieren und zu kommentieren. Das jeweils Erzeugte kann über einen Share-Button weitergeleitet werden, so dass Interessentengruppen gebildet werden können.

3.6. Funktionsbereich Publikation

Eine probate Strategie zur Durchsetzung kollaborativer Forschungsumgebungen ist der parallele Aufbau von Publikationsplattformen, die denselben Anforderungen  entsprechen, an denen auch gedruckte Veröffentlichungen gemessen werden: dauerhafte Zitierfähigkeit und Recherchierbarkeit. Verlässlich zitierfähig in lwissenschaftlichem Kontex sind nur stabile Text. Für VerbaAlpina wurde eine technische  Versionierung entwickelt, die in ähnlicher Weise auch in anderen Münchner Plattformen verwandt wird. Sie beruht im Wesentlichen darauf, dass die jeweilige Version in der URL des Textes spezifiziert wird. Jede Änderung des Textes setzt die Erzeugung einer neuen Version voraus, die jedoch die vorhergehende nicht ersetzt, sondern ergänzt. Die älteren Versionen bleiben erhalten, so dass ihre eventuellen Zitate durch neuere Versionen nicht gefährdet werden. Für den oben erwähnten Kommentar zum Konzept BUTTER wird die folgende Zitierweise empfohlen, in der die Version 17/2 in der URL in Gestalt der Ziffer 172 repräsentiert wird:

  • Krefeld, T.: s.v. “BUTTER”, in: VA-de 17/2, Lexicon alpinum, https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=2374&db=172#C156

Diese Zitierbarkeit wurde in den Portalen KiT und DH–Lehre entwickelt. Um in längeren versionierten Texten gezielt auf einen bestimmten Abschnitt referenzieren zu können, wurde die Textformatierung so eingestellt, dass alle Absatzes fortlaufend nummeriert werden und die jeweilige Nummer durch Klicken der URL hinzugefuegt wird. Die folgende URL:

verweist also auf den 8. Absatz eines Beitrags von Hans Goebl in der ersten Version des Sammelbandes Berichte aus der digitalen Geolinguistik : Thomas Krefeld | Stephan Lücke (2018): Berichte aus der digitalen Geolinguistik. Korpus im Text. Version 1 (12.05.2018, 10:20). url: http://www.kit.gwi.uni-muenchen.de/?p=4498&v=1]].

Die Recherchierbarkeit des Projekts VerbaAlpina als ganzem ist nicht nur in den Suchmaschinen, sondern auch im Verbundkatalog der öffentlichen bayerischen Bibliotheken (OPAC) gewährleistet; es wurde durch die UB der LMU mit einem Digital Object Identifier (doi:10.5282/verba-alpina) versehen, über das es auch jenseits der Kataloge und herkömmlichen Suchmaschinen auffindbar ist (vgl. DOI). Darüber hinaus wurde auf dem Server der Deutschen Nationalbibliothek ein sogenannter Uniform Resource Name (URN) hinterlegt, der Ähnliches wie die DOI leistet (vgl. [[Lücke 2017|https://www.verba-alpina.gwi.uni-


  1. <span class="vaabr" data-vaabr="VglDOT">Vgl.</span> zur Bezeichnung die <a href="https://www.dh-lehre.gwi.uni-muenchen.de/?p=21088&lv=2&v=2" target="_BLANK">Bemerkungen</a>  in <span class="bibl" data-bibl="krefeld2017c">Krefeld 2017c</span>. 

  2. <span class="vaabr" data-vaabr="vglDOT">vgl.</span> die <a href="https://www.dh-lehre.gwi.uni-muenchen.de/?p=21088&l=78275" target="_BLANK">Darstellung des Unternehmens</a> in <span class="bibl" data-bibl="krefeld2017g">Krefeld 2017g</span>. 

  3. Dieser Ausdruck ist insofern gerechtfertigt, als ein sehr großer Teil der im Atlas veröffentlichten Formen typisiert wird, allerdings ohne diesen Typen ein konkretes Etymon zuzuweisen. Diese Verknüpfung interaktiv zu realisieren wäre eine sehr schöne Unternehmung der <i>Digital Romance Humanities</i>. 

  4. Das Gebiet wird aus rein pragmatischen Gründen über die Zugehörigkeit der politischen Gemeinden zur Interessenvereinigung der <a href="http://www.alpconv.org/de/convention/pages/default.aspx?AspxAutoDetectCookieSupport=1" target="_BLANK">Alpenkonvention</a> abgegrenzt. 

  5. <span class="vaabr" data-vaabr="VglDOT">Vgl.</span> zu <a href="https://www.dh-lehre.gwi.uni-muenchen.de/?p=79179#chapter:synchronische-beschreibung-der-arealen-ebene" target="_BLANK">diesem Konzept aus romanistischer Sicht</a>. 

  6. Das ist zum Beispiel immer dann agebracht, wenn Quellen sich auf  Gemeinden beziehen, die im Zuge von administrativen Neuordnungen mit anderen Gemeinden zusammengelegt wurden. 

  7. Aus kommunikationsräumlicher Perspektive fallen jedem Romanisten sofort zahlreiche andere faszinierende Konstellationen eine: die Romania Thyrrenica (Korsica, Elba, Sardinien, die Balearen mit den jeweils nächstgelegenenen kontinentalen Küstenstreifen), die Sprachgebiete beiderseits der Adria, das Verbreitungsgebiet der Aromunen, Meglenorumänen und Rumänen; die Gegenden Afrikas, wo auch romanische Sprachen gesprochen; der Indische Ozean, Amerika usw.). Unser aller indivuiduelle Interessenthorizonte stoßen ja ständig an die Grenzen unserer individuellen Sprachkompetenzen, so dass nur aus der Kollaboration sinnvolle und notwendige Großprojekte entstehen können. 

  8. Darüber hinaus müsste auch das Alter in die Chronoreferenzierung eingehen; im VerbaAlpina-Gebiet lagen im Fall des AIS mehr als 60 Jahre Altersunterschied zwischen den Informanten; die Sprecherin aus Lanzada (AIS 216)  war bei der Erhebung, 1921, erst 22 Jahre alt, der Sprecher aus Surrhein (AIS 11) dagegen im Jahre 1920 bereits 84; <span class="vaabr" data-vaabr="vglDOT">vgl.</span> <span class="bibl" data-bibl="jabergjud1928">Jaberg/Jud 1928</span>, 40, 63. 

  9. <span class="vaabr" data-vaabr="VglDOT">Vgl.</span> zur Informantenmobilität <span class="bibl" data-bibl="krefeld2002">Krefeld 2002</span> und zum Problem der nicht alphabetisierten Informanten <span class="bibl" data-bibl="krefeld2007b">Krefeld 2007b</span> und <span class="bibl" data-bibl="krefeld2007c">Krefeld 2007c</span>. 

  10. Diese Komponente tritt im Projekt VerbaAlpina fast vollkommen zurück; allenfalls ist die Nennung der aktivsten (registrierten) User, Gemeinden und der beliebtesten Begriffe in der <a href="https://www.verba-alpina.gwi.uni-muenchen.de/en/?page_id=1741&db=xxx" target="_BLANK">Crowdsourcing-Funktion</a>  zu erwähnen; diese Zurückhaltung ist eine Reaktion auf die schwache Resonanz, die das dezidiert spielerisch ausgerichtete Projekt <a href="http://www.metropolitalia.org/" target="_BLANK">]Metropolitalia</a> gefunden hat. 

54 Monate – Arbeitsbericht VerbaAlpina (Zitieren)

TKrefeld
(3670 Wörter)

Thomas Krefeld | Stephan Lücke (LMU)

0. Vorbemerkung

Die aktuelle Förderungsphase dient der Erschließung eines zweiten großen Gegenstandsbereichs, nämlich der Natur, und zielt auf Bezeichnungen von Witterungserscheinungen, Landschaftsformationen, Fauna und Flora. Parallel dazu wurde viel Arbeit in  die Konzeption und praktische Umsetzung von verlässlichen Prozeduren des Datenmanagements in webbasierten Forschungsprojekten  Investiert. Da die grundlegende Bedeutung dieser zweiten Thematik in der romanistischen und italianistischen Geolinguistik weithin noch nicht erkannt worden zu sein scheint, wurde er ganz entschieden in den Vordergrund dieses Arbeitsberichts gestellt

1. Wissenschaftskommunikation im Internet

Forschungsmittel sind begrenzt; der Zugang dazu muss also kompetitiv geregelt sein. Wenn Forschung in dieser Hinsicht zwar dem Wettbewerb unterliegt, so ist sie doch in ihrem Wesen vor allem kollaborativ: Denn Fortschritt gibt es nur auf der Grundlage des jeweils bereits verfügbaren Wissens. Im Hinblick auf die Kollaboration – die ja grundsätzlich in Kommunikation fundiert ist – haben sich nun in den letzten 15 Jahren die Rahmenbedingen vollkommen geändert:  Es ist innerhalb weniger Jahre eine Gesellschaft entstanden, die explizit als Wissensgesellschaft bezeichnet wird, da sie im Privaten und im Öffentlichen die permanente und ubiquitäre Verfügbarkeit der Neuen Medien und damit einen praktisch unbegrenzten Zugang zum Wissen jeglicher Art voraussetzt.

Diese vollkommene Mediatisierung betrifft aber nicht nur den Wissenskonsum, sondern gleichermaßen die Wissensgenerierung durch Forschung, nicht zuletzt deshalb, weil sie uns eine sehr breite, ortsunabhängige Kooperation ermöglicht. Ins Schlaraffenland sind die Forscher damit freilich nicht gelangt, denn die Option auf Kooperation konkretisiert sich keineswegs automatisch. Sie erfordert vielmehr die Beachtung einiger elementarer Regeln, die seit kurzem mit der Sigle FAIR benannt werden, die von einer wichtigen Initiative lanciert wurde (🔗). Damit werden vier grundlegende ethische Prinzipien für die Wissenschaftskommunikation unter den Bedingungen der Neuen Medien identifiziert. Ihnen zufolge müssen Forschungsdaten

  • F_indable (‘auffindbar’),
  • A_ccessible (‘zugänglich’),
  • I_nteroperable (‘kompatibel’),
  • R_eusable (‘nachnutzbar’)

sein (🔗). Die Anforderungen von drei  (F, A, R) der vier Prinzipien zielen darauf, sowohl human readable als auch machine readable zu sein; sie gelten also sowohl für die Mensch-Maschine-Mensch-Kommunikation als auch für die Maschine-Maschine-Kommunikation. Das vierte Prinzip (I) gilt nur für letztere; es ist jedoch im skizzierten virtuell-medialen Rahmen zentral für den Fortschritt der Forschung und repräsentiert insofern die Unverzichtbarkeit der technologischen Komponente und die Transformation des LESERs zu einem interaktiven NUTZER, der auf einem Kontinuum zwischen hochspezialisierten Experten und völligen Laien abgebildet werden kann und der sich den Daten nicht nur lesenden Auges nähert, sondern womöglich mit der Absicht, sie für eigene Forschungszwecke zu nutzen und dafür maschinelle ‘Erntehelfer’ (zum sog. harvesting) einzusetzen.

Die Operationalisierung der FAIR-Prinzipien erfordert ein komplexes Zusammenspiel von Forschern, das heißt de facto von befristeter und deshalb mehr oder weniger prekärer Projektarbeit einerseits und andererseits von Institutionen, die Dauerhaftigkeit in Aussicht stellen können; das sind in allererster Linie die großen Bibliotheken. Die Entwicklung von Prozeduren für diese ganz spezielle Art der Kooperation gehört zu den aktuellen Herausforderungen der Forschung, die mit dem Ausdruck Forschungsdatenmanagement (FDM) bezeichnet werden. Damit sind wichtige Eckpunkte der Wissenschaftskommunikation im Web markiert, die den Horizont dieses Beitrags abstecken.

2. FAIRness in einer web-basierten Forschungsumgebung

Das Projekt VerbaAlpina (VA) versucht, die Forschungskommunikation im oben skizzierten Sinne konsequent nach den FAIR-Prinzipien zu gestalten.  Dabei ist ihre Anwendung in den folgenden fünf komplementär angelegten und eng miteinander verflochtenen Funktionsbereichen (🔗) zu unterscheiden:

  • Dokumentation;
  • Publikation;
  • Kooperation;
  • Datenerhebung durch crowdsourcing;
  • Forschungslabor.

2.1. FAIRness der Publikation

Das ganze Internet ist nichts Anderes als eine gewaltige Publikationsmaschine; es ist allerdings unbedingt notwendig zu differenzieren, denn es wird durchaus anders und teils auch Anderes als unter den medialen Bedingungen des Drucks publiziert wird. Von VerbaAlpina  werden

  • semantischer Inhalt (Dialektformen, analytischer wissenschaftlicher Text),
  • Metadaten,
  • Software und Code

veröffentlicht (🔗).

Produziert werden dabei ausnahmslos stabile Daten und Textdateien, da die gesamte Plattform (Benutzeroberfläche und Datenbanken) alle sechs Monate ‘eingefroren’, oder: versioniert wird; zusätzlich besteht jeweils eine aktuelle Arbeitsversion (Version xxx), die noch Änderungen unterliegt und daher nicht zitiert werden sollte (🔗). Die jeweils jüngste Version ersetzt jedoch nicht die vorige, sondern ergänzt sie, denn alle früheren Versionen bleiben erhalten, so dass sämtliche Zitate und Verlinkungen innerhalb des Projekts sowie von außen auf das Projekt stets zugänglich sind.

Es ist weiterhin sichergestellt, dass die Versionen gut auffindbar sind, denn ihnen wird von der UB der LMU ein DOI zugewiesen (http://dx.doi.org/10.5282/verba-alpina); gleichzeitig findet VA als Ganzes damit Eingang in die Biblibliothekskataloge (🔗).

Auf dieselbe Weise lassen sich auch alle thematischen Textbeiträge identifizieren, die auf der Projektseite unter den Reitern Lexicon alpinum, Methodologie und Beiträge  publiziert werden; sie erhalten ebenfalls einen DOI und sind daher direkt zitierfähig (vgl. z.B.: Krefeld, T. / Lücke, S.: s.v. “butyru(m)”, in: VA-de 18/2, Lexicon alpinum, http://dx.doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D2374%26db%3D182%23B128).

Eine vergleichbare Funktion leistet der URN, der bei der Deutschen Nationalbibliothek in Frankfurt registriert wird. Schließlich ist auch der gesamte Quellcode von VA mit allen programmierten Tools unter github auffindbar und zugänglich. Technisch gesehen liegt dem Verfahren ein Export aller VA-Daten in ein Repositorium der UB zu Grunde (open data lmu), in dem auch Metadaten im Format DataCite zugewiesen werden.

Eine große Rolle bei der Ausgestaltung der Metadatenschemata spielen die Normdaten, die eine eindeutige und fein granulierte Identifikation der Forschungsdaten erlauben. VA unterscheidet drei Datenkategorien (oder: Entitäten), für die eigene Identifikatoren vergeben werden, die in Verbindung mit den Daten abrufbar sind:  ‘Konzept’, ‘morpholexikalischer Typ’ (s. Typisierung) und ‘Gemeinde’. So ergeben sich sehr spezifizierte Metadaten (vgl. das DataCite Beispiel für das Konzept SENNHÜTTE, das neben dem VA-Identifikator C1 auch die in VA ebenfalls vorhandenen onomasiologischen Identifikatoren des Wikidata-Projekts enthält:  Q136689, Q27849269, Q2649726), die grundsätzlich die eindeutige Referenzierung auf Einzeldaten definierter Objektklassen über Projektgrenzen hinweg erlauben.

Dieser Export gewährleistet die Zugänglichkeit und Nachnutzbarkeit der Daten nach dem Auslaufen der Projektförderung. Der Datenexport erfolgt über eine API-Schnittstelle (vgl. API Dokumentation), die im Internet öffentlich zugänglich ist und auch für die  Ausgabe in anderen Formaten und angereichert um Metadaten von im Grunde beliebigen anderen Standards, z.B. gemäß CLARIN-D, genutzt werden kann. Einen groben Überblick des im Entstehen begriffenen Forschungsdatenmanagements (Stand vom 11.3.2019) gibt das folgende Schema:

Forschungsdatenmanagement zwischen Projekten, Institutionen und Öffentlichkeit

Im Hinblick auf die Auffindbarkeit und Zugänglichkeit sind noch zwei grundsätzliche Bemerkungen angebracht:

  1. Da bislang in der Wissenschaftsgemeinde weder ein Standard-Metadatenschema verbindlich festgelegt noch die Frage geklärt ist, welche Institutionen über deren Einhaltung und die dauerhafte Bewahrung von Daten und Metadaten wachen sollen, hat sich VA zum einen für ein flexibles Schnittstellenkonzept entschieden, das die Nutzung im Grunde beliebiger Metadatenschemata erlaubt. Außerdem beteiligt sich VA an zwei aktuell laufenden Forschungsprojekten, die sich mit dieser Problematik auseinandersetzen: der Initiative (GeRDI) des LRZ und dem von der Bayerischen Staatsregierung geförderten Projekts „eHumanities – interdisziplinär. Im Projekt GeRDI sollen Daten ganz unterschiedlicher Disziplinen über Metadaten verknüpft werden, indem gemeinsame Attribute festgelegt werden (was z.B. im Fall von Geo- und Chronoreferenzierungen sehr einfach und häufig auch sinnvoll ist).
  2. Abgesehen von den Metadaten, die auf die spezifischen Projektdaten referenzieren, ist es im Sinn von Auffindbarkeit und technischer Interoperabilität unbedingt ratsam, Identifikatoren und Normdaten zu verwenden, die außerhalb des Projekts etabliert sind. VA verwendet daher seit kurzem die Identifikatoren der sogenannten Wikidata-Datenobjekte. Sie liefern Referenzen für außersprachliche Realitäten und Konzepte und damit einen gemeinsamen Bezugsrahmen für viele unterschiedliche Sprachen; so gibt es derzeit (14.12.2018) Wikipedia-Artikel in 133 Sprachen über das Milchprodukt Butter. Die sehr unterschiedlichen Artikel werden verknüpft, indem sie alle auf den eindeutigen Identifikator des entsprechenden Wikidata-Datenobjekts referenzieren (Q34172). Eine Suchmaschine, die danach sucht, ist also in der Lage, alle zugehörigen 133 Bezeichnungen zu finden – und so, zumindest theoretisch, demnächst auch die in VA dokumentierten, zahlreichen Dialektformen (1926 Belege). Ein ähnliches System für Bezeichnungstypen, d.h. für Wörter (L-ID), ist bei Wikidata im Aufbau.

2.2. FAIRness der Dokumentation

VA dokumentiert Dialektbelege der drei großen europäischen Sprachfamilien, die sich in ethnolinguistischer Hinsicht  als spezifisch alpin erweisen.

Das Material wurde in einen systematisch strukturierten Datenbestand überführt und nach sprachlichen (‘morpho-lexikalische Typen’, ‘Basistypen’) und außersprachlichen (‘Konzepte’) Kritierien annotiert; neben dem maschinenlesbaren Zugang über die oben erwähnte API-Schnittstelle gibt es einen menschenlesbaren Zugang, der in sehr anschaulicher Weise über eine interaktive Karte erfolgt; die dafür momentan noch genutzte Google Maps-Karte wird in Kürze durch eine bereits weitestgehend entwickelte Karte mit verbesserter Funktionalität auf der Grundlage von Open Street Maps und dem Javascript-Frameword Leaflet ersetzt (🔗 ).

Die genannten Kategorien der Datenstrukturierung  fungieren an der Kartenoberfläche als Filter. Bereits auf dieser nutzerfreundlichen, insbesondere laientauglichen Oberfläche wurde eine ebenso einfache wie elementare Funktion der reusability implementiert, denn es ist möglich, alle Karten, die man sich anzeigen lässt, in exakt der angezeigten Form (mit der entsprechenden Zoomstufe, jeweils geöffneten Fenstern usw.) mit anderen zu teilen oder sie in Publikationen usw. einzubauen, denn durch Klicken auf einen ’share button‘ wird für die jeweils aktuell angezeigte Karte eine versendbare URL erzeugt; so führt der folgende Link zu einer Karte aller in VA vorhandenen dialektalen Bezeichnungen von BUTTER.

Das vorhandene Sprachmaterial stammt aus zwei Quellen: Ein kleinerer Teil des Materials, das VA anbietet, wurde durch  das Projekt selbst im Crowdsourcing-Verfahren (s.u. 2.4.) erhoben. Der größte Teil wurde jedoch aus gedruckten oder für den Druck vorgesehenen Arbeiten gewonnen, so finden sich auch Formen, die uns im Rahmen von Partnerschaftsabkommen aus noch nicht abgeschlossenen Projekten zur Verfügung gestellt wurden (vgl. zum Beispiel das Punktnetz des Sprachatlas von Oberösterreich). Berücksichtigt wird auch Wörterbuchmaterial, unter der Bedingung, dass die sprachlichen Belege georeferenzierbar sind; das ist bei guten Dialektwörterbüchern wie zum Beispiel dem DRG oder dem VSI der Fall. De facto ist jede Quelle überdies auch chronoreferenzierbar, allerdings wurde diese Funktion noch nicht implementiert.

Durch die Retrodigitalisierung und den Webauftritt werden zahlreiche, in teils schwer zugänglichen Publikationen ‘schlafende’ Dialektausdrücke leicht auffindbar (F), zugänglich (A), interoperabel (I) und in allgemein kompatibler Weise nachnutzbar (R) gemacht; denn alle verfügbaren Formen erhalten einen persistenten Identifikator und werden in Kürze auch über einen Digital Object Identifier (DOI) ansprechbar sein. Hier ein Beispiel aus dem Sprach- und Sachatlas Italiens und der SüdschweizAIS (1928-1940).

VA produziert also gewissermaßen FAIRen Output. Allerdings sind die allermeisten Quellen, der Input, von FAIRness meilenweit entfernt. Die Gründe dafür sind teils technischer, teils aber auch juristischer, letztlich: kommerzieller Art. In der Regel sind Sprachatlanten ausschließlich als physisches Druckwerk zugänglich; nur sehr wenige bieten wenigstens die elementarste Stufe der Digitalisierung, d.h. digitale Photos (scans) an, wie z.B. der AIS in Gestalt des NavigAIS oder der  SDS im Hinblick auf das Orginalmaterial. Kein einziger älterer Atlas wurde bislang in Form eines strukturierten Korpus aufbereitet, das auch den Export der Daten gestattet. Immerhin konnte eine solche Lösung auf der Basis einer Kooperationsvereinbarung für den ALD gefunden werden; dem Druck dieses Atlas’ von Hans Goebl lag ein digitales Format zu Grunde, das zwar wegen fehlender Identifikatoren der Inhalte nicht interoperabel war, sich aber nach bestimmten Adaptationen als maschinenlesbar und entsprechend nachnutzbar erwies; alle Bezeichnungen relevanter Konzepte erscheinen daher in VerbaAlpina (vgl. das ALD-Ortsnetz und dieses Beispiel).

Findable Accessible Interoperable Reusable
menschl. masch. menschl. masch. masch. menschl. masch.
ALI
SDS + + + +
AIS + + + +
ALD + + + + +
VA + + + + + + +

Anders, deutlich komplexer, erscheint die Lage im Bezug auf georeferenzierbare Wörterbücher; die seit kurzem verfügbare Online Version des DRG ist so eingerichtet, dass jedes Lemma dank eines Identifikators als digitales Objekt zugänglich ist (A), so zum Beispiel bargia ‘Schopf’. Ein maschineller Export ist jedoch nicht vorgesehen, und es ist erkennbar, dass auch die technische Möglichkeit der unmittelbaren Referenzierung auf ein Lemma über eine URL eher ein technisches „Abfallprodukt“ ist, das sich mehr oder minder zufällig bei der Softwareentwicklung ergeben hat. Jedenfalls wird kein Zitier-Link angeboten und es scheint generell keine konkreten Hinweise für die Nutzer auf diese Möglichkeit zu geben, so dass der Gebrauch letztlich der „Gerissenheit“ des Nutzer überlassen ist.

Seit kurzem existiert eine Reihe von online-Lexika zu zwei ladinischen Dialekten, dem Gadertalischen (Badiot) und dem Grödnerischen (Gherdëina) (https://www.micura.it/de/woerterbuecher). Allesamt werden verantwortet vom ladinischen Kulturinstitut in St. Martin in Thurn (Istitut Ladin Micurà de Rü) und alle sind offenkundig als Derivate von Publikationen in Buchform entstanden. Zugrunde liegen jeweils zwei Lexika für das Deutsche (Mischì, Giovanni, Wörterbuch deutsch – gadertalisch = Vocabolar todësch – ladin, San Martin de Tor 2001 [ISBN 88-8171-028-5]; ders., Wörterbuch : Deutsch – Grödner-Ladinisch = Vocabuler : tudësch – ladin de Gherdëina, San Martin de Tor 2002 [ISBN 88-8171-033-1]) und das Italienische (Moling, Sara [Hg.], Dizionario italiano – ladino Val Badia; Dizionar ladin Val Badia – talian, San Martin de Tor 2016 [ISBN 978-88-8171-120-8];
Forni, Marco [Hg.], Dizionario italiano – ladino gardenese = Dizioner ladin de gherdëina – talian, San Martin de Tor 2013 [978-88-8171-106-2]), wobei lediglich die italienischen Lexika die biderektionale Perspektive Italienisch⇔Badiot und Badiot⇔Italienisch bedienen; die deutschen Lexika sind monodirektional Deutsch⇒Badiot bzw. Deutsch⇒Gherdëina angelegt.

Der lexikalische Bestand dieser Werke ist nunmehr also auch im Internet verfügbar, wobei die konkrete Vorgehensweise bei der Digitalisierung und auch die Struktur des zugrundeliegenden Datenbestands vollkommen unklar ist. Die Aufteilung des Datenbestands in vier voneinander getrennte Buchpublikationen spiegelt sich, überraschender- und gleichzeitig unnötigerweise, auch in der Datenpräsentation im Internet wider. Jedem Lexikon entspricht ein eigenes Internet-Portal. Dabei wurden die beiden Portale für die deutschen Lexika offenkundig von anderen Entwicklern konzipiert und realisiert als die italienischen.

  1. Badiot⇔Italienisch (und vice versa): http://itavalbadia.ladinternet.it/
  2. Badiot⇒Deutsch: https://www.micura.it/de/dizionars/vb/dl
  3. Gherdëina⇔Italienisch: http://dizionario-italiano-gardenese.ladinternet.it/ (= http://forniita.ladinternet.it/)
  4. Gherdëina⇒Deutsch: https://www.micura.it/de/dizionars/gh/dl

Verantwortlich für die Internetportale der italienischen Daten ist die Florentiner Firma SmallCodes, die seit Jahren technische Lösungen im Umfeld der (vor allem ober-)italienischen Dialektforschung entwickelt. Die Entwickler der Portale der Deutsch-Ladin-Lexika werden nicht genannt.

Entsprechend der Aufteilung auf vier Portale sind auch die jeweiligen Datenbestände nicht aufeinander bezogen, was z.B. die Folge hat, dass man bei einer Suche ausgehend von der italienischen Bezeichnung lumaca (SCHNECKE) zwar das gadertalische sgnech geliefert bekommt, nicht jedoch die deutsche Bezeichnung Schnecke, die ihrerseits über das deutschsprachige Portal mit sgnech verknüpft ist. Auf die mit sgnech offenkundig eng verbundene Variante snech im Grödnerischen gelangt man wiederum nur nach einer gesonderten Suche auf dem entsprechenden Portal – und dies, obwohl die beiden Portale (Italienisch⇔Badiot und Italienisch⇔Gherdëina) von der selben Firma entwickelt worden sind. All dies dokumentiert, dass die Datenbestände, die im Grunde unter einem institutionellen Dach vereint sind, zumindest technisch nicht aufeinander bezogen und somit im Sinne der FAIR-Prinzipien nicht ‘interoperabel’ sind. Dies gilt gleichermaßen auch für die Anknüpfungsmöglichkeiten von außerhalb: Eine unmittelbare Referenzierung auf die soeben exemplarisch genannten morpholexikalischen Typen sgnech, snech und lumaca ist technisch nicht möglich. Eine Ausnahme sind lediglich die deutschsprachigen Versionen der online-Lexika, die wenigstens den URL-basierten Verweis auf das deutsche Lemma erlauben (z.B. https://www.micura.it/de/woerterbuecher/vb/dl?q=Schnecke), eine Referenzierung auf die ladinischen Typen ist technisch jedoch auch hier nicht möglich.

Beklagenswert ist ferner die schlechte Auffindbarkeit der in den Lexika versammelten morpholexikalischen Typen von außerhalb der eigentlichen Portale, also über das Internet oder etwa über Bibliothekskataloge. Allerdings liegt dies nicht in der Verantwortung der Einzelakteure, sondern beruht auf dem Fehlen von Aggregatoren, die voneinander getrennt generierte und verwaltete Datenbestände unter Einsatz geeigneter Metadatenschemata miteinander verknüpfen können. Derartige Strukturen sind derzeit erst in ihrer Entstehungsphase. Als Beispiel wäre etwa die „Generic Research Data Infrastructure“ (GeRDI) zu nennen, an der u.a. VerbaAlpina als Partner- und Pilotprojekt beteiligt ist. In jedem Fall hat die mangelhafte Auffindbarkeit zur Folge, dass die hier thematisierten ladinischen Online-Wörterbücher auch einem weiteren im Akronym FAIR formulierten Postulat – dem „F“: Findable – nicht genügen. Das Gleiche gilt auch für die verbleibenden FAIR-Forderungen der Zugänglichkeit (A: Accessible) und der Nachnutzbarkeit (R: Reusable). Zwar ist die Zugänglichkeit über das Internet grundsätzlich möglich, sie erfährt jedoch ganz wesentlich dadurch eine Einschränkung, als der Datenbestand lediglich durch manuelle Formulareingaben abgefragt werden kann. Ein vollständiger oder wenigstens partieller Export der Daten auf Basis frei zu definierender Filter ist anscheinend nicht möglich. Auch existiert offenkundig keine API, die eine wichtige Voraussetzung für die maschinelle Verarbeitung, auch und gerade im Sinne der Verknüpfung mit kongruenten externen Datenbeständen, darstellt. Das Fehlen einer API bedingt gleichzeitig und zusätzlich die mangelnde Interoperabilität der Daten. Die Nachnutzbarkeit der Daten schließlich wird nicht zuletzt entscheidend durch das Lizenzmodell beschränkt, unter dem sie zur Verfügung gestellt werden: Das Copyright gestattet die Nutzung der Daten nur in sehr beschränktem Umfang, nach deutschem Recht im Wesentlichen nur im Rahmen dessen, was das Zitatrecht erlaubt.

Die hier thematisierten ladinischen Online-Wörterbücher machen insofern also nur auf den ersten Blick den Eindruck von zeitgemäßen Webpublikationen. Es ist begrüßenswert, dass das Material überhaupt im Internet verfügbar ist, und bestimmte Funktionen und Konzepte gehen über das hinaus, was herkömmliche Buchpublikationen zu leisten im Stande sind. Dazu gehört zum einen die Präsentation von Tonaufnahmen (auf die wiederum nicht verlinkt werden kann) sowie das Vorhandensein eines onomasiologischen Tools („galleria immagini“ in den Italienisch-Ladinischen Modulen; wiederum nicht per URL referenzierbar), das den Datenbestand über anklickbare Abbildungen aufschlüsselt. Letztlich jedoch sind auch die Webportale mit den Beschränkungen behaftet, die eigentlich nur dem Buch zu eigen sind, und es ist offenkundig, dass hier nicht mit der gebotenen Entschlossenheit und Konsequenz die Möglichkeiten der neuen Medien genutzt werden. Aus Sicht von VerbaAlpina ist dies vor allem deswegen bedauerlich, weil eine auch nur punktuelle (und gerne wechselseitige) Verknüpfung der eigenen Datenbestände mit den Beständen der ladinischen Wörterbücher de facto unmöglich ist.

Ebenfalls nur durch manuelle Formulareingaben ist der Niev Vocabulari sursilvan online bieten selbst diese Möglichkeit nicht an, so dass an Interoperabilität nicht zu denken ist.

2.3. FAIRness der Kooperation

VA wird von zahlreichen Partner-Projekten unterstützt; das große Potential dieser Kooperation ist selbstverständlich und bedarf eigentlich keiner Erläuterung. Dennoch soll die konstruktive Perspektive der mehrfachen und komplementären Nachnutzung kompatibler Partnerprojekte an einem Beispiel illustriert werden: Im Rahmen des  Archivio lessicale dei dialetti trentini (ALTR) wurden fünf gedruckte Dialektwörterbücher  unterschiedlicher Talschaften (aus der Zeit zwischen 1955 und 1984) in einer Datenbank zusammengeführt. Dank einer Projektpartnerschaft  konnte VA die relevanten Ausdrücke konvertieren und importieren, so dass sie nun im Kontext aller Alpendialekte kartographisch dargestellt werden können; vgl. die folgende Bezeichnung eines Geräts zum Buttern: smalzaia).

Als interoperabel in der Kooperation hat sich auch die Projektarchitektur und die entsprechende Software bereits erweisen; so konnte probeweise das sizilianische Regional- und Spezialwörterbuch von Sottile 2002 ohne Schwierigkeiten nachgenutzt und als Atlas dargestellt werden (vgl. den Atlante linguistico della Sicilia online, der seit 2019 durch die sizilianischen Partner ausgebaut wird). Auch der im Entstehen begriffene Atlas des Pikardischen in Nordfrankreich und Belgien greift seit dem Herbst 2018 auf die Konzeption und Technologie von VA zurück (vgl. Verba Picardia).

2.4. FAIRness im Crowdsourcing

Crowdsourcing-Verfahren richten sich in allererster Linie, wenngleich nicht ausschließlich, an Laien; sie setzen deshalb eine intuitiv leichte Auffindbarkeit und Zugänglichkeit zentraler Datenbereiche für menschliche Nutzer voraus. Die Daten werden durch die Art der Erhebung in ein strukturiertes und interoperables Format gebracht, das Nachnutzung gestattet. VA nutzt crowdsourcing in doppelter Weise: Zunächst wurde ein ästhetisch ansprechendes und einfach zu bedienendes Tool zur Datenerhebung programmiert (Mitmachen!); dafür wurde auch ein Tutorial auf Youtube gepostet. Ferner wurde soeben ein Zooniverse-Auftritt eingerichtet, um die für Retrodigitalisierung erforderliche Transkriptionsarbeit wenigstens teilweise an die Crowd weiterzugeben (🔗). Auch dafür ist Interoperabilität der VA-Datenbasis die Voraussetzung.

Das Erhebungstool wurde durch populärwissenschaftliche Vorträge in der Erwachsenenfortbildung einschlägiger Berufsgruppen (am 20.4.2018, 26.2.2018, 7.10.2017) beworben und fand daneben auch ein schönes massenmediales Echo. Die Auswertung ist interessant, denn es zeigt sich, dass vor allem Projektberichte im Internet relevant sind, da dort über einen Link ein direkter, sozusagen intramedialer Zugang angeboten werden kann: Das mit Abstand stärkste Echo fand deshalb ein Post auf der Internetseite des Bayerischen Rundfunks (am 27.4.2018); insgesamt wurden durch die 955 ‘Crowder’ bislang  11486 Dialektformen (Stand: 12.3.2019) beigesteuert  (🔗).

3. Aktuelle Entwicklungen und Perspektiven

VerbaAlpina hat eine nennenswerte und immer noch anwachsende Anzahl von Projektpartnern gewinnen können. Im Zuge der Bemühungen um Nachhaltigkeit und Nachnutzbarkeit im Sinne der FAIR-Prinzipien ist vor kurzem auch eine Kooperation mit dem CLARIN-D Centre Leipzig zustande gekommen, deren vorrangiges Ziel es ist, die VerbaAlpina-Projektdaten zusätzlich auch in diesem Repositorium unterzubringen. Derzeit wird an der Datenübertragung gearbeitet, die über die seit kurzem verfügbare API des VA-Projektportals erfolgen wird.

VerbaAlpina stellt jedem Projektpartner eine eigene MySQL-Datenbank zur Verfügung, die auf dem selben Datenbankcluster betrieben wird wie die VerbaAlpina-Datenbank. Art und Umfang der Nutzung dieser Datenbanken ist sehr unterschiedlich. Hervorzuheben ist, dass aktuell systematisch und in größerem Umfang lexikalisches Material aus dem Atlante linguistico della Sicilia (ALS) in die entsprechende Partnerdatenbank (PVA_ALS) übertragen wird. Dabei handelt es sich um Sprachdaten aus den Madonie, einem an der Nordküste Siziliens gelegenen Gebirge, in dem traditionell auch Vieh- und Milchwirtschaft betrieben wird. Die in die Partnerdatenbank übertragenen Daten werden automatisch auch auf dem von der ITG betriebenen online-Portal mit integrierter interaktiver Karte visualisiert (http://www.als-online.gwi.uni-muenchen.de/carta/). Aus onomasiologischer Perspektive ist das Material des ALS in weiten Teilen kongruent zu dem von VerbaAlpina gesammelten Material aus dem Alpenraum und eröffnet somit erweiterte Möglichkeiten, überregionale Zusammenhänge zu erkennen, wie dies im Rahmen des Projekts exemplarisch schon erfolgt ist (s. Krefeld, T.: s.v. “tomme / toma (f. (roa.)”, in: VerbaAlpina-de 18/2, Lexicon alpinum, https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D2374%26db%3D182%23L616 ). Die logische Verknüpfung zwischen dem Datenbestand in PVA_ALS mit dem VA-Datenbestand stellt allerdings eine große Herausforderung dar, die im Rahmen von VerbaAlpina bestenfalls skizzenhaft verwirklicht werden kann. In der Praxis würde die Verschränkung der beiden Datenbestände durch die wechselseitige Zuweisung der Konzepte und morpholexikalischen Typen zu einer gemeinsamen, zentralen Normdateninstanz erfolgen. Nach Vorstellung von VerbaAlpina könnte dies modellhaft für die Entwicklung einer universalen Lexikographie sein, die zeit- und raumübergreifend (nicht nur) lexikalische Zusammenhänge sichtbar werden lassen könnte.

DataCite Beispiel S_ID_Staff_Fara_San_Martino (Zitieren)

TKrefeld
(188 Wörter)

sehr seltsam: beim Kopieren des 

 

10.5282/verba-alpina_S6030_v1_182 VerbaAlpina Institut für Romanische Philologie, Ludwig-Maximilians-Universität München IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität MünchenKrefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke 1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München  Universitätsbibliothek, Ludwig-Maximilians-Universität München 2019 Fara San Martinostaffa (f.)(roa.) STEIGBÃœGEL (BÃœGEL, FÃœR DIE FÃœSSE DES REITERS, AM SATTEL, AUS EISEN) 410 Linguistics 450 Italian, Romanian, Rhaeto-Romatic Shifted Western Romance 004 Data processing computer science Krefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke 1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München Englmeier, David David Englmeier 1170932088 VerbaAlpina, Ludwig-Maximilians-Universität München Kunzmann, Markus Markus Kunzmann 1170932126 VerbaAlpina, Ludwig-Maximilians-Universität München Mutter, Christina Christina Mutter 1170932207 VerbaAlpina, Ludwig-Maximilians-Universität München Wiatr, Aleksander Aleksander Wiatr 1170932290 VerbaAlpina, Ludwig-Maximilians-Universität München Zacherl, Florian Florian Zacherl 1170932363 VerbaAlpina, Ludwig-Maximilians-Universität München 1928-1940 2019-03-01 de Linguistic Data S6030 Q191657 [Speicherort des Forschungsdatums] [VerbaAlpina-Schnittstelle] 1 dataset text/csv 18/2 CC-BY-SA 4.0 Fara San Martino42.0632476806641 14.0841150283815 42.0632476806641 14.2364578247071 42.119701385498114.2364578247071 42.1197013854981 14.0841150283815 42.0632476806641 14.0841150283815 DFG0000000120969829 253900505 Langfristvorhaben

DataCite Beispiel L_ID_ ALP(E) (Zitieren)

TKrefeld
(244 Wörter)

10.5282/verba-alpina_L6_v1_182 VerbaAlpina Institut für Romanische Philologie, Ludwig-Maximilians-Universität München IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität MünchenKrefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke 1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München  Universitätsbibliothek, Ludwig-Maximilians-Universität München 2019 Alp(e) (f.)(gem.) AlbChääschäller(gem.) Chääschäller (m.) Alpa(gem.) Alpe(gem.) 410 Linguistics 430 Germanic languages German High German 004 Data processing computer science Krefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München Englmeier, David David Englmeier 1170932088 VerbaAlpina, Ludwig-Maximilians-Universität München Kunzmann, Markus Markus Kunzmann 1170932126 VerbaAlpina, Ludwig-Maximilians-Universität München Mutter, Christina Christina Mutter 1170932207 VerbaAlpina, Ludwig-Maximilians-Universität München Wiatr, Aleksander Aleksander Wiatr 1170932290 VerbaAlpina, Ludwig-Maximilians-Universität München Zacherl, Florian Florian Zacherl 1170932363 VerbaAlpina, Ludwig-Maximilians-Universität München 1969-20172019-02-28 de Linguistic Data L6 Q2649726 Q54969716 Q136689 [Speicherort des Forschungsdatums][VerbaAlpina-Schnittstelle] http://dx.doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D133%26db%3D182%26single%3DL6 34 datasets text/csv 18/2 CC-BY-SA 4.0Contains all VerbaAlpina datasets, which are related to the morphological tpye „Alp(e) (f.) (gem.)“ Lermoos47.3804244995118 10.816430091858 47.3804244995118 10.9383115768433 47.485519409179710.9383115768433 47.4855194091797 10.816430091858 47.3804244995118 10.816430091858 Biberwier47.3355407714844 10.8195247650146 47.3355407714844 10.9208869934081 47.399864196777410.9208869934081 47.3998641967774 10.8195247650146 47.3355407714844 10.8195247650146 Scharnitz47.3269996643068 11.211187362671 47.3269996643068 11.515175819397 47.4498634338378 11.51517581939747.4498634338378 11.211187362671 47.3269996643068 11.211187362671 Umhausen 47.075450897216710.8224449157716 47.0754508972167 11.0632524490356 47.1878623962403 11.063252449035647.1878623962403 10.8224449157716 47.0754508972167 10.8224449157716 Neustift im Stubaital46.9616584777833 11.0871801376343 46.9616584777833 11.3703689575195 47.143093109130911.3703689575195 47.1430931091309 11.0871801376343 46.9616584777833 11.0871801376343 Kals am Großglockner 46.9151649475098 12.5792837142944 46.9151649475098 12.758877754211447.1227226257325 12.7588777542114 47.1227226257325 12.5792837142944 46.915164947509812.5792837142944 Nauders 46.8404045104982 10.468228340149 46.8404045104982 10.620218276977746.9391899108887 10.6202182769777 46.9391899108887 10.468228340149 46.840404510498210.468228340149 Curon Venosta 46.7328414916992 10.4263095855713 46.7328414916992 10.761982917785846.8760032653809 10.7619829177858 46.8760032653809 10.4263095855713 46.732841491699210.4263095855713 Malles Venosta 46.642318725586 10.405312538147 46.642318725586 10.737071990966846.8053932189941 10.7370719909668 46.8053932189941 10.405312538147 46.642318725586 10.405312538147Glorenza 46.6350059509278 10.5093641281128 46.6350059509278 10.5760078430177 46.680267333984410.5760078430177 46.6802673339844 10.5093641281128 46.6350059509278 10.5093641281128 Campo Tures46.8741111755372 11.8859157562256 46.8741111755372 12.1641902923584 47.008953094482512.1641902923584 47.0089530944825 11.8859157562256 46.8741111755372 11.8859157562256 Sluderno46.6310195922852 10.5692024230957 46.6310195922852 10.6546821594238 46.678764343261810.6546821594238 46.6787643432618 10.5692024230957 46.6310195922852 10.5692024230957 Prato Allo Stelvio 46.5567893981935 10.4942407608033 46.5567893981935 10.6491022109986 46.651809692382910.6491022109986 46.6518096923829 10.4942407608033 46.5567893981935 10.4942407608033 Lasa46.5222625732422 10.6045026779175 46.5222625732422 10.7263269424438 46.688266754150410.7263269424438 46.6882667541504 10.6045026779175 46.5222625732422 10.6045026779175 Stelvio46.4695892333984 10.4540348052979 46.4695892333984 10.6517009735108 46.617332458496210.6517009735108 46.6173324584962 10.4540348052979 46.4695892333984 10.4540348052979 Malans (Graubünden) 46.9706573486328 9.55534839630133 46.9706573486328 9.61232852935802 47.0163154602059.61232852935802 47.016315460205 9.55534839630133 46.9706573486328 9.55534839630133 Nova Ponente46.3490867614747 11.3406267166138 46.3490867614747 11.5658426284791 46.460868835449211.5658426284791 46.4608688354492 11.3406267166138 46.3490867614747 11.3406267166138 Saas Grund46.1073646545411 7.93709278106689 46.1073646545411 8.02246475219738 46.16289138793958.02246475219738 46.1628913879395 7.93709278106689 46.1073646545411 7.93709278106689 Riederalp46.3405342102052 8.00111103057873 46.3405342102052 8.07120990753174 46.40952301025398.07120990753174 46.4095230102539 8.00111103057873 46.3405342102052 8.00111103057873 Davos46.6739883422853 9.72252082824707 46.6739883422853 9.96433830261236 46.86113739013689.96433830261236 46.8611373901368 9.72252082824707 46.6739883422853 9.72252082824707 DFG0000000120969829 253900505 Langfristvorhaben

DataCite Beispiel A_ID_ FARA SAN MARTINO (Zitieren)

TKrefeld
(179 Wörter)

10.5282/verba-alpina_A12317_v1_182 VerbaAlpina Institut für Romanische Philologie, Ludwig-Maximilians-Universität München IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität MünchenKrefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke 1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München Universitätsbibliothek, Ludwig-Maximilians-Universität München 2019 Fara San Martino 410 Linguistics450 Italian, Romanian, Rhaeto-Romatic Shifted Western Romance 004 Data processing computer science Krefeld, Thomas Thomas Krefeld 123778689 Institut für Romanische Philologie, Ludwig-Maximilians-Universität München Lücke, Stephan Stephan Lücke 1167274636 IT-Gruppe Geisteswissenschaften (ITG), Ludwig-Maximilians-Universität München Englmeier, David David Englmeier 1170932088 VerbaAlpina, Ludwig-Maximilians-Universität München Kunzmann, Markus Markus Kunzmann 1170932126 VerbaAlpina, Ludwig-Maximilians-Universität München Mutter, Christina Christina Mutter 1170932207 VerbaAlpina, Ludwig-Maximilians-Universität München Wiatr, Aleksander Aleksander Wiatr 1170932290 VerbaAlpina, Ludwig-Maximilians-Universität München Zacherl, Florian Florian Zacherl 1170932363 VerbaAlpina, Ludwig-Maximilians-Universität München 1928-1940 2019-03-01 de Linguistic Data A12317 Q191657 [Speicherort des Forschungsdatums] [VerbaAlpina-Schnittstelle] 1 dataset text/csv 18/2 CC-BY-SA 4.0 Contains all VerbaAlpina datasets, which are related to the community „Fara San Martino“ Fara San Martino 42.063247680664114.0841150283815 42.0632476806641 14.2364578247071 42.1197013854981 14.236457824707142.1197013854981 14.0841150283815 42.0632476806641 14.0841150283815 DFG 0000000120969829253900505 Langfristvorhaben