Methodologie

Sortierung

Alle Einträge anzeigen

(no Tag)   Außersprachlicher Kontext   Funktionsbereiche   Informationstechnologie   Linguistik   Webseite  


Crowdsourcing (Zitieren)

Obwohl bereits viele relevante Sprachdaten zu den Gegenstandsbereichen von VerbaAlpina vorliegen (vor allem in Atlanten und Wörterbüchern), ist es vorgesehen, neue Daten zu erheben. Damit sollen (1) Inkonsistenzen zwischen den bereits vorliegenden Quellen ausgeglichen, (2) Lücken bzw. Ungenauigkeiten beseitigt und (3) überkommene Bezeichnungen bzw. Geräte als solche gekennzeichnet werden. Die Neuerhebungen werden aber nicht mit den klassischen Verfahren der Feldforschung durchgeführt, sondern mit den Mitteln, die uns die sozialen Medien inzwischen zur Verfügung stellen. Entsprechende Verfahren werden oft unter dem Ausdruck crowdsourcing zusammengefasst.
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008).
Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.

In VerbaAlpina geht es konkret darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen. Sehr interessiert ist VerbaAlpina darüber hinaus an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wer immer also Kenntnisse eines im Alpenraum gesprochenen Dialekts hat, ist eingeladen, spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina
einzutragen. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z. B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich am Projekt in dieser Weise beteiligen. – Außerdem sind Bilder von alpentypischen Objekten, aber auch von Almen, Hütten, Flora, Fauna, Bergen und Landschaftsformen mitsamt ihren Bezeichnungen willkommen. Sie können in der Mediathek gespeichert werden.

Parallel zur gezielten Mitarbeit bei VerbaAlpina erhält jeder Nutzer die Möglichkeit, sich in unserem System eine eigene Forschungsumgebung einzurichten, die für die Sammlung von hauptsächlich Sprachdaten, jedoch durchaus auch von anderen Daten verwendet werden kann. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Er hat die Möglichkeit, diese Daten gleichsam ausschließlich für die persönliche Verwendung unter Verschluss zu halten oder aber den Zugriff anderen Nutzern freizugeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Nur wenn möglichst viel Daten der Allgemeinheit zur Verfügung gestellt werden, kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.


(auct. Thomas Krefeld | Stephan Lücke)

Tags: Funktionsbereiche



Dokumentation (Zitieren)

VerbaAlpina dokumentiert die dialektale Variation innerhalb eines ethnographisch definierten Raums; der onomasiologische Rahmen wird durch kulturelle Techniken und Lebensformen abgesteckt, die sich unter den jeweils spezifischen, auch kulturunabhängigen Umweltbedingungen konventionalisiert haben. Dergleichen Räume, die durch die Alpen in prototypischer Weise repräsentiert werden, konnten die sprachwissenschaftlichen Forschungstraditionen nicht angemessen erfassen, da sich die Teildisziplinen, die sich systematisch mit der Konstitution von Räumen beschäftigen – also die Sprachgeographie bzw. Dialektologie oder auch Geolinguistik – beinahe ausnahmslos an vorgegebenen politischen und/oder (einzel)sprachlichen Grenzen orientieren. Der räumliche Zuschnitt zentraler und in mancher Hinsicht bis heute maßgeblicher Unternehmungen ist zwar nachzuvollziehen (vgl. etwa den AIS und das FEW) – zustimmen mag man jedoch oft nicht. Gerade die besonders faszinierenden mehrsprachigen Kulturräume, also z. B. das Gebiet zwischen der montenegrinisch-albanischen Adriaküste und der Donau, fallen daher durch das Raster der etablierten, durch nationalphilologische Voreinstellungen gesteuerten Forschung. Der ambitioniert geplante Atlante linguistico mediterraneo hätte ein richtungweisendes Großprojekt werden können; er ist jedoch über Ansätze niemals hinausgekommen.
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).

Perspektive

Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Hinblick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.

Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als Ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.

Kartographie

Den Zugang zur Dokumentation vermittelt vor allem ein interaktive Karte. Bislang werden zur Visualisierung nur Punktsymbolkarten mit interaktiven Symbolen eingesetzt. Komplementär wird eine interaktive Flächensymbolisierung auf Basis der Gemeindeflächen vorbereitet, um eine bessere Visualisierung quantitativer Verhältnisse zu erzielen. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern.

Linguistische Datenaufbereitung

Bei Aktivierung ('Klick') eines Punktsymbols öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten; das folgende Beispiel zeigt die Bezeichnung des Konzepts BUTTER in Ramosch (Unterengadin):



Präsentation der sprachlichen Daten mit einem Pop-up-Fenster der interaktiven Karte

Die Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Demnächst kommen – wenn möglich – Verweise auf Referenzwörterbücher hinzu.

Filter

Mehrere Filter erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen. Der oben gezeigte Kartenausschnitt stammt aus der Karte, die bei Auswahl des 'Konzepts' BUTTER erscheint:



Filter zu Steuerung der interaktiven Karte

Gruppieren und Sortieren

Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) führt zu 1448 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:



Die Sortierfunktion der interaktiven Karte: Konzepte

Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen oder Basistypen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig vom erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdrucks freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:





Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen:



Polysemie des morpho-lexikalischen Typs malga

Quellen

Bislang wurden einige georeferenzierbare Wörterbücher, vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:
    1. Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.).


    2. Das von VA entwickelte Transkriptionstool

    3. Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD und den ALTR praktiziert.
    4. Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; dies gilt bislang vor allem für SAO-Daten.

    Multidimensionalität

    Für ein umfassendes Verständnis der historischen Prozesse ist es unbedingt wünschenswert, die sprachliche Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die
    • Orte mit lateinischen Inschriften in der Provinz Noricum ;
    • Orte mit lateinischen Inschriften aus Raetien ;
    • aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae .
    Andererseits wurden die Reflexe von drei lateinischen, genauer: zwei lateinischen und einem latinisierten aber mutmaßlich vorrömischen Basistypen aufgerufen:
    • Basistyp lat. casearia in der Bedeutung 'Hütte'  in Nord-, Süd- und besonders prägnant in Osttirol;
    • den Basistyp vorröm. baita in der Bedeutung 'Haus'   in Slowenien südlich von Ljubljana;
    • den Basistyp lat. cellarium in der Bedeutung 'Hütte'  in Oberösterreich.


    Synoptische Karte zur lateinischen Epigraphik, den Tabula Peutingeriana-Orten und den Basistypen cellarium und baita in einem Teil des deu. und slow. Raums (vgl. die Legende oberhalb der Karte)

    Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.

    (auct. Thomas Krefeld)

    Tags: Funktionsbereiche



Forschungsumgebung (Zitieren)

Die Aufgaben und Leistungen von VerbaAlpina können den folgenden Bereichen zugeordnet werden:
(1) Dokumentation und sprachgeschichtliche Analyse des dialektalen Wortschatzes, der nach Maßgabe des onomasiologischen Rahmes als charakteristisch eingeschätzt wird;
(2) Kooperation mit Projektpartnern zum gegenseitigen Datenaustausch und zur Datenanalyse;
(3) Publikation des Datenbestandes, analytischer Texte und unterschiedlicher, projektbezogener Materialien, die sich teils an die fachliche, teils an die breite Öffentlichkeit richten.
Die Funktionen (1) bis (3) wurden mit der ersten Version 15/1 bereits aktiviert ; ergänzt wurden sie mit Version 17/1 um::
(4) Datenerhebung durch Crowdsourcing.
Alle aktiven Funktionen werden kontinuierlich ausgebaut. In der Vorbereitung befindet sich schließlich:
(5) die Einrichtung eines Forschungslabors.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche



Kooperation (Zitieren)

Zusammenarbeit mit anderen Projekten ist für die Konzeption von VerbaAlpina grundlegend; sie spiegelt sich in zahlreichen Kooperationsvereinbarungen mit Projektpartnern wider. Ihre Umsetzung ist de facto jedoch nicht immer einfach; sie wird durch praktische, d.h. vor allem informationstechnische und damit verbundene datenrechtliche Probleme, aber am Rande auch ein wenig durch ideologische Vorbehalte gegenüber der open source-Ausrichtung behindert. Jede Kooperation stützt sich auf eine formale Vereinbarung, die den Partnern (PVA) eine exklusiv nutzbare Datenbank zum Upload zusichert. Jede Partner-Datenbank steht allen Partnern zum Download zur Verfügung. Aber die Kooperation soll selbstverständlich nicht auf Datenaustausch beschränkt bleiben; vielmehr sind alle Partner eingeladen (und aufgefordert), alle Funktionsbereiche zu nützen.

(auct. Thomas Krefeld)

Tags: Funktionsbereiche