Methodologie

Sortierung

Alle Einträge anzeigen

(no Tag)   Crowdsourcing   Dokumentation   Forschungslabor   Kooperation   Publikation  


Crowdsourcing  (Zitieren)

Obwohl bereits viele relevante Sprachdaten zu den Gegenstandsbereichen von VerbaAlpina vorliegen (vor allem in Atlanten und Wörterbüchern), ist es vorgesehen, neue Daten zu erheben. Damit sollen (1) Inkonsistenzen zwischen den bereits vorliegenden Quellen ausgeglichen, (2) Lücken bzw. Ungenauigkeiten beseitigt und (3) überkommene Bezeichnungen bzw. Geräte als solche gekennzeichnet werden. Die Neuerhebungen werden aber nicht mit den klassischen Verfahren der Feldforschung durchgeführt, sondern mit den Mitteln, die uns die sozialen Medien inzwischen zur Verfügung stellen. Entsprechende Verfahren werden oft unter dem Ausdruck crowdsourcing zusammengefasst.
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008. Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.

(auct. Thomas Krefeld)


Tags: Crowdsourcing



Digital Humanities  (Zitieren)

Das Projekt VerbaAlpina wurde von vornherein mit Blick auf Webtauglichkeit konzipiert, denn es will ganz entschieden zur Überführung der etablierten geisteswissenschaftlichen Traditionen, genauer: der Geolinguistik, in die Digital Humanities beitragen .
Das bedeutet:
(1) Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
(2) Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
(3) Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
(4) Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld)

Tags: Kooperation Crowdsourcing



Funktionsbereich (4): Crowdsourcing  (Zitieren)

Damit ist die Erhebung von Neudaten über das Internet gemeint, die im zweiten Halbjahr 2016 aktiviert werden soll. Diese Funktion wird auf ein umfangreiches, noch nicht öffentliches Archiv ethnographischer Fotos und Videos zurückgreifen.

Herausheben des Käsebruchs (Tannheim, Bezirk Reutte, Tirol, 1940)

auct. Thomas Krefeld

Tags: Crowdsourcing



Georeferenzierung  (Zitieren)

Ein wesentliches Ordnungskriterium der in VerbaAlpina verwalteten Daten ist die Georeferenzierung unter Verwendung von Breiten- und Längengraden. Die Genauigkeit dieser Referenzierung variiert je nach Datentyp, wobei grundsätzlich eine möglichst exakte, metergenaue Referenzierung angestrebt wird. Im Fall der Sprachdaten aus Atlanten und Wörterbüchern ist in aller Regel lediglich eine vergleichsweise ungefähre Referenzierung nach Maßgabe eines Ortsnamens möglich, im Fall von z. B. archäologischen Daten hingegen sind tatsächlich metergenaue Georeferenzierungen möglich. Es können Punkte, Linien (etwa Straßen, Flüsse u. Ä.) und Flächen gespeichert werden. Aus technischer Perspektive findet hauptsächlich das sogenannte WKT-Format (https://en.wikipedia.org/wiki/Well-known_text) Verwendung, das in der VA-Datenbank mit der Funktion geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html in ein spezifisches MySQL-Format überführt und so gespeichert wird. Die Ausgabe im WKT-Format erfolgt durch die MySQL-Funktion astext().
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Dokumentation Kooperation Crowdsourcing



Informant  (Zitieren)

Der Ausdruck wird in VerbaAlpina technisch verstanden, denn er fasst je nach Quelle zwei unterschiedliche Dinge zusammen: In den Atlanten sind alle Sprachdaten in der Regel bis ‘hinunter’ zum Sprecher transparent; in der Datenbank sind diese Informanten über eine individuelle Nummer identifizierbar (ID). Sie sind weiterhin über das Jahr der Erhebung chronoreferenziert und über den Ort der Erhebung georeferenziert. In geoferenzierbaren Wörterbücher ist es dagegen in aller Regel unmöglich, konkrete Sprecher zu identifizieren. Aus datenbanktechnischen Gründen werden aber auch den Quellen dieser Gattung fiktive Informanten zugeschrieben. Jeder Informant ist einer Sprachfamilie zugeordnet; diese Sprachzuweisung wird an alle auf ihn zurückgehenden Sprachdaten ‘vererbt’.

(auct. Thomas Krefeld)

Tags: Kooperation Crowdsourcing



Quellen  (Zitieren)

In VerbaAlpina werden sehr unterschiedlichen Quellen zusammengeführt. Zu unterscheiden sind bereits publizierte Quellen (Atlanten, Wörterbücher, Ortsmonographien) auf der einen Seite und neue, das heißt durch das Projekt selbst erstmals erschlossene Quellen andererseits; hierzu gehören von Mitarbeitern, wie z. B. von Beatrice Colcuc, erhobene Daten ebenso wie solche, die durch die crowd, d.h. individuelle und nicht persönlich bekannte Sprecher, beigesteuert werden. In Frage kommen ausschließlich Quellen, die bereits georeferenzierte oder wenigstens georeferenzierbare sprachliche Daten liefern. Allerdings müssen diese Daten vor dem Hintergrund der Typisierung systematisch unterschiedlich behandelt werden. Phonetisch exakt transkribierte Äußerungen werden von VerbaAlpina als 'Einzelbeleg' ausgewiesen. Es ist nun sinnvoll, diese Einzelbelege nach bestimmten Kriterien zu gruppieren ('typisieren'); Daten, die von der Quelle in orthographischer Gestalt angeboten werden, können von vornherein als typisiert angesehen werden, da durch diese Form der Verschriftung sehr viel phonetische Varianz ausgeblendet wird. VerbaAlpina gibt daher nicht nur die Quelle an, sondern präzisiert auch den systematischen Status ('Einzelbeleg' vs. 'phonetischer Typ' vs. 'morpho-lexikalischer Typ') des jeweiligen sprachlichen Datums, das die Quelle liefert. Nicht als Quellen gelten die Referenzwörterbücher, mit denen die morpho-lexikalischen Typen lexikographisch abgesichert und im Idealfall verlinkt werden. Dazu die folgenden Beispiele:

(1) Die Quelle liefert einen Einzelbeleg:

Einzelbeleg: [a̠lpˈejo̞] – Ort: Bassano del Grappa – Quelle: ALD-II 848_1, 181 (Valrovina)
Phonetischer Typ: (nicht typisiert)
Morpho-lexikalischer Typ: Treccani alpeggio (rom. m.)
Basistyp: alpe; vgl. DELI 42
Konzept: ALM

(2) Die Quelle liefert einen phonetischen Typ:

(Kein Einzelbeleg vorhanden) – Ort: Adelboden
Phonetischer Typ: Anke – Quelle: SDS V_179_1, BE104
Morpho-lexikalischer Typ: Anke (ger. m.), vgl. Idiotikon s.v. Anke, 1, 341 ff.
Basistyp: anko; vgl. Kluge 2001, 47
Konzept: BUTTER


(3) Die Quelle liefert einen morpho-lexikalischen Typ:

(Kein Einzelbeleg vorhanden) – Ort: St. Peter-Pagig
Phonetischer Typ: Putter – Quelle: SDS V_179_1, GR22
Morpho-lexikalischer Typ: Butter (ger. n.), vgl. Idiotikon s. v. [[Butter, 1, 341 ff. – Quelle: SDS V_179_1, GR22
Basistyp: butyru(m); vgl. DELI 178
Konzept: BUTTER


(4) Die Quelle liefert einen morpho-lexikalischen Typ, der zwar im Standarddeutschen existiert, jedoch mit einem anderen Konzept verbunden ist:

Morpho-lex. Typ: Pelz Duden s.v. Pelz (nicht für dieses Konzept); Idiotikon s.v. Belz P-, 4, 1222 – Quelle: SDS V_162_1
Konzept: HAUT AUF DER MILCH, BEIM ABKÜHLEN NACH DEM KOCHEN

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Dokumentation Kooperation Crowdsourcing



Sprachkontakt  (Zitieren)

Beim Sprachkontakt, zu dem auch der Varietätenkontakt gehört, sind zwei grundverschiedene Typen zu unterscheiden, je nachdem ob es sich – auf der Ebene des sprachlichen Systems – um feste, sprecherunabhängige Integrate ('Entlehnungen') oder aber – auf der Ebene des Sprechers – um indivuelle Erscheinungen handelt. Letztere wiederum können habitualisierten oder ganz okkasionellen Verwendungen, so genannten switchings, entsprechen. Dieser Vorbehalt ist auch bei der Interpretation älterer Atlasmaterialien immer dann zu berücksichtigen, wenn ein Informant eine standardnahe Form oder, in zweisprachigen Gebieten, eine Form der jeweiligen Zweitsprache liefert. Der theoretisch fundamentale Unterschied ist angesichts der sprachlichen Daten mehr oder weniger wahrscheinlich, jedoch eigentlich nie evident. Nur die Vermehrung der Informanten, die mit social media zu einer durchaus realistischen Option wird, verspricht hier zuverlässige Auskunft.

(auct. Thomas Krefeld)



Tags: Publikation Crowdsourcing



Wissenschaftskommunikation im Web  (Zitieren)

VerbaAlpina kann als eine webbasierte raumorientierte Forschungsumgebung beschrieben werden. Dieses Format wird bestimmt durch die aktuellen Rahmenbedingungen, die sich ganz erheblich von der traditionellen Wissenschaftskommunikation unterscheiden. In allen Disziplinen, die in ‚klassischer‘ Weise mit empirischen Daten arbeiten, lassen sich drei einander folgende Phasen unterscheiden:
  1. Der Wissenschaftler sucht Informanten.
  2. Die Informanten liefern dem Wissenschaftler Rohdaten.
  3. Der Wissenschaftler gibt eine bestimmte Menge der erhobenen Daten, die im Lichte theoretischer Annahmen selektiert und modelliert wurde, an ein im Wesentlichen wissenschaftliches Publikum weiter.
Die Kommunikation in den drei Phasen verläuft unidirektional und zielt auf in sich abgeschlossene, dinghafte Publikationen, d.h. auf gedruckte Bücher.

Die drei Schritte der traditionellen Wissenschaftskommunikation

Die Neuen Medien haben die Rahmenbedingungen für die Wissenschaftkommunikation revolutioniert: die skizzierte Unidirektionalität der Informationsflusses ist ebenso aufgehoben wie die Bindung der Rolle (INFORMANT, AUTOR, LESER) an unterschiedliche Personen; grundsätzlich kann sich ein und dieselbe Person in schnell wechselnden Funktionen an der Kommunikation beteiligen. Von Grund auf verändert ist im Hinblick auf die Kommunikanten die Funktion INFORMANT, da die Behandlung der gelieferten Daten transparent bleibt und kontinuierlich verfolgt werden kann. Der INFORMANT wird so zum LESER seiner eigenen DATEN – ganz unabhängig davon, ob er die wissenschaftliche Intention überhaupt versteht; gleichzeitig eröffnet sich ihm die Möglichkeit, dazu als AUTOR Stellung zu nehmen. Nicht weniger radikal verändert sich unter diesen Bedingungen der Status Daten selbst, da sie in grundsätzlich dynamischen Datenbank abgelegt werden, deren Umfang und Struktur Veränderungen unterworfen bleibt.


Wissenschaftskommunikation unter den Bedingungen des Internet

In diesem Sinn sind in VerbaAlpina unterschiedliche, aber eng miteinander verflochtene Funktionsbereiche angelegt.

(auct. Thomas Krefeld)

Tags: Kooperation Publikation Crowdsourcing