Alles auf Null (und Eins) – Forschungskommunikation in virtueller Umgebung, am Beispiel von VerbaAlpina (Präsentation) (Zitieren)

Stephan Lücke


(1630 Wörter)

Vortrag, gehalten von Thomas Krefeld und Stephan Lücke am 19.05.2021 im Rahmen der von Prof. Dr. Christine Haug, Dr. Marcel Schellong im Sommersemester 2021 veranstalteten "Vortragsreihe Forschungspotential der Digital Humanities in der Buch- und Literaturwissenschaft" (Programm)


0. Vorab

1. Übersicht

2. Projektvorstellung

3. Technische Umsetzung

4. Theorie der Forschungskommunikation in virtueller Umgebung

5. Herausforderungen der Virtualität/Digitalität für die Forschungskommunikation

2. VerbaAlpina

  • "Lexikographisches" Projekt mit Focus auf dem Alpenraum
  • Wörter aus dem Umfeld typisch alpiner Konzeptdomänen (Alm- und Milchwirtschaft, Fauna, Flora, Ökologie, Tourismus); Konzeption in der Tradition der romanistischen Ethnolinguistik)
  • sprachgrenzüberschreitend im germanischen, romanischen und slawischen Sprachraum; (vgl. Sprachfamilien im Alpenraum und Karte)
  • Berücksichtigung auch und vor allem dialektaler Ausdrücke
  • Quellen: in der Hauptsache Sprachatlanten und Wörterbücher
  • Ergänzung/Abrundung/Ausgleich durch Crowdsourcing
  • Wesentliche Voraussetzung: Georeferenzierung (geographische Verortung von Einzelbelegen)
  • Dadurch: Dokumentation von Verbreitungsarealen bestimmter Lexeme (u. a. interessant: Verbreitungsareale, die die Grenzen von Sprachfamilien überschreiten, z. B.: lat. excŏcta,  sowohl im germ., rom. als auch slaw. Sprachraum)
  • Visualisierung durch eine interaktive Karte (vgl. Karte excŏcta)
  • Bidirektionale Perspektive:
  • In diesem Sinn auch Überwindung der Gattungen (Lexika: "Vom Wort zur Sache", Sprachatlanten: "Von der Sache zum Wort")
  • Förderung durch die DFG als "Langfristvorhaben" seit 2014 (derzeit Phase 3, bis 2023)
  • Personelle Ausstattung: 2 Sprachwissenschaftler, 2 Informatiker, Hilfskräfte (Team)
  • VA in sprachwissenschaftlicher Hinsicht: interlinguale Geolinguistik (zutreffender als ‘Dialektologie’)

 

3. Technische Umsetzung

  • VA ist vollständig digital konzipiert (konsequenter Verzicht auf Papier)
  • Ausschließlich Einsatz von Web-Technologie (daher u. a. kein Powerpoint ...)
  • grundsätzlich keine proprietäre/kostenpflichtige Software, nur Open Source
  • Content Management System (CMS): WordPress
  • Backend: MySQL-Datenbank
  • Entwicklung zahlreicher "Tools" durch die Projektinformatiker, z. B.:
    • Interaktive online-Karte
    • LexikonAlpinum
    • Transkriptionstool
    • Typisierungstool
    • Crowdsourcingtool (Link)
    • ...
  • Multifunktionales Webportal:
    • Arbeitsinstrument für Erzeugung von Inhalten (Datensammlung, Datenverarbeitung und -aufbereitung)
    • Publikation von Inhalten
    • Kommunikation (z. B. Sitzungsprotokolle)

 

4. Theorie der Forschungskommunikation in virtueller Umgebung1

  • Wesentlicher Teil des Selbstverständnisses: Selbstreflexion ⇒ Rubrik Methodologie (Verwendung im vorliegenden Beitrag)
  • Sprachwissenschaft und Informationstechnik nicht einfach additiv, sondern im aristotelischen Sinn mehr als die Summe der beiden Teile ⇒ Einsatz der Informationstechnik verändert Sprachwissenschaft substantiell (Wesen der DH ganz generell)

Graphik 1

  • Die durch die technischen Möglichkeiten veränderten Rahmenbedingungen verlangen, die traditionellen Formen der Wissenschaftskommunikation2 zu überdenken und diese an den neuen Möglichkeiten auszurichten.
  • Entsprechende Reflexion und exemplarische Umsetzung ist eines der Ziele von VA

Traditionell mit dem Medium des Buchdrucks

Graphik 2

  • Drei Phasen:
    • Forscher sucht und sammelt Informationen (= Rohdaten von Quellen, Informanten)
    • Forscher verarbeitet und *selektiert* (theoriegebunden) Informationen
    • Forscher publiziert die Ergebnisse auf Papier (= öffentlicher medialer Diskurs)
      • ausschließlich 'finale' Relevanz des Publikationsmediums
      • teilweise Fremdbestimmung des AUTORs durch die VERLAGe (z.B. Sprachwahl)
      • extrem eingeschränkte Zugänglichkeit des Produkts (in Bibliotheksregalen)
  • feste Bindung der kommunikativen Rollen (AUTOR – QUELLE – LESER) an Personen

Digital und im Web (2.0)

  • Web ermöglicht einen Neustart des öffentlichen medialen Diskurses ('auf Null')
  • genuin digital ('0' | '1')

Graphik 3

Publikation

  • permanente Relevanz von Publikationsmedien während des gesamten Forschungsprozesses
    • substantielle Änderung des Publikationsbegriff
      • nicht nur Text: alles im gestrichelten Oval von Graphik 3 ist publikationsfähig
      • Live-Daten können publiziert werden (Link)
    • Hoheit | Kontrolle in der Kompetenz des Projekts (100% selbstbestimmt)

Graphik 4

Transparenz der Daten

  • Relation zwischen den publizierten Informationen einsehbar
    • Beispiel Transkription: Original – Beta – IPA

Graphik 5 – Link

  • im Fall von VA: LESER → Datenbankabfrage der Primärdaten

Graphik 6 – Link

Wechsel der kommunikativen Rollen

im Fall von VA:

  • LESER → QUELLE (CS-Reaktion auf VA-Öffentlichkeitsarbeit)

Graphik 7 – Beispiel Januar 2021 (Facebook) Link

Graphik 8 – Beispiel April-Mai 2018 (HP BR, Bayern 2) Link

  • QUELLE → AUTOR
    • durch Eingabe neuer KONZEPTE, Button 'Begriffe vorschlagen', Link):

Graphik 9

    • Definition und Fixierung eigener Karten

Graphik 10 – Link

5. Herausforderungen der Virtualität/Digitalität für die Forschungskommunikation

  • Vorteile des gedruckten Buchs:
    • dauerhaft
    • unveränderbar
    • stabil zitierbar ⇒ Titel, Seite/Spalte
    • institutionell abgesichert ⇒ Bibliotheken
  • Vorteile von Digitalität/Virtualität:
    • (theoretisch) grenzenlose Verfügbarkeit
    • elektronische Verknüpfbarkeit von Inhalten
    • vergleichsweise geringe Kosten
    • Erleichterung von Zusammenarbeit (Erzeugung von Inhalten durch große Anzahl von Beteiligten/Autoren)
    • Multimedialität (Text, Ton, Bild – auch in 3D)
    • Erleichterung des bidirektionalen Austausches Autor ⇔ Leser (etwa durch Kommentarfunktion)
    • Unabhängigkeit von Verlagen
    • ...
  • Wesentliche Nachteile der Digitalität/Virtualität:
    • prekäre Stabilität ("Flüchtigkeit"; dabei geht es um Änderungen im Detail genauso wie um vollständiges Verschwinden)
    • Fehlen eines verbindlichen Referenzsystems (Ersatz für Buchseiten)
    • bislang noch nicht etablierte Strukturen bzw. Zuständigkeiten

ZIEL: Nutzung der Vorteile der Digitalität *ohne* Verlust der Vorteile des Buches

Antworten von VA

Prekäre Stabilität

  • Versionierung: Jeweils zu Jahresmitte und -ende "Einfrieren" des Datenbestands
    • Technisch: Anfertigung einer Kopie der Projektdatenbank:

Graphik 11 – Die verschiedenen Versionen der VA-Datenbank auf dem MySQL-Datenbankcluster der ITG

    • Arbeitsversion: XXX (bedingt zitierfähig; Stabilität der Inhalte nicht garantiert)
    • Wechsel in Zitierversionen ⇒ Inhalte garantiert stabil

Graphik 12

  • In zitierfähigen Versionen von VA: Einblendung von Zitierlinks:

Graphik 13 – Zitierlink in der Version 20/2 von VerbaAlpina

Adressierbarkeit

Feingranulare URLs/DOIs

VA und Normdaten

  • Normdaten generell wichtig für inhaltlich/semantisch exakte und außerdem maschinell operationalisierbare wechselseitige Referenzierung zwischen verschiedenen Datenbeständen (im Sinne der Forschungskommunikation)
  • Vorteile von Normdaten:
    • Normdaten schließen Ambiguitäten aus
    • Normdaten vereinfachen Datenmappings:

Graphik 14 – Vereinfachtes Mapping durch Verwendung  von Normdaten

    • Normdaten müssen klar definiert und stabil sein
    • Normdaten entfalten maximalen Nutzen bei maximaler Akzeptanz (nicht steuerbar)
  • VA-Nutzung externer Normdaten:
    • Identifikatoren von Referenzlexika (für morpholexikalische Typen)
    • Wikidata-QIDs (für Konzepte)
    • Geonames-IDs (für Georeferenzen)
    • künftig?: Wikidata L-IDs (für morpholexikalische Typen; aktuell problematisch, da mit VA inkompatibel)

Graphik 15 – Einbindung externer Normdaten (Geonames, Wikidata-QIDs, URLs von Referenzwörterbüchern) – Link

Graphik 16

Basistyp B180 im XML-Format (Screenshot)

Institutionelle Absicherung

  • Wesentlicher Aspekt: Für die dauerhafte Bewahrung von Wissen braucht es verantwortliche Institutionen mit unbefristeter Existenzperspektive
  • Aus Sicht von VA sind die wissenschaftlichen Bibliotheken der natürliche Partner
  • VA hat sich daher schon früh an die UB der LMU gewandt
  • VA-Daten werden in das Forschungsdatenrepositorium der UB übertragen (Entwicklung der entsprechenden Prozeduren in den letzten Jahren)
  • seit Mai 2021: Discover@UB:

Graphik 17 – Suchportal des UB-Forschungsdatenrepositoriums (Link)

    • Strukturierter Kerndatenbestand von VerbaAlpina
    • derzeit 222630 Datensätze (Versionen 19/1 und 19/2)
    • unterschiedliche Granularität (komplette Versionen,
    • Einbindung von generischen Metadaten (Datacite, DDC)
    • Ad-Hoc-Erzeugung von DOIs für Einzelobjekte

Graphik 18 – Ad-Hoc-Erzeugung einer DOI für einen VA-Datensatz auf Discover@UB (Link)

  • Neben UB: Enge Anbindung an ITG
  • ITG übernimmt Betrieb und Pflege des VA-Portals auch über das Projektende hinaus ("post mortem"; im Rahmen der technischen und personellen Möglichkeiten)

Graphik 19 – Institutionelle Einbettung von VerbaAlpina

Ungelöstes (unlösbares?) Problem: "Lebende" Systeme (Webportale)

  • Dauerhafter, unbefristeter Betrieb von Webportalen bedarf permanenter Pflege
  • Zwei Kernprobleme:
    • Ständige Veränderung der Softwareumgebung (Betriebssysteme, Frameworks) ⇒ Updates (v. a. wegen Sicherheitsproblematik)
    • Abhängigkeit von externen Ressourcen durch Vernetzung ("tote" Links; instabile Inhalte)
  • Beispiel für Abhängigkeit: VA auf archive.org:

Graphik 20 – Fehlermeldung von Google auf der frühesten bei archive.org archivierten VerbaAlpina-Version

  • ⇒ gekapselte Systeme (z. B. Dockerimages) keine Lösung wegen Abhängigkeiten durch Vernetzung
  • Notbehelf: Detaillierte Dokumentation der Funktionsweise des Webportals (zusammen mit Dokumentation von Datenbank und entwickeltem Softwarecode ⇒ Künftige "Rekonstruktion" der Funktionalitäten des Webportals zumindest theoretisch möglich)

 

Wir danken für Ihre Aufmerksamkeit!

***


  1. Die Überlegungen dieses Kapitels gehen im Kern auf Krefeld 2011 zurück; sie flossen also bereits in die Konzeption von VerbaAlpina ein und wurden im Zuge der Projektarbeit kontinuierlich elaboriert. 

  2. Der Ausdruck wird oft enger gefasst und im Sinne von "externer Forschungskommunikation" verwandt; dann bezeichnet er ausschließlich die divulgative "Kommunikation von Forschung über Fachgrenzen hinaus", so z. B. von Knöchelmann 2021; diese Verwendung wird der medialen Grundlage von Kommunikation und ihrer radikalen Veränderung nicht gerecht. Webbasierte Kommunikation muss gerade nicht trennscharf zwischen Laien- und Fachpublikum unterscheiden, sondern kann sich gleichermaßen – wenn auch nicht in identischer Weise – sowohl an das eine wie an das andere wenden. 


Bibliographie

  • Knöchelmann 2021 = Knöchelmann, Marcel (2021): Die Stunde der Vermittler, in: FAZ vom 19.5.2021, 4
  • Krefeld 2011 = Krefeld, Thomas: La raccolta di dati linguistici ai tempi dei nuovi media, Palermo, in: Gruppo di ricerca dell'Atlante Linguistico della Sicilia (Hrsg.), Per i linguisti del nuovo millennio. Scritti in onore di Giovanni Ruffino, Sellerio, 111-114