Methodologie

Bislang existiert für die in der Methodologie publizierten Beiträge noch keine Volltextsuche. Eine solche befindet sich in Planung und Entwicklung und wird in einer der nächsten VerbaAlpina-Versionen zur Verfügung stehen. Bis dahin kann behelfsmäßig, nach Aufruf von "Alle Einträge anzeigen", die Volltextsuche der Browser (meist Strg+F) verwendet werden.
Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Mehrwortlexie

Unter einer Mehrwortlexie versteht VerbaAlpina eine spezifische Abfolge von Einzelwörtern (Tokens), die gemeinsam ein bestimmtes oder auch unterschiedliche Konzepte bezeichnen. So wird beispielsweise unter anderem im Grödnertal (AIS 1192_1, 312) das ALMHÜTTE als casa da fuoco (ʧˌaz dɑ fˈuɑk), wörtlich 'Feuerhaus' bezeichnet; in anderen Dialekten (Engadin, Tessin u.a.) bezeichnet dieselbe Zusammensetzung das Konzept KÜCHE.

Aus informatischer Perspektive ergibt sich dabei das Problem einer mehrschichtigen Konzeptzuordnung, die im relationalen Datenmodell abgebildet werden muss: Neben der Bedeutung der Mehrwortlexie als ganzer besitzen die Einzelwörter eigene Bedeutungen, die ein Licht auf die Motivation der Bildung der Mehrwortlexie werfen. Um diese Besonderheit zu berücksichtigen, werden in der Datenbank von VerbaAlpina sogenannte Tokengruppen verwendet. Ein Beleg, der aus mehreren Einzelwörtern besteht, wird hierbei in seine Bestandteile aufgespalten und diese werden in der Tabelle `tokens` abgelegt. Jedes dieser Tokens verweist dabei auf ein und denselben Eintrag in der Tabelle `tokengruppen` und speichert zusätzlich seine Position in der Tokengruppe (1., 2. usw. Stelle), so dass die Mehrwortlexie aus den Einzeltokens rekonstruiert werden kann. Ein explizites Speichern der Mehrwortlexie ist somit nicht nötig; in der Tabelle `tokengruppen` werden also (außer der ID der Tokengruppe) nur zusätzliche Informationen abgelegt, die aus den Einzeltokens nicht hervorgehen können, wie beispielsweise das Genus der Tokengruppe.

Eine Zuordnung von Konzepten findet sowohl auf Ebene der Tokens als auch auf Ebene der Tokengruppen statt. Für das obige Beispiel gibt es damit drei Einträge in der Tabelle Tokens, denen jeweils unterschiedliche Konzepte zugeordnet sind:



Die Zuweisung von Konzepten zu den Bestandteilen erfolgt mit Hilfe der Wörterbücher. Für das jeweilige Teilkonzept wird der häufigste Eintrag aus dem Lexikon übernommen. Da die Teilkonzepte nicht abgefragt wurden, ist möglich, dass sie teilweise der Realität nicht entsprechen.
Zusätzlich gibt es einen Eintrag in der Tabelle `Tokengruppen` mit einer eigenen Konzeptzuordnung:



Bei der kartographischen Darstellung an der Oberfläche von VerbaAlpina werden Tokens und Tokengruppen gleichberechtigt behandelt, das heißt, eine Suche nach dem Konzept ALMHÜTTE liefert sowohl Tokengruppen also auch Tokens, die mit diesem Konzept verbunden sind. Einzelwörter, die nur als Bestandteil einer Mehrwortlexie belegt sind, werden dabei entsprechend markiert.

(auct. Stephan Lücke | Florian Zacherl)

Tags: Linguistik



Metadaten

Beim Umgang mit Daten wird gerne zwischen Primärdaten und Metadaten unterschieden. Als Metadaten gelten alle Daten, die die Primärdaten beschreiben. Anstelle von "Metadaten" können auch die bedeutungsidentischen Bezeichnungen "Attribute" oder "Merkmale" verwendet werden. Im Zuge der Datenmodellierung wird festgelegt, welche Primärdaten durch welche Metadaten beschrieben werden müssen oder können. Die Kategorie "Metadatum" zerfällt wiederum in einzelne Metadatenkategorien. Für jede Metadatenkategorie werden außerdem die jeweils zulässigen Werte definiert.

Am besten ist dieses System an einem Beispiel zu demonstrieren. Die gegebenen Primärdaten seien Personen. Jede Person sei durch ihren Namen, Vornamen, Geburtsort, Geburtsdatum sowie ihre Augenfarbe beschrieben. Die zulässigen Werte könnten wie folgt beschrieben werden:

Name: Zeichenkette, bestehend aus Buchstaben
Vorname: Zeichenkette, bestehend aus Buchstaben
Geburtsort: Zeichenkette, bestehend aus Buchstaben
Geburtsdatum: Datum in der Form JJJJ-MM-TT
Augenfarbe: Ein Wert aus der Liste "braun, grün, blau"

Jedes Individuum sollte durch die Summe aller Werte in den verschiedenen Metadatenkategorien eindeutig beschrieben werden. Sobald der Fall auftritt, dass eine Duplizität im Datenbestand auftritt, also zwei Individuen mit vollkommen identischen Werten in allen Metadatenkategorien auftreten, muss das Metadatenschema als unzulänglich betrachtet und modifiziert werden.

(auct. Stephan Lücke)

Tags: Informationstechnologie



Metadatenschema

Ganz allgemein gesprochen dienen Metadatenschemata der systematischen Beschreibung von Gegenständen oder Sachverhalten sowie deren Beziehungen untereinander. Ganz wesentlich ist dabei die Definition von Entitäten und deren spezifischen Eigenschaften, wobei strenggenommen die Grenze zwischen Beschreibung und Definition verschwimmt.

Grundsätzlich können Metadatenschemata für beliebige Bereiche definiert werden, maximalen Nutzen entfalten sie jedoch erst, wenn sie als weithin akzeptierter Standard etabliert sind. Der Mehrwert besteht dabei hauptsächlich darin, dass sich inhaltlich kompatible Datenbestände eindeutig aufeinander beziehen bzw. mit einander verknüpfen lassen (Interoperabilität). Insofern spielen Metadatenschemata auch eine wichtige Rolle im Hinblick auf die Erfüllung der FAIR-Prinzipien. Die Abbildung eines Metadatenschemas kann in unterschiedlicher Gestalt erfolgen. So ist dies z.B. in Listen, Tabellen- oder XML-Form möglich. Eine graphische Darstellung kann in Form eines sog. Entity-Relationship-Diagramms (ERD) erfolgen. Das damit verbundene Konzept des Entity-Relationship-Modells (ERM) scheint mit "Metadatenschema" bedeutungsidentisch zu sein.

Aus der Perspektive von VerbaAlpina spielen Metadatenschemata zunächst im Hinblick auf die Verwaltung des eigenen Datenbestands eine Rolle, wobei hier ein projektspezifisches, nicht standardisiertes, gleichwohl jedoch dokumentiertes Metadatenschema Anwendung findet. Hauptsächlich für den Export der VA-Daten in externe Datenrepositorien kommen auch etablierte Standard-Metadatenschemata zum Einsatz. So wird z.B. der Kerndatenbestand von VerbaAlpina, d.h. das georeferenzierte und konzeptbezogene morpholexikalische Material aus VA_DB, im Zuge der Übertragung in das Open-Data-Repositorium der Universitätsbibliothek der LMU mit dem vom gleichnamigen Konsortium kuratierten Metadatenschema Datacite beschrieben. Zusätzlich wird der Kerndatenbestand von VerbaAlpina im Metadatenschema CIDOC-CRM abgebildet, das eine inhaltliche Tiefenerschließung des Materials zum Ziel hat. CIDOC-CRM wird üblicherweise als eine "Ontologie" bezeichnet. Die Abbildung der VA-Daten auf die dort definierten Klassen und Eigenschaften und die anschließende formale Repräsentation des Ergebnisses, das sodann die primären VA-Daten und die sekundären CIDOC-CRM-Metadaten synoptisch kombiniert, rechtfertigt dennoch, CIDOC-CRM als "Metadatenschema" zu bezeichnen. Das Beispiel zeigt, wie fließend die Übergänge sein können und wie unscharf der Begriff "Metadatenschema" bisweilen erscheinen kann. Unabhängig von allen terminologischen Fragen sollte es bei der Erschließung von Forschungsdaten im Wesentlichen darum gehen, Metadaten in strukturierter, einer Ontologie folgenden Form in einem verbreiteten Austauschformat (z.B. RDF) zur Verfügung zu stellen.

Die Erschließung der VA-Kerndaten sowohl mit DataCite als auch mit CIDOC-CRM erfolgt im Rahmen des Forschungsprojekts eHumanities – interdisziplinär, das drei Jahre lang (bis 2021) vom Bayerischen Ministerium für Wissenschaft und Kunst gefördert wird und sich mit der Herausforderung des Forschungsdatenmanagements (FDM) befasst. VerbaAlpina besitzt innerhalb von eHumanities – interdisziplinär den Status eines Pilotprojekts.

(auct. Stephan Lücke | Julian Schulz [ITG])

Tags: Informationstechnologie



Mitmachen!

VerbaAlpina freut sich über jede Unterstützung und bietet unterschiedliche Möglichkeiten für eine aktive Beteiligung an der Projektarbeit.

Es geht z. B. darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen.

Sehr interessiert sind wir auch an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wenn Sie Kenntnisse eines im Alpenraum gesprochenen Dialekts haben, dann würden wir uns freuen, wenn Sie spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina eintragen würden. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z.B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich an unserem Projekt in dieser Weise beteiligen. – Sie haben Bilder von alpentypischen Objekten? Etwa Fotos von Almen, Hütten, Flora, Fauna, Bergen und Landschaft? Dann laden Sie diese doch in unsere Mediathek und halten fest, wo das Bild wann entstanden ist, was darauf zu sehen ist und – sofern Ihnen bekannt – geben einen spezifischen Dialektausdruck zur Bezeichnung für das Abgebildete an.

Parallel zur gezielten Mitarbeit bei VerbaAlpina können Sie sich in unserem System eine eigene Forschungsumgebung einrichten, die Sie für die Sammlung von, hauptsächlich, Sprach- jedoch durchaus auch anderen Daten verwenden können. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Sie haben die Möglichkeit, diese Daten gleichsam ausschließlich für Ihre persönliche Verwendung unter Verschluss zu halten, können sie jedoch auch für den Zugriff anderer Nutzer freigeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Wir möchten Sie dazu ermuntern, möglichst viel von Ihren Daten der Allgemeinheit zur Verfügung zu stellen. Nur auf diese Weise kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.

Um VerbaAlpina zu unterstützen und/oder das System für eigene Interessen zu nutzen, ist es nötig, sich auf unserem Portal zu registrieren: https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register

(auct. Stephan Lücke)

Tags: Webseite



Module

s. Versionierung.

Tags: Informationstechnologie