Methodologie

Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Mehrwortlexie  (Zitieren)

Unter einer Mehrwortlexie versteht VerbaAlpina eine spezifische Abfolge von Einzelwörtern (Tokens), die gemeinsam ein bestimmtes oder auch unterschiedliche Konzepte bezeichnen. So wird beispielsweise unter anderem im Grödnertal (AIS 1192_1, 312) das Konzept ALMHÜTTE als casa da fuoco (ʧˌaz dɑ fˈuɑk), wörtlich 'Feuerhaus' bezeichnet; in anderen Dialekten (Engadin, Tessin u.a.) bezeichnet dieselbe Zusammensetzung das Konzept KÜCHE.

Aus informatischer Perspektive ergibt sich dabei das Problem einer mehrschichtigen Konzeptzuordnung, die im relationalen Datenmodell abgebildet werden muss: Neben der Bedeutung der Mehrwortlexie als ganzer besitzen die Einzelwörter eigene Bedeutungen, die ein Licht auf die Motivation der Bildung der Mehrwortlexie werfen. Um diese Besonderheit zu berücksichtigen, werden in der Datenbank von VerbaAlpina sogenannte Tokengruppen verwendet. Ein Beleg, der aus mehreren Einzelwörtern besteht, wird hierbei in seine Bestandteile aufgespalten und diese werden in der Tabelle `tokens` abgelegt. Jedes dieser Tokens verweist dabei auf ein und denselben Eintrag in der Tabelle `tokengruppen` und speichert zusätzlich seine Position in der Tokengruppe (1., 2. usw. Stelle), so dass die Mehrwortlexie aus den Einzeltokens rekonstruiert werden kann. Ein explizites Speichern der Mehrwortlexie ist somit nicht nötig; in der Tabelle `tokengruppen` werden also (außer der ID der Tokengruppe) nur zusätzliche Informationen abgelegt, die aus den Einzeltokens nicht hervorgehen können, wie beispielsweise das Genus der Tokengruppe.

Eine Zuordnung von Konzepten findet sowohl auf Ebene der Tokens als auch auf Ebene der Tokengruppen statt. Für das obige Beispiel gibt es damit drei Einträge in der Tabelle Tokens, denen jeweils unterschiedliche Konzepte zugeordnet sind:



Die Zuweisung von Konzepten zu den Bestandteilen erfolgt mit Hilfe der Wörterbücher. Für das jeweilige Teilkonzept wird der häufigste Eintrag aus dem Lexikon übernommen. Da die Teilkonzepte nicht abgefragt wurden, ist möglich, dass sie teilweise der Realität nicht entsprechen.
Zusätzlich gibt es einen Eintrag in der Tabelle `Tokengruppen` mit einer eigenen Konzeptzuordnung:



Bei der kartographischen Darstellung an der Oberfläche von VerbaAlpina werden Tokens und Tokengruppen gleichberechtigt behandelt, das heißt, eine Suche nach dem Konzept ALMHÜTTE liefert sowohl Tokengruppen also auch Tokens, die mit diesem Konzept verbunden sind. Einzelwörter, die nur als Bestandteil einer Mehrwortlexie belegt sind, werden dabei entsprechend markiert.

(auct. Stephan Lücke | Florian Zacherl)

Tags: Linguistik



Metadaten  (Zitieren)

Beim Umgang mit Daten wird gerne zwischen Primärdaten und Metadaten unterschieden. Als Metadaten gelten alle Daten, die die Primärdaten beschreiben. Anstelle von "Metadaten" können auch die bedeutungsidentischen Bezeichnungen "Attribute" oder "Merkmale" verwendet werden. Im Zuge der Datenmodellierung wird festgelegt, welche Primärdaten durch welche Metadaten beschrieben werden müssen oder können. Die Kategorie "Metadatum" zerfällt wiederum in einzelne Metadatenkategorien. Für jede Metadatenkategorie werden außerdem die jeweils zulässigen Werte definiert.

Am besten ist dieses System an einem Beispiel zu demonstrieren. Die gegebenen Primärdaten seien Personen. Jede Person sei durch ihren Namen, Vornamen, Geburtsort, Geburtsdatum sowie ihre Augenfarbe beschrieben. Die zulässigen Werte könnten wie folgt beschrieben werden:

Name: Zeichenkette, bestehend aus Buchstaben
Vorname: Zeichenkette, bestehend aus Buchstaben
Geburtsort: Zeichenkette, bestehend aus Buchstaben
Geburtsdatum: Datum in der Form JJJJ-MM-TT
Augenfarbe: Ein Wert aus der Liste "braun, grün, blau"

Jedes Individuum sollte durch die Summe aller Werte in den verschiedenen Metadatenkategorien eindeutig beschrieben werden. Sobald der Fall auftritt, dass eine Duplizität im Datenbestand auftritt, also zwei Individuen mit vollkommen identischen Werten in allen Metadatenkategorien auftreten, muss das Metadatenschema als unzulänglich betrachtet und modifiziert werden.

(auct. Stephan Lücke)

Tags: Informationstechnologie



Mitmachen!  (Zitieren)

VerbaAlpina freut sich über jede Unterstützung und bietet unterschiedliche Möglichkeiten für eine aktive Beteiligung an der Projektarbeit.

Es geht z. B. darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen.

Sehr interessiert sind wir auch an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wenn Sie Kenntnisse eines im Alpenraum gesprochenen Dialekts haben, dann würden wir uns freuen, wenn Sie spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina eintragen würden. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z.B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich an unserem Projekt in dieser Weise beteiligen. – Sie haben Bilder von alpentypischen Objekten? Etwa Fotos von Almen, Hütten, Flora, Fauna, Bergen und Landschaft? Dann laden Sie diese doch in unsere Mediathek und halten fest, wo das Bild wann entstanden ist, was darauf zu sehen ist und – sofern Ihnen bekannt – geben einen spezifischen Dialektausdruck zur Bezeichnung für das Abgebildete an.

Parallel zur gezielten Mitarbeit bei VerbaAlpina können Sie sich in unserem System eine eigene Forschungsumgebung einrichten, die Sie für die Sammlung von, hauptsächlich, Sprach- jedoch durchaus auch anderen Daten verwenden können. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Sie haben die Möglichkeit, diese Daten gleichsam ausschließlich für Ihre persönliche Verwendung unter Verschluss zu halten, können sie jedoch auch für den Zugriff anderer Nutzer freigeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Wir möchten Sie dazu ermuntern, möglichst viel von Ihren Daten der Allgemeinheit zur Verfügung zu stellen. Nur auf diese Weise kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.

Um VerbaAlpina zu unterstützen und/oder das System für eigene Interessen zu nutzen, ist es nötig, sich auf unserem Portal zu registrieren: https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register

(auct. Stephan Lücke)

Tags: Webseite



Module  (Zitieren)

s. Versionierung.

Tags: Informationstechnologie