Methodologie

Sortierung

Alle Einträge anzeigen

(no Tag)   Crowdsourcing   Dokumentation   Forschungslabor   Kooperation   Publikation  


Betacode  (Zitieren)

In Anlehnung an die Terminologie des Thesaurus Linguae Graecae (TLG), der das entsprechende Konzept Anfang der 1970er Jahre für die elektronische Erfassung altgriechischer Texte mit den damaligen computertechnischen Mitteln entwickelt hatte, wird im Rahmen von VerbaAlpina die Transkription komplexer Schriftsysteme unter ausschließlicher Verwendung von ASCII-Zeichen als "Betacode" bezeichnet.
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):





Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel das Häkchen unterhalb des u im Wort tu durch eine öffnende runde Klammer wiedergegeben: tu(. Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Betacodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.

(auct. Thomas Krefeld | Stephan Lücke)

Tags: Dokumentation Kooperation Forschungslabor



Datenmodellierung  (Zitieren)

s. Relationales Datenmodell

Tags: Dokumentation Kooperation Forschungslabor



Datenzugriffsschicht  (Zitieren)

Der Zugriff auf das Modul VA_DB erlaubt, unmittelbar in den primären Projektdaten zu recherchieren. Dieser Zugriff kann entweder durch den Menschen (über das Modul VA_WEB) oder durch Maschinen bzw. Programme erfolgen. Letzteres Szenario besteht z. B. auch projektintern bei der Kommunikation zwischen den Modulen VA_WEB und VA_DB, betrifft aber auch automatische Zugriffe z. B. von Rechnern bzw. Programmen der VA-Projektpartner. Im Laufe der Entwicklungsarbeiten im Bereich der Module VA_WEB und VA_DB ist es aus informatischer bzw. programmiertechnischer Sicht nicht selten erforderlich, bestehende Datenstrukturen zu verändern und an neue Erfordernisse anzupassen. Dies kann im Fall des Zugriffs durch einen Menschen zu Verwirrung führen, im Fall des Zugriffs durch eine Maschine bzw. ein Programm führt es schlicht zu einer Fehlfunktion. Um diesem Problem zu begegnen, wird innerhalb von VA_DB eine – zumindest weitgehend – stabile Datenstruktur zwischengeschaltet, in die hinein die veränderlichen primären Datenstrukturen projiziert werden.

auct. Stephan Lücke

Tags: Kooperation Publikation Forschungslabor



Funktionsbereich (5): Forschungslabor  (Zitieren)

Es ist ferner vorgesehen, ein virtuelles Forschungslabor einzurichten, das alle interessierten Nutzer einlädt, die von VerbaAlpina entwickelten geolinguistischen Tools (verschiedene kartographische Darstellungen,Typisierungsstufen u.a.) individuell zu nutzen und neue, womöglich auch alternative Analysen und Ergebnisse zu präsentieren. Selbstverständlich können auch die Tools selbst weiterentwickelt werden.

auct. Thomas Krefeld


Tags: Forschungslabor



Gruppieren und Sortieren  (Zitieren)

Nicht selten sind in den Kategorien, die in der 'interaktiven Karte' ausgewählt werden können, bereits zahlreiche sprachliche Ausdrücke verfügbar; so führt die Suche nach dem 'Konzept' BUTTER (vgl. die folgende Abb.) zu 1449 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren:

BUTTER_sortieren
Eine Sortierung nach Basistypen zeigt die sprachgrenzüberschreitenden Verbreitungsareale, hier den romanischen Typen butyru(m) im deutschen Sprachgebiet und den deutschen Typ Schmalz im romanischen.

SCHMALZ_BUTYRU
  • Basistyp Schmalz (111 Belege)
  • Basistyp butyru(m) (913 Belege)
Eine entsprechende Option ergibt sich auch bei der Suche nach morpho-lexikalischen Typen; vor allem die Sortierung nach dem Kriterium 'Konzept' ist auch unabhängig von erfassten Sprachraum von Interesse, weil sie die Polysemie eines jeden Ausdruck freilegt. Hier zwei screenshots der Vorgehensweise am Beispiel von malga:

malga_sortieren
Als Ergebnis resultieren die folgenden Bedeutungen, die untereinander in klarer metonymischer Beziehung stehen:

Malga_Karte Polysemie des morpho-lexikalischen Typs malga

Tags: Dokumentation Forschungslabor



Kartographie  (Zitieren)

Die Kartographie ist ein vielleicht nicht ganz unumstrittenes, aber gut bewährtes Verfahren der Sprachgeographie, denn sie dient gleichermaßen der Dokumentation wie der Visualisierung räumlicher Relationen (vgl. die Beiträge in Lameli 2010). Die üblichen Verfahren unterscheiden sich deutlich in ihrer Prägnanz; im Fall so genannter ‘analytischer’ Karten werden sprachliche (Teil-)Äußerungen wiedergeben, so dass die Dokumentation stark im Vordergrund steht und die Aufdeckung der eigentlich räumlichen Beziehungen zwischen den dokumentierten Formen dem Leser überlassen bleibt. Bei den so genannten Punktsymbolkarten werden dagegen durch die ‘synthetische’ Symbolvergabe direkt die räumlichen Relationen zwischen einzelnen Äußerungsaspekten zum Ausdruck gebracht. Quantitative Verhältnisse lassen sich nur so wiedergegeben. Die Online-Kartierung von VerbaAlpina erfolgt auf georeferenzierter Grundlage und kombiniert beide Verfahren, insofern sie zwar auf den ersten Blick ‘synthetische’ Karten anzeigt, auf den zweiten Blick, nach Klick auf das Symbol, jedoch Zugriff auf die (Teil-)Äußerung gibt.
Das heuristisches Potential der Kartographie ist beachtlich; daher wird dem Nutzer von VerbaAlpina die Option angeboten, unterschiedliche Datenklassen aus einer Kategorie (z. B. mehrere Basistypen) oder aus den unterschiedlichen Kategorien (z. B. außersprachliche und sprachliche Daten) auf synoptischen Karten zu kombinieren und zu kumulieren.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist.

Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Thomas Krefeld)

Tags: Dokumentation Forschungslabor



Stratigraphie  (Zitieren)

Die Alpen sind seit prähistorischer Zeit ein Gebiet vielfältiger Sprachkontakte, die auf ganz unterschiedliche Stratakonstellationen zurückgehen. Grundsätzlich werden Sprachen, die in einem Gebiet in Kontakt stehen, weil es dort mehr oder weniger zweisprachige Sprecher oder gar Sprechergemeinschaften gibt, als Adstrate bezeichnet. Falls ein Basistyp nur in einem bestimmten Gebiet verbreitet ist, also etwa in den Alpen, und in den betroffenen Sprachfamilien ansonsten nicht vorkommt, sind die Entlehnungsrichtung und die Herkunftssprache oft nicht eindeutig (vgl. den Basistyp rom. baita / dt. Beiz, Beisl).
Wenn die Herkunftssprache des entlehnten Elements im Verbreitungsgebiet, oder in einem Teil davon, nicht mehr gesprochen wird, werden zwei Konstellationen unterschieden: Im Fall des Substrats wurde die Herkunftssprache (Substratsprache) im Verbreitungsgebiet gesprochen, bevor ihre Überlieferungskontinuität abriss und die geltende Sprache sich durchsetzte; das Romanische ist eine Substratsprache des gesamten deutsch- und slowenischsprachigen Alpengebiets. Substratwörter setzen zwar Sprachwechsel voraus; sie zeichnen sich aber trotzdem oft durch außerordentliche regionale oder lokale Kontinuität aus.
Im Falle des Superstrats galt die Herkunftssprache während eines gewissen Zeitraums im Verbreitungsgebiet, ohne sich dort dauerhaft zu etablieren. So herrschten in Teilen des heute romanischsprachigen Alpenraums nach dem Zusammenbruch der römischen Infrastruktur zeitweise germanische Superstrate (Gotisch, Langobardisch) und in Slowenien spielte das Deutsche während der Habsburgerzeit diese Rolle.
Zwischen den drei Sprachfamilien haben sich nun durchaus unterschiedliche Szenarien ergeben; hinsichtlich der Bedeutung des Sprachkontakts für die Geschichte des sprachlichen Raums ist vor allem die Chronologie der Entlehnung wichtig: Handelt es sich beispielsweise bei Romanismen im germanischen und slawischen Sprachraum um Substratwörter mit regionaler Überlieferungskontinuität seit der Antike oder um jüngere adstratale Übernahmen? Dieselbe Frage gilt mutatis mutandis für die Germanismen im romanisch- bzw. slawischsprachigen und die Slawismen im deutschund romanischsprachigen Raum.
Entlehnungen sind ein zuverlässiger Indikator historischer Akkulturationsprozesse; deshalb ist eine quantitative Darstellung angebracht, die es gestattet, die relative Häufigkeit der belegten Entlehnungen ortsgenau abzubilden. Die Akkulturationsrichtung ist jedoch keineswegs immer eindeutig; nicht selten koexistieren in eng definierten onomasiolgischen Bereichen gegenläufige Entlehnungen. Die folgende Graphik schematisiert die stratigraphische Herausforderung. Sie differenziert die drei heute romanisch-, deutsch- und slowenischen Gebiete nach Substrat- und Superstratsprachen und symbolisiert (durch Kugeln) die mehrsprachigen Sprechergruppen in Adstratkonstellationen.



(auct. Thomas Krefeld)

Tags: Dokumentation Kooperation Forschungslabor



Synoptische Karte  (Zitieren)

Diese Funktion erlaubt es dem Nutzer, eine getroffene Auswahl an Karten auf einer synoptischen Kombinationskarte zu fixieren . So können die Verbreitungsgebiete beliebiger sprachlicher und außersprachlicher Merkmale im Zusammenhang visualisiert werden. Gleichzeitig besteht die Möglichkeit, diese synoptischen Karten in Zoomstufen festzuhalten, wenn ein lokaler Kontext, wie z.B. das Karwendel oder das okzitanisch-frankoprovenzalisch-piemontesische Dialektkontinuum der Westalpen, dokumentiert werden soll.

(auct. Thomas Krefeld)  

Tags: Dokumentation Kooperation Forschungslabor