Methodologie

Sortierung

(no Tag)   Außersprachlicher Kontext   Funktionsbereiche   Informationstechnologie   Linguistik   Webseite  


Betacode (Zitieren)

In Anlehnung an die Terminologie des Thesaurus Linguae Graecae (TLG), der das entsprechende Konzept Anfang der 1970er Jahre für die elektronische Erfassung altgriechischer Texte mit den damaligen computertechnischen Mitteln entwickelt hatte, wird im Rahmen von VerbaAlpina die Transkription komplexer Schriftsysteme unter ausschließlicher Verwendung von ASCII-Zeichen als "Betacode" bezeichnet.
Die folgende Graphik illustriert das Verfahren anhand eines Beispiels aus dem Sprach- und Sachatlas Italiens und der Südschweiz (AIS):





Bei der Übertragung der im Sprachatlas verwendeten phonetischen Transkription nach Böhmer-Ascoli in aus ASCII-Zeichen bestehende Sequenzen wird zunächst ganz einfach zwischen Basiszeichen und Diakritika unterschieden. Sofern ein Basiszeichen im ASCII-Code vorhanden ist, wird es bei der Übertragung durch sich selbst repräsentiert (was im gegebenen Beispiel durchweg der Fall ist). Unmittelbar hinter das Basiszeichen werden sodann nacheinander alle mit ihm verbundenen Diakritika geschrieben, wobei jedes Diakritikum durch ein spezielles ASCII-Zeichen ersetzt wird. Die Zuordnung der Diakritika zu ASCII-Zeichen ist innerhalb von VerbaAlpina eindeutig und in speziellen Tabellen der VerbaAlpina-Datenbank dokumentiert. Die Wahl der Zuordnung ist, soweit möglich, geleitet vom Prinzip der optischen Ähnlichkeit. So wird im genannten Beispiel das Häkchen unterhalb des u im Wort tu durch eine öffnende runde Klammer wiedergegeben: tu(. Die Diakritika werden ausgehend von ihrer Anordnung am Basiszeichen in der Reihenfolge unten nach oben und links nach rechts hinter das Basiszeichen geschrieben. Aufgrund des Prinzips der optischen Ähnlichkeit erfolgt die Zuordnung von Diakritika zu ASCII-Zeichen unabhängig von ihrer quellenspezifischen Semantik, in anderen Worten: Auch wenn ein Häkchen unterhalb eines Basiszeichens in der einen Quelle eine vollkommen andere phonetische Bedeutung besitzt als in einer anderen Quelle, so wird dennoch in beiden Fällen das Häkchen durch eine nachgestellte Klammer wiedergegeben. Die semantischen Unterschiede werden in den quellenspezifischen Transkriptionstabellen dokumentiert: Sie regeln die Konversion des Betacodes in die Outputtranskription gemäß IPA (ein und dieselbe Beta-Kodierung kann also je nach Quelle zu ganz unterschiedlichen IPA-Kodierungen führen).
Das beschriebene Verfahren besitzt eine Reihe von Vorteilen:
- Die Datenerfassung kann in vergleichsweise hohem Tempo auf herkömmlichen Standardtastaturen erfolgen und ist vollständig betriebsystemunabhängig,
- die Transkriptoren benötigen keine Kenntnisse der phonetischen Transkriptionssysteme,
- es lassen sich beliebige Zeichen bzw. Diakritika erfassen, unabhängig davon, ob diese in Unicode kodiert sind oder nicht, und
- die elektronische Datenerfassung erfolgt ohne Informationsverlust.
Durch Ersetzungsroutinen kann der Betacode in nahezu beliebige andere Transkriptionssysteme überführt werden. Im Zuge solcher Konvertierungen kommt es unter Umständen zu Informationsverlusten, die jedoch im Wesen der Transkriptionssysteme begründet sind. So unterscheidet die phonetische Transkription nach Böhmer-Ascoli verschiedene Öffnungsgrade in einer Granularität, die im IPA-System nicht vorgesehen ist.

(auct. Stephan Lücke | Thomas Krefeld)

Tags: Linguistik Informationstechnologie



Codepage (Zitieren)

VerbaAlpina vereinigt Daten aus verschiedenen Arten von Quellen: Daten aus gedruckten Sprachatlanten und Wörterbüchern, die zunächst noch digitalisiert werden müssen, sowie bereits elektronisch vorliegende Daten aus einer Reihe von Partnerprojekten. Jede dieser unterschiedlichen Quellen verwendet mehr oder weniger individuelle Systeme zur Transkription. Um die erforderliche Vereinheitlichung zu realisieren, sind Listen nötig, in denen festgelegt ist, welches Schriftzeichen im Transkritionssystem der einen Quelle welche Entsprechung im Transkriptionssystem der anderen Quelle besitzt. Hauptsächlich geht es darum, die unterschiedlichen Transkriptionssysteme auf das Internationale Phonetische Alphabet (IPA) abzubilden, das innerhalb von VerbaAlpina als Referenztranskription fungiert. Zur Überführung eines quellenspezifischen Transkriptionssystems in das IPA-System ist die Anlage einer vollständigen Liste in Tabellengestalt mit Schriftzeichenentsprechungen erforderlich. Eine solche Tabelle wird als "Codepage" bezeichnet.
Nachfolgend ein Auszug aus der für die Konvertierung des AIS-Transkriptionssystems in IPA grundlegenden Codepage. Insgesamt umfasst diese Codepage rund 4500 Zeilen/Zuordnungen:

erhebung Beta IPA HEX
AIS a1%0 ɑh̆ x0251;x0068;x0306;
AIS a1( ɑ x0251;
AIS a1) ɑ x0251;
AIS a1* ɑ x0251;
AIS a1- ɑː x0251;x02d0;
AIS a1-| ɐː x0250;x02d0;
AIS a1-~ ɑ̃ː x0251;x0303;x02d0;
AIS a10 ɑ̆ x0251;x0306;
AIS a10% ɑh̆ x0251;x0068;x0306;
AIS a10| ɐ̆ x0250;x0306;

Die Kolumne `BETA` enthält die im AIS verwendeten Zeichen in nach dem Prinzip des Betacodes transkribierter Form, die Kolumne `IPA` das jeweils entsprechende IPA-Zeichen und die Kolumne `HEX` den oder die Zahlenwerte der Unicodetabelle, die dem jeweiligen IPA-Zeichen entsprechen.

(auct. Stephan Lücke)

Tags: Linguistik Informationstechnologie



Datenmodellierung (Zitieren)

s. Relationales Datenmodell

Tags: Linguistik Informationstechnologie



Datenzugriffsschicht (Zitieren)

Der Zugriff auf das Modul VA_DB erlaubt, unmittelbar in den primären Projektdaten zu recherchieren. Dieser Zugriff kann entweder durch den Menschen (über das Modul VA_WEB) oder durch Maschinen bzw. Programme erfolgen. Letzteres Szenario besteht z. B. auch projektintern bei der Kommunikation zwischen den Modulen VA_WEB und VA_DB, betrifft aber auch automatische Zugriffe z. B. von Rechnern bzw. Programmen der VA-Projektpartner. Im Laufe der Entwicklungsarbeiten im Bereich der Module VA_WEB und VA_DB ist es aus informatischer bzw. programmiertechnischer Sicht nicht selten erforderlich, bestehende Datenstrukturen zu verändern und an neue Erfordernisse anzupassen. Dies kann im Fall des Zugriffs durch einen Menschen zu Verwirrung führen, im Fall des Zugriffs durch eine Maschine bzw. ein Programm führt es schlicht zu einer Fehlfunktion. Um diesem Problem zu begegnen, wird innerhalb von VA_DB eine – zumindest weitgehend – stabile Datenstruktur zwischengeschaltet, in die hinein die veränderlichen primären Datenstrukturen projiziert werden.

(auct. Stephan Lücke)

Tags: Informationstechnologie



Digital Humanities (Zitieren)

Das Projekt VerbaAlpina wurde von vornherein mit Blick auf Webtauglichkeit konzipiert, denn es will ganz entschieden zur Überführung der etablierten geisteswissenschaftlichen Traditionen, genauer: der Geolinguistik, in die Digital Humanities beitragen .
Das bedeutet:
(1) Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
(2) Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
(3) Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
(4) Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld)

Tags: Informationstechnologie



Entity Relationship (Zitieren)

Daten können grundsätzlich zu sogenannten "Entitäten" zusammengefasst werden. Dabei handelt es sich um Klassen von Daten, die jeweils eine bestimmte Art und Anzahl spezifischer Merkmale aufweisen. So können beispielsweise die Städte Trento, Innsbruck und Luzern eine Klasse "Orte" bilden, der die Merkmale "Ortsname", "Längengrad", "Breitengrad", "Staat" und "Einwohnerzahl" zu eigen ist. Die einzelnen Mitglieder einer solchen Klasse unterscheiden sich durch die unterschiedlichen Werte der die Klasse ausmachenden Merkmale.
In einer relationalen Datenbank werden Entitäten idealerweise in jeweils eigenen Tabellen gespeichert, wobei jede Tabellenspalte die Werte jeweils eines spezifischen Merkmals aufnimmt. Die Tabellenzeilen enthalten die individuellen, durch ihre Merkmalswerte von einander unterschiedenen Mitglieder der Datenklasse (Entität). In den allermeisten Fällen – und so auch bei VerbaAlpina – stellt eine relationale Datenbank eine Sammlung verschiedener Entitäten (und somit Tabellen) dar, zwischen denen logische Beziehungen bestehen. So wäre etwa die Entität "Informant", die durch die Merkmale "Alter", "Geschlecht", "Geburtsort" und "Wohnort" definiert ist, mit der Entität "Orte" in der Weise logisch verbunden, dass die Werte der Merkmale "Geburtsort" und "Wohnort" Entsprechungen in der Entität "Orte" besitzen. Beziehungen zwischen Mitgliedern dieser beiden Entitäten ergeben sich aus Übereinstimmungen der Werte eines oder mehrerer, ihrem Wesen nach kongruenter, Merkmale der jeweiligen Entitäten. Im gegebenen Fall könnte sich theoretisch eine Zuordnung aus identischen Werten der Merkmale "Geburtsort" und "Ortsname" ergeben, wodurch mittelbar einem Informanten die Geokoordinaten seines Geburtsortes zugeordnet werden könnten. Es ist leicht zu erkennen, dass in diesem Beispiel Probleme aufgrund von Homonymen auftreten könnten. Um dergleichen zu vermeiden, ist es üblich, Ganzzahlen als Identifikatoren (kurz: "ID") zu verwenden, die die Mitglieder einer Entität eindeutig bezeichnen.
Das skizzierte System der Entitäten und ihrer logischen Zusammenhänge wird als Entity Relationship bezeichnet. Der in einer relationalen Datenbank gesammelte Datenbestand ist ohne eine Erläuterung dieser dort bestehenden Abhängigkeiten nur schwer versteh- und nutzbar. Üblicherweise erfolgt die Abbildung der Entity Relationship in Gestalt eines graphischen Schemas.
Die Entity Relationship unterliegt während der zyklischen Entwicklungsphasen von VerbaAlpina (s. Versionierung) ständigen Anpassungen und somit Veränderungen. Jeder archivierten Version von VerbaAlpina wird das Entity Relationship Modell der jeweils zugrundeliegenden Datenbankversion in Form eines ER-Diagramms beigegeben, das mit dem Programm yEd erzeugt und als GraphML- und PDF-Dokument abgespeichert wird. Folgende Graphik basiert auf den Entitäten und Verknüpfungen der Datenbank VA_XXX in ihrem aktuellen Zustand (20.3.2015), bildet diese jedoch nicht vollständig ab und ist nur als illustrierendes Beispiel zu verstehen:





(auct. Stephan Lücke)

Tags: Informationstechnologie



Forschungslabor (Zitieren)

Es ist ferner vorgesehen, ein virtuelles Forschungslabor einzurichten, das alle interessierten Nutzer einlädt, die von VerbaAlpina entwickelten geolinguistischen Tools (verschiedene kartographische Darstellungen,Typisierungsstufen u.a.) individuell zu nutzen und neue, womöglich auch alternative Analysen und Ergebnisse zu präsentieren. Selbstverständlich können auch die Tools selbst weiterentwickelt werden.


(auct. Thomas Krefeld)

Tags: Linguistik Informationstechnologie Webseite



Georeferenzierung (Zitieren)

Ein wesentliches Ordnungskriterium der in VerbaAlpina verwalteten Daten ist die Georeferenzierung unter Verwendung von Breiten- und Längengraden. Die Genauigkeit dieser Referenzierung variiert je nach Datentyp, wobei grundsätzlich eine möglichst exakte, metergenaue Referenzierung angestrebt wird. Im Fall der Sprachdaten aus Atlanten und Wörterbüchern ist in aller Regel lediglich eine vergleichsweise ungefähre Referenzierung nach Maßgabe eines Ortsnamens möglich, im Fall von z. B. archäologischen Daten hingegen sind tatsächlich metergenaue Georeferenzierungen möglich. Es können Punkte, Linien (etwa Straßen, Flüsse u. Ä.) und Flächen gespeichert werden. Aus technischer Perspektive findet hauptsächlich das sogenannte WKT-Format (https://en.wikipedia.org/wiki/Well-known_text) Verwendung, das in der VA-Datenbank mit der Funktion geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html in ein spezifisches MySQL-Format überführt und so gespeichert wird. Die Ausgabe im WKT-Format erfolgt durch die MySQL-Funktion astext().
Referenzraster der Georeferenzierung ist das Netz der politischen Gemeinden im Alpenraum, die, je nach Bedarf, entweder als Fläche oder als Punkte ausgegeben werden können. Basis sind dabei die Grenzverläufe der Gemeinden mit Stand von etwa 2014, die VerbaAlpina von seinem Partner "Alpenkonvention" erhalten hat. Eine ständige Aktualisierung dieser Daten, die sich aufgrund nicht seltener Verwaltungsreformen durchaus häufiger verändern, ist entbehrlich, da es sich aus Sicht von VerbaAlpina lediglich um einen geographischen Referenzrahmen handelt. Die Punktdarstellung des Gemeinderasters wird algorithmisch aus den Gemeindegrenzen abgeleitet und ist somit sekundär. Die errechneten Gemeindepunkte stellen die geometrischen Mittelpunkte der Gemeindeflächen dar und markieren höchstens zufällig den Hauptort oder gar deren Mittelpunkt. Im Bedarfsfall können sämtliche Daten einzeln oder kumulierend auf den errechneten Gemeindepunkt projiziert werden. Dies ist etwa bei den Sprachdaten aus Atlanten und Wörterbüchern der Fall.
Zusätzlich zum exakt georeferenzierten Referenzraster der Gemeindegrenzen wird (ab Version 16/1) ein wabenförmiges quasi-georeferenziertes Raster dargestellt, das zwar die ungefähre Lage der Gemeinden zueinander wiedergibt, gleichzeitig jedoch jedem Gemeindegebiet eine idealisierte Fläche jeweils gleicher Form und Größe zuweist. [Bild:va_polygone-1.jpg]] Damit werden alternative Kartierungsverfahren angeboten, die beide ihre Vor- und Nachteile haben und wegen ihrer Bildlichkeit auch beide ein gewisses suggestives Potential mitbringen: Die topographische Darstellung vermittelt wegen ihrer Präzision einen besseren Einblick in die konkrete Räumlichkeit mit ihren oft sehr speziellen Geländeprofilen, einzelnen Übergängen, Talverläufen, unzugänglichen Talausgängen usw. Die Wabenkarte erlaubt dagegen eine abstrahiertere Visualisierung der Daten, da sie die Größen der Gemeindeflächen sowie siedlungsgeographische Ballungen bzw. Streuungen ausgleicht. Das ist besonders bei quantitativen Karten nützlich, denn die Größe der Fläche erzeugt schon bei der Wahrnehmung unwillkürlich den Eindruck quantitativen Gewichts.

(auct. Stephan Lücke | Thomas Krefeld)

Tags: Linguistik Informationstechnologie Außersprachlicher Kontext



Konzeptbeschreibung (Zitieren)

Die Konzepte werden in der Tabelle KONZEPTE der Datenbank am Beispiel des Deutschen wie folgt erfasst: Existiert eine lexikalisierte Bezeichnung für ein Konzept, so wird diese im Datenbankfeld 'Name_D' eingetragen. Bei fehlender Lexikalisierung bleibt dieses Feld leer. Unabhängig davon wird im Feld 'Beschreibung_D' das Konzept genauer spezifiziert bzw. definiert. Dies erfolgt nach einer festgelegten Vorgehensweise, die am Beispiel des Konzepts 'MILCHKANNE' (ID_Konzept 610) demonstriert wird: Das eben genannte Konzept wird mit einem spezifischen Lexem bezeichnet, daher wird MILCHKANNE in 'Name_D' eingetragen. Die Beschreibung sieht folgende hierarchische Reihenfolge vor: Gerät, Zweck, Material, Form (evtl.). Angewendet auf das Konzept ergibt sich also die Beschreibung: GEFÄSS, ZUM AUFBEWAHREN VON MILCH, AUS METALL. Falls möglich bzw. nötig sollen weiterhin diese zusätzlichen Regeln befolgt werden: Zahlen von 1-10 werden ausgeschrieben, zum Wiedergeben eines Prozesses, einer Handlung usw. kann entweder 'zu+Artikel+Infinitiv (substantiviertes Verb)' oder 'für+Substantiv' verwendet werden. Das Einhalten dieser Muster ermöglicht analoge Übersetzungen, die Bildung sprachunabhängiger Kategorien auf unterschiedlichen Abstraktionsebenen (-> GEFÄSSE -> GEFÄSSE ZUR AUFBEWAHRUNG -> GEFÄSSE AUS METALL usw.), automatisierte Korrekturen bzw. Änderungen und eine transparente Suche. Alle Konzepte werden auf diese Weise auf Deutsch, Italienisch, Französisch, Slowenisch und Rätoromanisch erfasst.

(auct. Giorgia Grimaldi | Thomas Krefeld)

Tags: Informationstechnologie



Langzeitarchivierung (Zitieren)

Sämtliche VerbaAlpina-Projektdaten werden so verwaltet, dass diese über einen möglichst langen Zeitraum les- und verwendbar bleiben. Die ins Auge gefasste Perspektive umfasst dabei wenigstens mehrere Jahrzehnte, das zugrundeliegende Konzept ist letztlich jedoch auf eine Konservierung ohne zeitliche Befristung ausgerichtet.

Im einzelnen werden die folgenden Aspekte berücksichtigt:
1. Welche Institution(en) wird(/werden) mit der Bewahrung der Daten bzw. der betreffenden Datenträger betraut?
2. Dokumentation der Datenstrukturierung sowie der logischen Zusammenhänge zwischen Daten und Datenkategorien (Entity Relationship)
3. Dokumentation der verwendeten Zeichenkodierung(en)

Mehrere Kopien der Projektdaten sollen bei mehreren verschiedenen Institutionen archiviert werden. Derzeit sind dafür die IT-Gruppe Geisteswissenschaften der Ludwig-Maximilians-Universität München (ITG) mit deren Anbindung an die Archivierungsserver des Leibniz-Rechenzentrums sowie das BAS Clarin Repository vorgesehen. Es ist geplant, zusätzliche Sicherungskopien bei weiteren geeigneten Institutionen zu deponieren. Die Archivierung findet im Rhythmus der Versionierungen statt. Archiviert werden jeweils die Datenbank mit sämtlichen Projektdaten (Modul VA_DB zusammen mit dem Entity-Relationship-Modell) sowie das Web-Framework (VA_WEB), das für die Präsentation der Daten im Internet (inklusive der jeweiligen Funktionalität) zuständig ist, so dass, zumindest theoretisch, ein "Wiedererwecken" jeder einzelnen Version in entsprechenden emulierten Betriebssystem- bzw. Softwareumgebungen möglich ist. Archiviert wird ferner die Medienbibliothek, die hauptsächlich Photos, Filme, Text- und Tondokumente enthält (Modul VA_MT).

(auct. Stephan Lücke)

Tags: Informationstechnologie



Module (Zitieren)

s. Versionierung

Tags: Informationstechnologie



Quantifizierende Darstellungen (Zitieren)

[Vorbemerkung: Der nachfolgende Artikel nimmt in Teilen Bezug auf derzeit noch in Entwicklung befindliche Funktionalitäten von VA_WEB, die für die Öffentlichkeit derzeit noch nicht zugänglich sind.]

Die interaktive Online-Karte von VerbaAlpina erlaubt neben der qualitativen Kartierung auch die Visualisierung aggregierter Daten im Sinne einer quantifizierenden Abbildung der Daten im Raum. Die Aggregierung orientiert sich dabei stets an geographischen Regionen. Der Nutzer hat dabei die Auswahl zwischen Aggregierung auf Basis der Gemeindeflächen (Kleinraum), der sog. NUTS-3-Regionen (Mittelraum) und schließlich der Verbreitungsregionen der drei großen Sprachfamilien Germanisch-Romanisch-Slavisch (Großraum). Darüber hinaus besteht die Möglichkeit, beliebige Gemeindeflächen als individuelle Regionen zu definieren, die dann wiederum als Bezugsgröße der Aggregierung fungieren. Letztere Option kann verzerrenden Effekten entgegenwirken, die sich in der Perspektive der Aggregierung über die administrativ – und somit aus Sicht der Sprachwissenschaft sachfremd – motivierten Flächen der Gemeindegebiete oder der NUTS-3-Regionen ergeben. Im Einzelfall kann die entsprechende Vorgehensweise natürlich nur heuristisch sein, der Nutzer hat aber die Möglichkeit, einmal entdeckte sinnvolle regionale Kohärenzen abzuspeichern, zu kommentieren, wiederzuverwenden und der Allgemeinheit zur Verfügung zu stellen.

Bezogen auf die gewählten Regionen bzw. Flächen werden sodann sämtliche bis zur Aktivierung der quantifizierenden Darstellung ausgewählten qualitativen Daten aggregiert. Größe und Farbgebung der einzelnen Kartensymbole korrelieren dabei mit der Anzahl der jeweils in einem Symbol gebündelten qualitativen Einzeldaten. Der arithmetisch zugrunde gelegte Maximalwert, bei dessen Erreichen ein Symbol stets die jeweils maximale Größe und Farbgebung erhält, entspricht dabei standardmäßig der höchsten Anzahl an aggregierten Daten, der in einer der ausgewählten Flächen bzw. Regionen auftritt. Wahlweise kann dieser maximale Referenzwert auf die Gesamtanzahl der aggregierten Einzeldaten umgesetzt werden, was zu einer Änderung der Kartendarstellung führt.

Bei aktivierter Quantifizierung können durch Deaktivierung einzelner Listeneinträge in der Kartenlegende die entsprechenden qualitativen Daten aus der Berechnung der Quantitäten herausgenommen oder andere durch zusätzliche Auswahl hinzugenommen werden.

Neben der Quantifizierung vor dem Hintergrund einer georeferenzierten, die realen Grenzverläufe abbildenden Karte erlaubt VerbaAlpina auch die Darstellung quantifizierter Daten auf einer sog. Wabenkarte. Gestalterisches Vorbild ist eine Wikipedia-Grafik, die die Wahlergebnisse der britischen Unterhauswahl von 2015 visualisiert. Im folgenden ist zunächst die punkt-, längen- und winkeltreue Karte (im folgenden als "geographische Karte" bezeichnet) mit den Wahlergebnissen in den einzelnen Wahlkreisen wiedergegeben. Daran anschließend ist die Wabenkarte abgebildet, auf der jeder Wahlkreis durch ein Sechseck jeweils identischer Größe dargestellt ist.




Quelle: https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Quelle: https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (abgerufen am 03.11.2016)

Die Gegenüberstellung der beiden Kartentypen zeigt die jeweiligen Vor- und Nachteile. Die Wabenkarte weist geographische Ungenauigkeiten bzw. diesbezüglich sogar Fehlinformationen auf. So erkennt man z.B. im Distrikt Greater London eine isolierte rote Wabe, die von lauter blauen Waben umgeben ist – ein scheinbares Faktum, das jedoch keinen Rückhalt in der geographischen Karte findet. Auf der anderen Seite besitzt die Wabenkarte den Vorteil, die realen Zahlenverhältnisse zwischen den einzelnen Farben besser zu visualisieren, da eine Vielzahl von flächenmäßig sehr kleinen Wahlbezirken auf der geographischen Karte vom Betrachter als nachrangig wahrgenommen werden, obwohl die politische Bedeutung mit der der flächenmäßig großen Wahlbezirke gleichgestellt ist. Somit ergänzen sich die beiden Kartentypen und der eigentliche Mehrwert besteht in der Möglichkeit, beide Karten konsultieren und deren Visualisierung gegenüberstellen zu können.

Die Wabenkarte von VerbaAlpina zeichnet sich dadurch aus, dass sämtliche politischen Gemeinden im Alpenraum durch jeweils gleich große Hexagone abgebildet werden. Dabei wird versucht, die geographische Logik wenigstens ungefähr zu bewahren. Die Berechnung der Farbgebung der einzelnen Hexagone erfolgt dort in der gleichen Weise wie oben bei der Punktsymbolkarte beschrieben. Der Vorteil einer solchen Wabenkarte besteht gegenüber einer simplen Einfärbung der Gemeindeflächen auf einer georeferenzierten Karte darin, dass suggestive Effekte durch stark unterschiedliche Größe der Gemeindeflächen unterdrückt werden.

(auct. Stephan Lücke)

Tags: Informationstechnologie Webseite



Transkription (Zitieren)

Die sprachlichen Materialien werden graphisch in doppelter Weise wiedergegeben, um den beiden gegenläufigen Prinzipien der Quellentreue und der leichten Vergleichbarkeit gerecht zu werden:
(1) Inputversion in der Originaltranskription
Im VA-Portal werden Quellen zusammengeführt, die aus unterschiedlichen Fachtraditionen stammen (Romanistik, Germanistik, Slavistik) und die historisch unterschiedliche Phasen der dialektologischen Forschung repräsentieren; manche Wörterbuchdaten wurden zu Beginn des letzten Jahrhunderts (GPSR) und andere erst vor wenigen Jahren (ALD) erhoben. Deshalb ist es wissenschaftsgeschichtlich notwendig, die Originaltranskription weitestgehend zu respektieren. Aus technischen Gründen ist es allerdings unmöglich, bestimmte Konventionen unverändert zu erhalten; das gilt insbesondere für die vertikale Kombination von Basiszeichen (‘Buchstaben’) und diakritischen Zeichen, also etwa dann, wenn ein Betonungsakzent über einem Längenzeichen über einem Vokal über einem Schließungszeichen positioniert ist (Betacode). Diese Konventionen werden in jeweils definierten technischen Transkriptionen in lineare Folgen von Zeichen überführt, wobei ausschließlich ASCII-Zeichen benutzt werden (so genannter Betacode). Bis zu einem gewissen Grad können bei der Beta-Kodierung intuitiv verständliche graphische Ähnlichkeiten zwischen den Originaldiakritika und den ASCII-Entsprechungen ausgenützt werden; sie sind mnemotechnisch günstig.

(2) Outputversion in IPA
Im Sinne der Vergleichbarkeit und auch der Nutzerfreundlichkeit ist zudem die Ausgabe in einer einheitlichen Transkription wünschenswert. Alle Beta-Codes werden daher mit spezifischen Ersetzungsroutinen in IPA-Zeichen überführt. Einige wenige, aber unvermeidbare Unverträglichkeiten ergeben sich vor allem dann, wenn einem, durch Diakritika spezifizierten Basiszeichen in der Inputtranskription in IPA zwei unterschiedliche Basiszeichen entsprechen. Das gilt vor allem im Hinblick auf die Öffnungsgrade der Vokale, wo z. B. in der palatalen Reihe die beiden Basiszeichen <i> und <e> in Verbindung mit Schließungspunkt und einem oder zwei Öffnungshäkchen es erlauben, sechs Öffnungsgrade abzubilden; in Beta-Kodierung sind das: i – i( – i((– e?-- e – e(– e((. Dafür stehen in IPA nur vier Basiszeichen i – ɪ – e – ɛ zur Verfügung.


(auct. Thomas Krefeld)

Tags: Linguistik Informationstechnologie



Uniform Resource Name (URN) (Zitieren)

s. Digital Object Identifier

Tags: Informationstechnologie



Versionierung (Zitieren)

VerbaAlpina besteht aus folgenden Modulen:





- VA_DB: Datenbestand in der (MySQL-)Projekt-Datenbank (va_xxx)
- VA_WEB: Programmcode der Webschnittstelle des Projektportals www.verba-alpina.gwi.uni-muenchen.de samt zugehöriger Wordpress-Datenbank (va_wp)
- VA_MT: Mediendateien (Photos, Filme, Text- und Tondokumente), die sich in der Medienbibliothek der Webschnittstelle befinden

Alle drei Module bilden ein konsistentes Ganzes mit wechselseitigen Verknüpfungen und Abhängigkeiten und können daher nicht voneinander getrennt werden. Während der Projektlaufzeit wird in regelmäßigen Abständen simultan der jeweils aktuelle Status der Module VA_DB und VA_WEB in Gestalt einer elektronischen Kopie gleichsam "eingefroren". Diese eingefrorenen Kopien erhalten Versionsnummern nach dem Schema [Kalenderjahr]/[laufende Nummer] (z .B. 15/1). Die jeweils produktive VA-Version erhält die Bezeichnung XXX.

Die Erzeugung von Kopien der VA-Mediathek (VA_MT) verbietet sich aufgrund der üblicherweise enormen Größe von Mediendateien. Aus diesem Grund wird von diesem Modul im Zuge eines Versionierungsvorgangs keine Kopie erzeugt. Einmal dort abgelegte Elemente können daher, sofern auch nur eine einzige VA-Version mit ihnen verknüpft ist, nicht aus der VA-Mediathek entfernt werden.

Im Projektportal besteht die Möglichkeit, zwischen der jeweils "produktiven" und daher ständigen Änderungen unterworfenen VA-Version sowie den archivierten, "eingefrorenen" Versionen zu wechseln. Im Projektportal wird durch geeignete Farbgebung des Hintergrunds bzw. bestimmter Bedienelemente angezeigt, ob man sich in der produktiven oder einer archivierten Version von VA befindet. Zitierfähig sind *ausschließlich* die archivierten Versionen von VA.

Titelbilder älterer VerbaAlpina-Versionen:

15/1

15/2

16/1

16/2

17/1



(auct. Stephan Lücke)

Tags: Informationstechnologie