				<script type="text/javascript">
					jQuery(document).ready(function() {
						addBiblioQTips(jQuery(".entry-content"));
					});
				</script> 
							<script type="text/javascript">
					jQuery(document).ready(function() {
						addBiblioQTips(jQuery(".entry-content"));
					});
				</script> 
			{"id":12200,"date":"2020-06-21T21:31:02","date_gmt":"2020-06-21T20:31:02","guid":{"rendered":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=12200"},"modified":"2020-06-26T09:17:17","modified_gmt":"2020-06-26T08:17:17","slug":"verbaalpina-erklaert-sich-selbst-teil-2-informationstechnik","status":"publish","type":"post","link":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=12200","title":{"rendered":"VerbaAlpina erkl\u00e4rt sich selbst &#8211; Teil 2: Informationstechnik"},"content":{"rendered":"<div class=\"moz-text-flowed\" lang=\"x-unicode\">\n<h1><a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/va_medaille.png\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-12124 aligncenter\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/va_medaille-300x174.png\" alt=\"\" width=\"300\" height=\"174\" srcset=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/va_medaille-300x174.png 300w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/va_medaille-150x87.png 150w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/va_medaille.png 587w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\"><\/a><\/h1>\n<h1>Grunds\u00e4tzliches<\/h1>\n<ul>\n<li>VerbaAlpina (<span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>) besch\u00e4ftigt sich mit der Frage, welche Bezeichnungen es f\u00fcr ausgew\u00e4hlte, f\u00fcr den Alpenraum typische Konzept\/Begriffe es gab und gibt<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> ist mit diesem Ziel ein von der DFG gef\u00f6rdertes Langfristvorhaben mit Perspektive bis 2025 (derzeit dritte Teilphase [2019-2022] in Beantragung)<\/li>\n<li>Die Untersuchung ist auf den Alpenraum beschr\u00e4nkt<\/li>\n<li>Die Grenze des Untersuchungsgebiets ist das Perimeter der <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> Alpenkonvention (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=2870\"><span style=\"color: #ff0000;\">Link<\/span><\/a>)<\/li>\n<li>Das Sprachmaterial stammt haupts\u00e4chlich aus <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> <strong>Sprachatlanten<\/strong> und <strong>W\u00f6rterb\u00fcchern<\/strong> (letztere nur, wenn sie Auskunft \u00fcber die regionale Verbreitung der verzeichneten W\u00f6rter geben; Beispiel: <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?attachment_id=9840\">Idiotikon<\/a>)<\/li>\n<li>Neben Sprachatlanten und W\u00f6rterb\u00fcchern verwendet <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> Methoden des <strong>Crowdsourcing<\/strong> (\"citizen science\") zur Sammlung von Sprachmaterial (dazu sp\u00e4ter mehr)<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> fragt nach der Verbreitung von W\u00f6rtern innerhalb des Alpenraums (welche W\u00f6rter werden wo verwendet und welche Bedeutung haben sie dort?)<\/li>\n<li>Im Hinblick auf die W\u00f6rter ist <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> im Wesentlichen an <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> <strong>Morpholexikalischen Typen<\/strong> (Morphtypen) interessiert. Diese sind letztlich vergleichbar mit den Lemmata von W\u00f6rterbucheintr\u00e4gen<\/li>\n<li>Ein <strong>Morphtyp\u00a0im Sinn von <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span><\/strong> wird definiert durch\n<ul style=\"list-style-type: circle;\">\n<li>die Orthographie,<\/li>\n<li>die Zugeh\u00f6rigkeit zu einer Sprachfamilie (germanisch, romanisch, slawisch),<\/li>\n<li>die Wortart,<\/li>\n<li>das Genus und<\/li>\n<li>die Affigierung (letztere z. B. -<em>chen<\/em> in <em>H\u00e4uschen<\/em> \u21d2 eigener Morphtyp neben <em>Haus<\/em>)<\/li>\n<li>Beispiel: la malga (romanisch, feminin, ohne Affigierung); zwei Morphtypen: <em>die Butter<\/em> und <em>der Butter<\/em><\/li>\n<\/ul>\n<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> befasst sich in der Hauptsache mit <strong>Dialektausdr\u00fccken<\/strong> (also nicht mit den Hochsprachen)<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> ist nur <strong>nachrangig an phonetischer Variation<\/strong> interessiert<\/li>\n<li>Das geographische Bezugssystem innerhalb der Alpenkonvention wird durch die politischen Gemeinden gebildet (5771; statisches Referenzystem; \u00c4nderungen werden nicht ber\u00fccksichtigt)<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> besitzt neben der diatopischen auch eine diachronische Dimension (Ver\u00e4nderungen \u00fcber die Zeit; Sprachatlanten z. T. aus der 1. H\u00e4lfte des 20. <span class=\"vaabr\" data-vaabr=\"JhDOT\">Jh.<\/span> \u21d4 Daten aus dem Crowdsourcing von heute)<\/li>\n<li>Die <strong>Kernentit\u00e4ten<\/strong> von <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> sind demnach:\n<ul style=\"list-style-type: circle;\">\n<li>Morphtyp<\/li>\n<li>Konzepte (zur Unterscheidung von W\u00f6rtern stets in Versalien geschrieben; BUTTER meine das Konzept, also die Sache als solche; <em>Butter<\/em> hingegen meint das Wort \"Butter\")<\/li>\n<li>Gemeinden<\/li>\n<li>[Zeit]<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p style=\"padding-left: 40px;\">\u21d2 Das Wort xy wurde\/wird in den Jahren jjjj in der\/den Gemeinde(n) yz zur Bezeichnung des Konzepts KO verwendet<\/p>\n<ul>\n<li>Die Wechselbeziehung von Morphtypen und deren Bedeutung erzeugt vor dem Hintergrund von <strong>Raum und Zeit<\/strong> eine <strong>enorme Komplexit\u00e4t<\/strong>:<\/li>\n<\/ul>\n<p><a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/bezeichnung.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-1837 aligncenter\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/bezeichnung-300x281.jpg\" alt=\"\" width=\"300\" height=\"281\" srcset=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/bezeichnung-300x281.jpg 300w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/bezeichnung-150x141.jpg 150w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/bezeichnung.jpg 512w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\"><\/a><\/p>\n<\/div>\n<div class=\"moz-text-flowed\" lang=\"x-unicode\">\n<p>Zu den Kernentit\u00e4ten geh\u00f6rt auch der <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> <strong>Basistyp<\/strong>. Damit sind W\u00f6rter gemeint, die in irgendeiner Weise ganz offenkundig mit einem Morphtypen verbunden sind, ohne dass der Zusammenhang im Detail gekl\u00e4rt werden kann. In aller Regel handelt es sich dabei um \u00e4ltere Vorstufen. Hierzu ein Beispiel:<\/p>\n<p><a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-12226 size-large\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-1024x420.jpg\" alt=\"\" width=\"625\" height=\"256\" srcset=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-1024x420.jpg 1024w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-300x123.jpg 300w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-150x62.jpg 150w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-768x315.jpg 768w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra-624x256.jpg 624w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/basistyp_salamandra.jpg 1333w\" sizes=\"auto, (max-width: 625px) 100vw, 625px\"><\/a><\/p>\n<p>Das deutsche Wort <em>Salamander<\/em> h\u00e4ngt unverkennbar mit dem italienischen s<em>alamandra<\/em> zusammen. Das Wort <em>salamandra<\/em> gab es schon im Lateinischen (<a href=\"http:\/\/www.zeno.org\/Georges-1913\/A\/salamandra\">Georges<\/a>). F\u00fcr das deutsche Salamander stellt sich nun die Frage, ob es sich direkt aus dem Lateinischen entwickelt hat (Etymologie-Szenario) oder ob es sp\u00e4ter aus dem Italienischen \u00fcbernommen worden ist (Entlehnungs-Szenario). Fragen dieser Art sind h\u00e4ufig nur mit sehr gro\u00dfem Aufwand \u2013 wenn \u00fcberhaupt \u2013 zu entscheiden. Dennoch besteht unverkennbar eine Verbindung. Um diese dokumentieren zu k\u00f6nnen, hat <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> den Basistyp eingef\u00fchrt. (anders als im Fall von <span class=\"vaabr\" data-vaabr=\"latDOT\">lat.<\/span> <em>salamandra\u00a0<\/em>k\u00f6nnen manche Basistypen keiner spezifischen Sprache zugeordnet werden. Gleichwohl muss es sie gegeben haben. In solchen F\u00e4llen wird ein Basistyp rekonstruiert [Kennzeichnung durch * vor dem Basistypen]; Beispiel: <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;single=B123&amp;tk=2880\">*cala als Basistyp z. B. von frz. chalet<\/a>)<\/p>\n<ul>\n<li>In Sprachatlanten und W\u00f6rterb\u00fcchern werden vielfach keine Morphtypen, sondern <strong>Einzelbelege<\/strong> oder <strong>phonetische Typen<\/strong> dokumentiert (z. B. Kaas, Chaas, K\u00e4s \u2013 alles Varianten des Morphtyps <em>der K\u00e4se<\/em>) \u21d2 Quelldaten m\u00fcssen klassifiziert werden (<span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> \"Typisierung\")<\/li>\n<li>Im Zuge der Typisierung verkn\u00fcpft <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> nach M\u00f6glichkeit einen Morphtyp mit einem korrespondierenden Eintrag in einem <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> Referenzw\u00f6rterbuch. <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=493&amp;db=xxx&amp;letter=R#51\">Liste der <strong>Referenzw\u00f6rterb\u00fccher<\/strong><\/a> (Beispiel: der Morphtyp \"<em>malga|rom|f|nicht affigiert<\/em>\" entspricht dem Eintrag malga im Vocabolario der Treccani; <a href=\"http:\/\/www.treccani.it\/vocabolario\/malga\/\">http:\/\/www.treccani.it\/vocabolario\/malga\/<\/a>)<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> sammelt bis zu einem gewissen Grad auch Daten zur <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> au\u00dfersprachlichen Peripherie. Als Beispiel k\u00f6nnen die <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=2882\">Fundorte lateinischer Inschriften<\/a> im Alpenraum genannt werden. Diese geben k\u00f6nnen einen Hinweis auf die Intensit\u00e4t der Romanisierung geben. Dies wiederum kann etwa die heutige Verbreitung romanischer Basistypen in bestimmten Regionen mehr oder weniger plausibel erscheinen lassen.<\/li>\n<\/ul>\n<h1>Technik<\/h1>\n<ul>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> ist ein <strong>rein digitales Projekt<\/strong> \u2013 praktisch vollkommener Verzicht auf traditionelle papiergebundene Methoden<\/li>\n<li>verwendet <strong>Standardsoftware<\/strong>, quasi ausschlie\u00dflich <strong>open source<\/strong><\/li>\n<li>knapp 50% der Projektbeteiligten sind im Informatik-Sektor des Projekts t\u00e4tig (2 wiss. Mitarbeiter, 1 Hilfskraft)<\/li>\n<\/ul>\n<h2>Backend und Frontend<\/h2>\n<h3>Backend<\/h3>\n<ul>\n<li>Backend wird gebildet von einer <strong>MySQL-Datenbank<\/strong><\/li>\n<li>Vorteile der MySQL-<span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span>:\n<ul style=\"list-style-type: circle;\">\n<li>Web-f\u00e4hig<\/li>\n<li>an der <span class=\"vaabr\" data-vaabr=\"ITG\">ITG<\/span> herrscht seit langem Expertise<\/li>\n<li>gro\u00dfe Anzahl weiterer Projektdaten in der selben Server-Umgebung (MySQL-Cluster), so dass <strong>technische\/inhaltliche Verkn\u00fcpfung<\/strong> theoretisch m\u00f6glich (<span style=\"color: #ff0000;\"><a style=\"color: #ff0000;\" href=\"https:\/\/pma.gwi.uni-muenchen.de\/\">Demo<\/a><\/span>)<\/li>\n<\/ul>\n<\/li>\n<li>Die <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-<span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span> ist im Lauf der Zeit immer komplexer geworden (normaler Vorgang) \u2013 aktuell <strong>156 Tabellen<\/strong> (<span style=\"color: #ff0000;\">Demo<\/span>)<\/li>\n<li><strong>Tabellen der Kernentit\u00e4ten<\/strong>:\n<ul style=\"list-style-type: circle;\">\n<li>Einzelbeleg: Tabellen \"aeusserungen\" und Tabelle \"tokens\"<\/li>\n<li>Morphtyp: Tabelle \"morph_typen\"<\/li>\n<li>Konzept: Tabelle \"konzepte\"<\/li>\n<li>Ortschaft: Tabelle \"orte\"<\/li>\n<li>Die Zusammenh\u00e4nge zwischen den einzelnen Entit\u00e4ten sind in der Datenbank aufgrund der <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> Normalisierung nur durch komplexe Operationen darstellbar. Nur eine kurze Skizze: Beispiel id_aeusserung = 89349<\/li>\n<li>Daher B\u00fcndelung der verteilten Informationen in <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> <strong>Datenzugriffsschicht<\/strong>: vap_ling_de (\"Human-readable interface\"; in mehreren Sprachen verf\u00fcgbar) und z_ling (f\u00fcr Maschinen)<\/li>\n<\/ul>\n<\/li>\n<li>jeweils <strong>aktuelle Arbeitsversion<\/strong> tr\u00e4gt den Namen <strong>va_xxx<\/strong><\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-<span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span> wird alle halbe Jahre <strong>versioniert<\/strong>\n<ul style=\"list-style-type: circle;\">\n<li>Erzeugung einer <span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span>-Kopie, an der nichts mehr ge\u00e4ndert wird.<\/li>\n<li>Suffix: _jjh (j=Jahr; h=Halbjahr), z. B. va_191: Datenbankversion der ersten Jahresh\u00e4lfte 2019 (erzeugt Ende Juni\/Anfang Juli; die Versionen der 2. Jahresh\u00e4lfte werden gegen Ende Dezember erzeugt).<\/li>\n<li>Wichtig f\u00fcr Gew\u00e4hrleistung der Zitierf\u00e4higkeit! Ein Wechsel zwischen den Versionen ist im Frontend von VerbaAlpina m\u00f6glich (<span style=\"color: #ff0000;\">Demo<\/span>)<\/li>\n<\/ul>\n<\/li>\n<li>neben der <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-<span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span> existiert eine Reihe von Datenbanken der offiziellen <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-Partner (Kooperationsvereinbarungen; bislang insgesamt 53). Pr\u00e4fix: pva_ (= Partner von VerbaAlpina; <span style=\"color: #ff0000;\">Demo<\/span>)<\/li>\n<\/ul>\n<h3>Frontend<\/h3>\n<ul>\n<li>Standard-<strong>WordPress<\/strong>-Installation (Demo: <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/\">https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/<\/a>)<\/li>\n<li>auch hier wieder: <strong>Front- und Backend<\/strong> (<span style=\"color: #ff0000;\">Demo<\/span>)<\/li>\n<li>erg\u00e4nzt um Eigenentwicklungen, zumeist in Form von <span class=\"vaabr\" data-vaabr=\"sogDOT\">sog.<\/span> Plugins (werden auf Github unter offenen Lizenzen (CC BY-SA,\u00a0 zur Nachnutzung zur Verf\u00fcgung gestellt: <a href=\"https:\/\/github.com\/VerbaAlpina\/\">https:\/\/github.com\/VerbaAlpina\/<\/a>)<\/li>\n<li>Mehrsprachig: die wichtigsten Sprachen des Alpenraums + Englisch (verursacht gro\u00dfen Aufwand)<\/li>\n<li>Multifunktional:\n<ul style=\"list-style-type: circle;\">\n<li>Arbeitsinstrument f\u00fcr Mitarbeiter<\/li>\n<li>Dokumentation<\/li>\n<li>Publikation<\/li>\n<li>Datensammlung<\/li>\n<\/ul>\n<\/li>\n<li>Punkt Dokumentation: Methodologie (Reflexion vielf\u00e4ltiger Aspekte, sprachwissenschaftlicher ebenso wie informatischer) (<span style=\"color: #ff0000;\">Demo<\/span>)<\/li>\n<li>Weitere Kern-Module des Frontend neben der Methodologie:\n<ul style=\"list-style-type: circle;\">\n<li>Interaktive Karte (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=2874\">Demo<\/a>: malga, HERDE;\n<ul style=\"list-style-type: square;\">\n<li>Integration von semasiologischer und onomasiologischer Perspektive;<\/li>\n<li><strong>qualitative<\/strong> und <strong>quantitative<\/strong> Kartierung: quantitative Kartierung bildet die H\u00e4ufigkeit der in einer Region auf der aktuellen Karte dargestellten Symbole durch Intensit\u00e4t der Fl\u00e4chenf\u00e4rbung ab (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=2884\"><span style=\"color: #ff0000;\">Beispiel<\/span><\/a>: <em>malga|rom|f|- <\/em>in der Bedeutung ALM)<\/li>\n<li>Kombination mit Daten der <strong>au\u00dfersprachlichen Peripherie<\/strong>;<\/li>\n<li>Einbindung von Normdaten: Wikidata-Q-IDs und Geonames-IDs: <span style=\"color: #ff0000;\"><a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=2878\">Belegfenster malga<\/a> \u21d2 HERDE im Ort Stenico<\/span>)<\/li>\n<li>Auf der Karte k\u00f6nnen auch individuelle Suchanfragen in <strong><span class=\"vaabr\" data-vaabr=\"SQL\">SQL<\/span><\/strong> formuliert werden, die dann kartiert werden (Beispiel: liefer alle Einzelbelege des Morphtyps <em>Butter<\/em>, die mit einem \"P\" beginnen: where Type_Kind = 'L' AND Type = 'Butter' AND Instance like 'p%')<\/li>\n<li>Technisch hochperformant (Nutzung des Standards WebGL, der den direkten Zugriff auf die Grafikkarte erlaubt; <span class=\"vaabr\" data-vaabr=\"sDOT\">s.<\/span> den <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=493&amp;db=xxx&amp;all=1#148\">Methodologie-Eintrag<\/a>)<\/li>\n<\/ul>\n<\/li>\n<li>Lexicon Alpinum (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=2374&amp;db=xxx\"><span style=\"color: #ff0000;\">Demo alt<\/span><\/a>; Neuentwicklung! \u21d2 <span style=\"color: #ff0000;\"><a style=\"color: #ff0000;\" href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=12180&amp;db=xxx\">Demo<\/a><\/span>)<\/li>\n<li>Transkriptionstool: Operationalisierung der strukturierten Erfassung analoger Datenquellen, v. a. von Sprachatlanten (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-admin\/admin.php?page=transcription\"><span style=\"color: #ff0000;\">Demo<\/span><\/a>; Verwendung des <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=493&amp;db=xxx&amp;letter=B#7\">Betacodes<\/a> \u21d2 normale Tastatur, geringe Fehleranf\u00e4lligkeit, schnell zu erlernen, keine Kenntnisse in phonetischer Transkription erforderlich; Automatisierung vor allem wegen Zuordnungsproblematik nicht m\u00f6glich)<\/li>\n<li>Typisierungstool: Klassifizierung\/Typisierung der digitalisierten Daten (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-admin\/admin.php?page=typification\"><span style=\"color: #ff0000;\">Demo<\/span><\/a>)<\/li>\n<li>Crowdsourcing-Tool(s) ...<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>Einsatz von Crowdsourcing<\/h2>\n<ul>\n<li>Motivation:\n<ol>\n<li><span style=\"font-size: 1rem;\"><strong>Konsolidierung von Inkonsistenzen<\/strong>, die sich aus der inhomogenen Dokumentationslage auf Basis von Sprachatlanten und W\u00f6rterb\u00fcchern ergeben (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=1839&amp;db=xxx\"><span style=\"color: #ff0000;\">\u00dcbersicht \u00fcber unterschiedliche thematische Abdeckung verschiedener Atlanten<\/span><\/a>) \u21d2 regionale Begrenzung der Quellen und unterschiedlicher Inhalt: z. B. wird nicht jedes Konzept von jedem Sprachatlas ber\u00fccksichtigt. \u21d2 Beseitigung von Dokumentationsl\u00fccken (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/en?page_id=1741\"><span style=\"color: #ff0000;\">Demo<\/span><\/a>)<\/span><\/li>\n<li><strong>Mithilfe bei Transkription<\/strong> (\u21d2 Zooniverse-Tool; urspr\u00fcngliche Absicht: Verwendung eines \"Baukastens\" ( Zooniverse Project Builder), der den Entwicklungsaufwand reduziert. Hoffnungen haben sich leider nicht best\u00e4tigt, Entwicklungsaufwand kaum geringer als bei Eigenentwicklung. Weiterer Nachteil: Nicht direkt ins <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-System integriert, sondern auf Server von Zooniverse. Bislang noch nicht beworben, daher noch nicht produktiv. Transkriptionsergebnisse m\u00fcssen in csv-Datei exportiert werden, die dann in va-<span class=\"vaabr\" data-vaabr=\"DB\">DB<\/span> importiert wird. Entsprechende Prozedur wird derzeit entwickelt \u2013 (<a href=\"https:\/\/www.zooniverse.org\/projects\/filip-hr\/verbaalpina\"><span style=\"color: #ff0000;\">Demo<\/span><\/a>) \u2013 <a href=\"https:\/\/www.zooniverse.org\/\">Zooniverse<\/a> ist ein \"citizen science web portal \", das eine gro\u00dfe Anzahl von Crowdsourcing-Projekten unterst\u00fctzt und auf seinen Seiten hostet. Eines der sehr fr\u00fchen Projekte: Klassifizierung von Glaxien, \u00e4hnliche Aufgabe wie bei VerbaAlpina: <a href=\"https:\/\/www.oldweather.org\/naval_rendezvous.html\">Transkription von Logb\u00fcchern von Arktisfahrern aus dem 19. und fr\u00fchen 20. <span class=\"vaabr\" data-vaabr=\"JhDOT\">Jh.<\/span><\/a> \u2013 Zooniverse ist an der Universit\u00e4t Oxford beheimatet und verf\u00fcgt \u00fcber eine sehr gro\u00dfe Anzahl von *registrierten* freiwilligen \"Crowdern\" (\u00fcber 1,5 Mio.); VerbaAlpina \"not yet an official Zooniverse project\" (aufwendiges Review-Verfahren)<\/li>\n<\/ol>\n<\/li>\n<li>Die Vitalit\u00e4t des Crowd-Sourcing-Tools 1) wird \u00fcberwacht: <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=4629&amp;db=xxx\">CSGRAPH<\/a><\/li>\n<\/ul>\n<h1>Nachhaltigkeit<\/h1>\n<ul>\n<li>S\u00e4mtlicher \"Output\" von <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> muss dauerhaft zug\u00e4nglich und nutzbar sein<\/li>\n<li>Paradigma ist \u2013 in dieser Beziehung \u2013 das traditionelle Buch auf Papier<\/li>\n<li>Im Detail sind damit u. a. die folgenden Postulate verbunden:\n<ul style=\"list-style-type: circle;\">\n<li>Die Daten m\u00fcssen dauerhaft auffindbar sein (Buch: Bibliothekskataloge; wichtig: Es muss klar sein, an welche Institution ich mich wende. Bei einem Buch geht man selbstverst\u00e4ndlich zur Bibliothek)<\/li>\n<li>Die Daten m\u00fcssen dauerhaft zug\u00e4nglich sein (Buch: Bibliotheken)<\/li>\n<li>Inhalte m\u00fcssen pr\u00e4zise und stabil zitierbar sein (Buch: Seitenzahlen)<\/li>\n<\/ul>\n<\/li>\n<li>Durch die M\u00f6glichkeiten der elektronischen Vernetzung kommen, gegen\u00fcber dem Paradigma des Buches, die folgenden Postulate hinzu:\n<ul style=\"list-style-type: circle;\">\n<li>Projektdaten sollten mit Daten au\u00dferhalb des Projekts <strong>verkn\u00fcpft werden<\/strong> k\u00f6nnen.<\/li>\n<li>Zu diesem Zweck m\u00fcssen die Daten des Projekts zu <strong>Entit\u00e4ten<\/strong> zusammengefasst werden. Jede Instanz einer Entit\u00e4t muss eindeutig identifizierbar sein und \u00fcber eine elektronische Adresse ansprechbar sein.<\/li>\n<li>Die Kernentit\u00e4ten von <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> sind wiederum die oben bereits genannten:\n<ul style=\"list-style-type: square;\">\n<li>Morphtypen<\/li>\n<li>Konzepte<\/li>\n<li>Orte<\/li>\n<li>Basistypen<\/li>\n<\/ul>\n<\/li>\n<li>Jede Instanz dieser Entit\u00e4ten erh\u00e4lt einen innerhalb des Projekts eindeutigen Identifikator: Morphtypen <strong>Pr\u00e4fix L<\/strong>, Konzepte <strong>Pr\u00e4fix C<\/strong>, Orte <strong>Pr\u00e4fix A<\/strong>, Basistypen <strong>Pr\u00e4fix B<\/strong>) \u2013 Beispiele im <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=2374&amp;db=192\">Lexikon Alpinum<\/a><\/li>\n<li>Die Identifikatoren k\u00f6nnen auch als \"<strong>Normdaten<\/strong>\" bezeichnet werden \u2013 Unter Normdaten versteht man eindeutige, numerische oder alphanumerische Zeichenketten, die eine Instanz einer bestimmten Entit\u00e4t eindeutig identifizieren. Fr\u00fche Normdatensysteme sind z. B. im Kontext des Bibliothekswesens entstanden; ein Motiv dabei ist gewesen, Autoren mit gleichlautenden Namen eindeutig identifizieren zu k\u00f6nnen (\u21d2 h\u00e4ufige Personennamen wie im Deutschen \"Schmid\" oder \"Meier\"). Bekannte Normdatensysteme sind z. B. die Gemeinsame Normdatei (<span class=\"vaabr\" data-vaabr=\"GND\">GND<\/span>) der deutschen Nationalbibliothek (<a href=\"http:\/\/swb.bsz-bw.de\/DB=2.104\/CMD?retrace=0&amp;trm_old=&amp;ACT=SRCHA&amp;IKT=2072&amp;SRT=RLV&amp;TRM=thomas+krefeld&amp;MATCFILTER=N&amp;MATCSET=N&amp;NOABS=Y&amp;SHRTST=50\">Suchportal<\/a>; Demo: Krefeld [123778689], Alexander der Gro\u00dfe [118501828]). Ein f\u00fcr <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> relevantes Normdatensystem ist z. B. die Wikidata (Beispiel folgt gleich)<\/li>\n<li>Die projektspezifischen Normdaten k\u00f6nnen im Mapping-Verfahren mit bestehenden <strong>projektexternen Normdatensystem<\/strong> verkn\u00fcpft werden (z. B. Wikidata-QIDs: <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-Konzept-<span class=\"vaabr\" data-vaabr=\"ID\">ID<\/span> <a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=2374&amp;db=xxx#C612\">C612<\/a> [ALMH\u00dcTTE] \u21d2 Wikidata Q-<span class=\"vaabr\" data-vaabr=\"ID\">ID<\/span> <a href=\"https:\/\/www.wikidata.org\/wiki\/Q2649726\">Q2649726<\/a>])<\/li>\n<\/ul>\n<\/li>\n<li>Sofern diese inhaltliche Verkn\u00fcpfung nicht von Menschen, sondern von Maschinen geleistet werden soll, spricht man von <strong>Interoperabilit\u00e4t<\/strong>.<\/li>\n<li>Die <strong>interaktive Karte<\/strong> stellt im Hinblick auf die Zitierf\u00e4higkeit eine besondere Herausforderunge dar: Jeder User kann individuelle Kartenbilder erzeugen, die m\u00f6glicherweise wesentlich f\u00fcr eine spezifische Argumentation sind. <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> hat daher ein System entwickelt, das die <strong>Erzeugung individueller URLs<\/strong> erlaubt, deren Aufruf exakt das Kartenbild generiert, das bei Erzeugung der <span class=\"vaabr\" data-vaabr=\"URL\">URL<\/span> auf dem Bildschirm zu sehen war (<span style=\"color: #ff0000;\">Demo<\/span>).<\/li>\n<li>Wesentliche Voraussetzung f\u00fcr die uneingeschr\u00e4nkte Nachnutzbarkeit von Projektdaten ist eine m\u00f6glichst <strong>offene Lizenzpolitik<\/strong>. Seit einigen Jahren bietet hier die Initiative Creative Commons (CC; gemeinn\u00fctzige Organisation, gegr\u00fcndet 2001) generische Lizenzmodelle. <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> stellt all seine Inhalte, soweit m\u00f6glich, unter der <strong>CC-Lizenz BY-SA<\/strong> zur Verf\u00fcgung. Einzige Bedingung ist dabei nur die Nennung des urspr\u00fcnglichen Urhebers (BY) und die Weitergabe der Daten unter eben dieser Bedingung (SA = share alike)<\/li>\n<li>Diese Postulate im Hinblick auf Nachhaltigkeit sind seit einigen Jahren im Akronym <strong>FAIR<\/strong> verankert (bereits von Thomas Krefeld angesprochen): Daten m\u00fcssen <strong>F<\/strong>indable \u2013 <strong>A<\/strong>ccessible \u2013 <strong>I<\/strong>nteroperable und <strong>R<\/strong>eusable sein.<\/li>\n<li>\u00dcbertragung der <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>-Daten an die <span class=\"vaabr\" data-vaabr=\"UB\">UB<\/span> der <span class=\"vaabr\" data-vaabr=\"LMU\">LMU<\/span>, dabei Anreicherung um <strong>Metadaten<\/strong> (Prozeduren derzeit noch in der Entwicklung)<\/li>\n<li>Zu diesem Zweck: <strong>API<\/strong> (Application Programming Interface; dt: Programmierschnittstelle) \u2013 Erm\u00f6glicht Zugriff auf die Kerndaten von <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>, gegliedert nach Morphtypen \u2013 Konzepten \u2013 Ortschaften \u2013 Einzelbelegen (<a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?page_id=8844&amp;db=xxx\"><span style=\"color: #ff0000;\">Demo<\/span><\/a>)<\/li>\n<li><strong>Wozu Metadaten<\/strong>? \u2013 Ein simples Beispiel:\u00a0<span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> spricht in seinem Datenbestand von \"<strong>morpholexikalischem Typ<\/strong>\". In einem anderen Projekt wird dasselbe Konzept etwa als \"<strong>Lemma<\/strong>\" bezeichnet. Die Inhalte beider Kategorien sind jedoch aufeinander zu beziehen. Damit Menschen \u2013 und mehr noch Maschinen \u2013 erkennen k\u00f6nnen, dass es sich um kongruente, mit einander zu verkn\u00fcpfende Daten handelt, k\u00f6nnen die jeweiligen Datenbest\u00e4nde auf ein gemeinsames, nach M\u00f6glichkeit weithin bekanntes und anerkanntes Bezugssystem abgebildet werden. Meist verwendet das Metadatenschema ein alphanumerisches System, das bestimmte Entit\u00e4ten eindeutig identifiziert.<\/li>\n<li><span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span> bzw. die <span class=\"vaabr\" data-vaabr=\"UB\">UB<\/span> der <span class=\"vaabr\" data-vaabr=\"LMU\">LMU<\/span> verwenden zwei verschiedene, weit verbreitete Metadatenschemata, wobei das eine, vom Konsortium <strong>Datacite<\/strong>, im Wesentlichen f\u00fcr die Erfassung von \u00fcblicherweise in Bibliothekskatalogen erfassten Daten wie Autoren, Schlagw\u00f6rter und Entstehungszeit und -ort bezieht (<span class=\"vaabr\" data-vaabr=\"sDOT\">s.<\/span> dazu den <a href=\"https:\/\/zenodo.org\/record\/3559800\">Best Practice Guide<\/a>)<\/li>\n<li>F\u00fcr die inhaltliche Tiefenerschlie\u00dfung findet das Metadatenschema CIDOC CRM (das Conceptual Reference Model [CRM] geht zur\u00fcck auf eine Arbeitsgruppe des Comit\u00e9 International pour la Documentation [CIDOC], das seinerseits eine Gliederung des International Council of Museums (ICOM) darstellt; seit Anfang der 1990er Jahre) Anwendung (<a href=\"http:\/\/cidoc-crm.org\/versions-of-the-cidoc-crm\">Dokumentation<\/a>):<\/li>\n<\/ul>\n<p><a href=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-12196 size-large\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-1024x646.jpg\" alt=\"\" width=\"625\" height=\"394\" srcset=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-1024x646.jpg 1024w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-300x189.jpg 300w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-150x95.jpg 150w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-768x485.jpg 768w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz-624x394.jpg 624w, https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-content\/uploads\/cidoc-crm_schema_va_jschulz.jpg 1453w\" sizes=\"auto, (max-width: 625px) 100vw, 625px\"><\/a><\/p>\n<p>&nbsp;<\/p>\n<\/div><div id=\"ABR_VA\" style=\"display: none;\">VerbaAlpina<\/div><div id=\"ABR_sogDOT\" style=\"display: none;\">sogenannt<\/div><div id=\"ABR_JhDOT\" style=\"display: none;\">Jahrhundert<\/div><div id=\"ABR_latDOT\" style=\"display: none;\">Latein (ISO 639-3)<\/div><div id=\"ABR_DB\" style=\"display: none;\">Datenbank<\/div><div id=\"ABR_ITG\" style=\"display: none;\">IT-Gruppe Geisteswissenschaften (<span class=\"vaabr\" data-vaabr=\"LMU\">LMU<\/span> Center for Digital Humanities)<div id=\"ABR_LMU\" style=\"display: none;\">Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div><\/div><div id=\"ABR_SQL\" style=\"display: none;\">structured query language<\/div><div id=\"ABR_sDOT\" style=\"display: none;\">siehe<\/div><div id=\"ABR_GND\" style=\"display: none;\"><a href=\"https:\/\/www.dnb.de\/DE\/Professionell\/Standardisierung\/GND\/gnd_node.html\" target=\"_BLANK\">Gemeinsame Normdatei<\/a><\/div><div id=\"ABR_ID\" style=\"display: none;\">Identifikationsnummer<\/div><div id=\"ABR_URL\" style=\"display: none;\">Uniform Resource Locator<\/div><div id=\"ABR_UB\" style=\"display: none;\">Universit\u00e4tsbibliothek<\/div><div id=\"ABR_LMU\" style=\"display: none;\">Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div>","protected":false},"excerpt":{"rendered":"<p>Grunds\u00e4tzliches VerbaAlpina (VA) besch\u00e4ftigt sich mit der Frage, welche Bezeichnungen es f\u00fcr ausgew\u00e4hlte, f\u00fcr den Alpenraum typische Konzept\/Begriffe es gab und gibt VA ist mit diesem Ziel ein von der DFG gef\u00f6rdertes Langfristvorhaben mit Perspektive bis 2025 (derzeit dritte Teilphase [2019-2022] in Beantragung) Die Untersuchung ist auf den Alpenraum beschr\u00e4nkt Die Grenze des Untersuchungsgebiets ist [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"btdb_keywords":[],"coauthors":[],"class_list":["post-12200","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/12200","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=12200"}],"version-history":[{"count":28,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/12200\/revisions"}],"predecessor-version":[{"id":12272,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/12200\/revisions\/12272"}],"wp:attachment":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=12200"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=12200"},{"taxonomy":"btdb_keywords","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fbtdb_keywords&post=12200"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcoauthors&post=12200"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}