Methodologie

Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Datenmodellierung  (Zitieren)

s. Relationales Datenmodell

Tags: Dokumentation Kooperation Forschungslabor



Datenzugriffsschicht  (Zitieren)

Der Zugriff auf das Modul VA_DB erlaubt, unmittelbar in den primären Projektdaten zu recherchieren. Dieser Zugriff kann entweder durch den Menschen (über das Modul VA_WEB) oder durch Maschinen bzw. Programme erfolgen. Letzteres Szenario besteht z. B. auch projektintern bei der Kommunikation zwischen den Modulen VA_WEB und VA_DB, betrifft aber auch automatische Zugriffe z. B. von Rechnern bzw. Programmen der VA-Projektpartner. Im Laufe der Entwicklungsarbeiten im Bereich der Module VA_WEB und VA_DB ist es aus informatischer bzw. programmiertechnischer Sicht nicht selten erforderlich, bestehende Datenstrukturen zu verändern und an neue Erfordernisse anzupassen. Dies kann im Fall des Zugriffs durch einen Menschen zu Verwirrung führen, im Fall des Zugriffs durch eine Maschine bzw. ein Programm führt es schlicht zu einer Fehlfunktion. Um diesem Problem zu begegnen, wird innerhalb von VA_DB eine – zumindest weitgehend – stabile Datenstruktur zwischengeschaltet, in die hinein die veränderlichen primären Datenstrukturen projiziert werden.

auct. Stephan Lücke

Tags: Kooperation Publikation Forschungslabor



Digital Humanities  (Zitieren)

Das Projekt VerbaAlpina wurde von vornherein mit Blick auf Webtauglichkeit konzipiert, denn es will ganz entschieden zur Überführung der etablierten geisteswissenschaftlichen Traditionen, genauer: der Geolinguistik, in die Digital Humanities beitragen .
Das bedeutet:
(1) Die empirische Grundlage der Forschung besteht in Daten (vgl. Schöch 2013), d.h. in digital kodierten und strukturierten oder mindestens strukturierbaren Einheiten; dabei handelt es sich teils um bereits publizierte und sekundär digitalisierte Daten (wie z.B. die älteren Atlasmaterialien), teils aber auch um neu zu erhebende Daten. Im Blick auf die relevanten Konzepte werden möglichst umfangreiche Datenbestände angestrebt. Die Methode ist also quantitativ und weitgehend induktiv.
(2) Die Forschungskommunikation erfolgt unter den medialen Bedingungen des Internets. Das eröffnet zunächst die Möglichkeit unterschiedliche Medien (Schrift, Bild, Video und Ton) hypertextuell zu verflechten; weiterhin können die als Forscher (vor allem als Projektpartner) und/oder als Informanten beteiligten Personen kontinuierlich miteinander kommunizieren und kooperieren.
(3) Damit wird interessierten Wissenschaftlern das Angebot gemacht, an der Entwicklung dieser projektbasierten und kollaborativen Forschungsplattform mitzuwirken. Diese Perspektive ist mindestens in doppelter Hinsicht nützlich und weiterführend: Sie erlaubt es, unterschiedliche Standorte einzubinden und – vor allem – die konstruktive Verschränkung von Informationstechnologie und Sprachgeographie mit öffentlichen Ressourcen voranzutreiben, ohne auf den (juristisch und ökonomisch problematischen) Support privater IT-Firmen zurückgreifen zu müssen.
(4) Das projektrelevante Wissen kann auch auf längere Zeit kontinuierlich akkumuliert und modifiziert werden, obwohl die Garantie einer dauerhaften Verfügbarkeit technisch noch schwer umzusetzen ist (vgl. hierzu die wichtige CLARIN-D-Forschungsinfrastruktur http://de.clarin.eu/de/home.html). Jedenfalls ist eine Publikation der Ergebnisse auf dinglichen Trägermedien (Bücher, CDs oder DVDs) vor diesem Hintergrund kein zentrales Anliegen mehr; gleichwohl wird eine sekundäre Druckoption eingerichtet, so wie es auch die Online-Lexikographie gelegentlich anbietet, so z. B. der exemplarische Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld)

Tags: Kooperation Crowdsourcing



Digital Object Identifier (DOI) (Zitieren)

Der Digital Object Identifier (DOI) ist eine weltweit eindeutige und unveränderliche Adresse, über die elektronische Ressourcen wie z.B. Websites erreichbar sind. Die Erreichbarkeit ist auch dann gewährleistet, wenn sich z.B. der sog. "Uniform Resource Locator" (URL) einer Ressource ändert. Dies wird durch einfaches Mapping erreicht: Die DOI-Stiftung führt ein Register, in dem jedem DOI die jeweils aktuelle URL einer Ressource zugeordnet ist. Bei Änderung einer URL erfolgt entsprechend die Änderung im Register der DOI-Stiftung. Änderungen müssen der DOI-Stiftung durch die assoziierten Organisationen (z.B. Bibliotheken) mitgeteilt werden, die den betreffenden DOI hatten registrieren lassen. Die Eintragung von VerbaAlpina im DOI-Register erfolgt über das "Referat Elektronisches Publizieren" der Universitätsbibliothek der LMU, die ihrerseits die Registrierung nicht direkt bei der DOI-Stiftung, sondern bei DataCite vornimmt, das selbst Mitglied der DOI-Stiftung ist.

Der wesentliche Nutzen des DOI-Systems besteht in der nachhaltigen Zitierbarkeit elektronischer Ressourcen. Ein DOI-Zitat führt auch dann auf die richtige Ressource, wenn sich die Adresse im Internet (die URL) geändert hat. Der DOI von VerbaAlpina lautet doi:10.5282/verba-alpina, wobei die 10.5282 der registrierenden Organisation, in diesem Fall der Universitätsbibliothek der LMU zugeordnet ist. Damit ein Zitat beispielsweise in einem wissenschaftlichen Aufsatz direkt auf das Portal von VerbaAlpina führt, muss der DOI in die URL der DOI-Stiftung eingebunden werden: http://dx.doi.org/10.5282/verba-alpina. Das unmittelbare Ansprechen spezifischer Teilressourcen auf dem VerbaAlpina-Portal (beispielsweise einzelner Dateien in der Mediathek-Modul von VerbaAlpina [VA_MT]) über den DOI ist nicht möglich. Für jede Teilressource von VerbaAlpina wäre ein weiterer DOI erforderlich.

Nahezu dem selben Zweck wie der DOI dient der sog. Uniform Resource Name (URN), und auch die Funktionsweise ist in etwa die gleiche. Anders als beim DOI ist beim URN jedoch die Registrierung mehrerer URLs für eine Ressource möglich. Dies kann etwa dann von Interesse sein, wenn Ressourcen im Sinne der Ausfallsicherheit oder Nachhaltigkeit auf verschiedenen Servern mit entsprechend unterschiedlichen URLs abgelegt werden. Ein gewisser Nachteil der URN gegenüber der DOI besteht darin, dass das URN-Register nicht von einer einzigen Institution, sondern dezentral von verschiedenen nationalen Organisationen betrieben wird. Für Deutschland übernimmt diese Aufgabe die Deutsche Nationalbibliothek (DNB), weshalb für Ressourcen, die über die DNB registriert wurden, der die URN verwaltende Server (ein sog. Resolver) der DNB aufgerufen werden muss. Die URN von VerbaAlpina lautet urn:nbn:de:bvb:19-verba-alpina-8, die entsprechende URL mit dem DNB-Resolver, der auf das Portal von VerbaAlpina führt, lautet http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8. Ebenso wie beim DOI ist das unmittelbare Ansprechen spezifischer Teilressourcen auf dem VerbaAlpina-Portal über den URN nicht möglich.


(auct. Stephan Lücke)

Tags: Dokumentation



Digitalisierung  (Zitieren)

Mit Digitalisierung wird im Kontext von VerbaAlpina nicht der schlichte Einsatz von Computern zur elektronischen Datenverarbeitung, sondern vielmehr und wesentlich die digitale Tiefenerschließung des Materials durch systematische und transparente *Strukturierung* und Kategorisierung verstanden.





Dabei kommt quasi ausschließlich das relationale Datenmodell zum Einsatz, bei dem das Datenmaterial grundsätzlich in Tabellengestalt organisiert wird. Die Tabellen bestehen aus Zeilen (= Datensätze, Tupel) und Spalten (= Attribute, Felder, Eigenschaften), wobei jede Tabelle in jede Richtung um zusätzliche Zeilen und Spalten erweitert werden kann. Zwischen den Tabellen bestehen logische Zusammenhänge, die sinnvolle Verknüpfungen und entsprechende synoptische Darstellungen (sog. "Joins") von zwei und mehr Tabellen erlauben. Für die Verwaltung der Tabellen setzt VerbaAlpina derzeit das Datenbankmanagementsystem MySQL ein, die Tabellen sind jedoch nicht an dieses System gebunden, sondern können jederzeit z.B. in Textgestalt mit eindeutig zu definierenden Trennzeichen für Feld- und Datensatzgrenzen (sog. Separatoren) zusammen mit den Spaltennamen und der Dokumentation der logischen Zusammenhänge (Entity-Relationship-Modell) exportiert werden. Die derzeit vielfach verwendete XML-Struktur wird im operativen Bereich von VerbaAlpina nicht eingesetzt. Im Rahmen des Schnittstellenkonzepts ist XML jedoch als Exportformat verankert.

Neben der logischen Strukturierung der Daten spielt im Zusammenhang mit dem Stichwort "Digitalisierung" die Kodierung der Schriftzeichen die zweite zentrale Rolle. Gerade im Hinblick auf die Langzeitarchivierung des Datenmaterials ist der richtige Umgang mit dieser Thematik von großer Bedeutung. Soweit möglich, orientiert VerbaAlpina sich dabei an der Kodierungstabelle und den Vorgaben des Unicode-Konsortiums. Im Fall der Digitalisierung von Schriftzeichen, die bislang noch nicht in die Unicodetabelle aufgenommen sind, erfolgt die digitale Datenerfassung eines Einzelzeichens vorzugsweise durch Serialisierung in Gestalt einer Abfolge von Zeichen aus dem Unicode-Bereich x21 bis x7E (innerhalb des ASCII-Bereichs). Die entsprechenden Zuordnungen werden in speziellen Tabellen dokumentiert, wodurch eine spätere Konvertierung in dann möglicherweise vorhandene Unicodewerte stets möglich ist.

(auct. Stephan Lücke)

Tags: Dokumentation