{"id":5746,"date":"2018-07-02T17:02:09","date_gmt":"2018-07-02T16:02:09","guid":{"rendered":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=5746"},"modified":"2019-05-20T12:41:52","modified_gmt":"2019-05-20T11:41:52","slug":"verbaalpinagerdi","status":"publish","type":"post","link":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=5746","title":{"rendered":"VerbaAlpina@GeRDI"},"content":{"rendered":"

Gerdi-Fragebogen zu VerbAlpina (Februar 2018)<\/h1>\n
\n
Abl\u00e4ufe:<\/li>\n<\/ul>\n
Daten-\/Serverinfrastruktur<\/strong>: Die Daten von VerbaAlpina werden modularisiert und versioniert verwaltet. Die sprachlichen Kerndaten liegen auf einem geclusterten MySQL-Server (= Modul VA<\/span>_DB<\/span>). Darauf aufsetzend arbeitet eine mit WordPress realisierte GeRDI-VA<\/span>-DataSources-270618-1638-16<\/a>Webschnittstelle (VA<\/span>_WEB), die u.a. eine Seite zur interaktiven kartographischen Visualisierung der in VA<\/span>_DB<\/span> gehaltenen Daten erlaubt.<\/p>\n
Datenmanagementpl\u00e4ne<\/strong>: ja, aber nicht in standardisierter Form (vgl.<\/span> https:\/\/www.forschungsdaten.info\/themen\/planen-und-strukturieren\/datenmanagementplan\/<\/a>; entsprechende Dokumentationen sind in der Rubrik Methodologie<\/a> abgelegt.<\/p>\n
Freigabe<\/strong>: Der Zugriff auf die Datenbankschnittstellen VAP ist ausschlie\u00dflich Kooperationspartnern von VerbaAlpina erlaubt und unterliegt einer CC BY-SA- bzw. der ODC-ODbL-Lizenz<\/p>\n
\n
Daten:<\/li>\n<\/ul>\n
Gr\u00f6\u00dfe<\/strong>: 1,5 GB (Modul VA<\/span>_DB<\/span>; Stand Feb. 2018), 30 GB in 33315 Dateien (Modul VA<\/span>_WEB; Stand Feb. 2018)<\/p>\n
Formate<\/strong>: relationales Datenformat;<\/p>\n
Typen<\/strong>: ??<\/p>\n
Ursprung<\/strong>: Teils strukturierte Erfassung retrodigitalisierter Sprachatlanten und W\u00f6rterb\u00fccher, teils Crowd, teils Projektpartner<\/p>\n
Software<\/strong>: ??<\/p>\n
Schnittstellen<\/strong>: VAP_ling_[language] (Sprachdaten), VAP_geo_[language] (erg\u00e4nzende georeferenzierte Daten wie z.B. Fundorte von lateinischen Inschriften) (in jeweils 5 Sprachen)<\/p>\n
Datenschutz<\/strong>: [Pers\u00f6nlichkeitsrechte? Urheberrechte?]<\/p>\n
Speicher<\/strong>: Storage mit Plattenarrays; regelm\u00e4\u00dfige Backups \u00fcber TSM ins LRZ<\/p>\n
\n
Metadaten:<\/li>\n<\/ul>\n
Arten<\/strong>: s.<\/span> Attribute der VAP-Schnittstellen<\/p>\n
Speicherung<\/strong>: gemeinsam mit Prim\u00e4rdaten in VAP-Schnittstellen<\/p>\n
Standards<\/strong>: propriet\u00e4r; Standards werden durch individuell erzeugte Schnittstellen bedient (wie jetzt z.B. GeRDI: Datacite -> OAI-PMH -> Harvester)<\/p>\n
Datenschutz<\/strong>: s.oben<\/p>\n
Schnittstellen<\/strong>: ??<\/p>\n
\n
Datenauswertung:<\/li>\n<\/ul>\n
Programme<\/strong>: \u2013 (ggf. zuk\u00fcnftig R oder SQL<\/span>)<\/p>\n
Aufbereitung<\/strong>: ??<\/p>\n
Visualisierung<\/strong>: Online-Karte (Javascript, Google API)<\/p>\n
\n
VA<\/span>@GeRDI (27. Juni 2018)<\/h1>\n
Tagesordnung<\/strong><\/span><\/p>\n
TOP 1: Roadmap (TW\/HN)\u00a0<\/strong><\/p>\n
TOP 2: Usecases Datenkorrelation (TW\/HN)<\/strong><\/p>\n
TOP 3: Bericht \u00fcber Kontakte zu UBs (LMU<\/span>, Erlangen) (SL)<\/strong><\/p>\n
TOP 4: Kooperation GeRDI \u2013 UZH (TK)<\/strong><\/p>\n
<\/p>\n
TOP 1: Roadmap (TW\/HN)<\/strong><\/p>\n
GeRDI arbeitet in Releases, die ungef\u00e4hr alle drei Monate
\nherausgegeben werden sollen. Das w\u00e4re eine m\u00f6gliche Roadmap (bis zum
\nEnde von GeRDI Phase 1, in Phase 2 k\u00f6nnen ggf. neue Milestones
\nvereinbart werden):<\/p>\n
Release 0.3 (Herbst 2018):<\/strong><\/p>\n
\"Minimal viable product\" -> Verba Alpina Daten sind im GeRDI-Index
\n(ohne die Knowledge Base und mit Bounding Boxes)
\nM\u00f6gliche Data Provider f\u00fcr die Datenkorrelation wurden
\nidentifiziert (GeRDI-VA<\/span>-DataSources)<\/a><\/strong><\/p>\n
\n
Bis zu Release 0.3 soll ein praxistaugliches Metadatenmodell implementiert werden (\"minimal viable product\"). Die Entwicklung soll in enger Abstimmung mit der UB<\/span> erfolgen.<\/li>\n
Mit welchen Daten die VA<\/span>-Daten kombiniert werden sollen, soll bis Herbst 2018 ausdiskutiert sein.<\/li>\n
Metadatenproviding f\u00fcr GeRDI-Index kann sp\u00e4ter auch \u00fcber die UB<\/span> laufen; bez\u00fcglich der sustainability w\u00e4re es ein Gewinn, wenn sich die UB<\/span> als Zwischeninstanz einschalten w\u00fcrde (denkbar w\u00e4re: VA<\/span> liefert an --> UB<\/span> e-humanities --> UB<\/span> e-humanities bereitet die Daten auf --> liefert sie dann an GeRDI).<\/li>\n<\/ul>\n
UB<\/span> e-humanities Projekt<\/strong><\/p>\n
\n
Das e-humanities Projekt f\u00fchrt vertiefte Inhaltsanalysen durch und verkn\u00fcpft\u00a0 die Daten mit Normdaten. Geplant ist, die Daten dann an GeRDI zu liefern.<\/li>\n
Frau K\u00fcmmet wertet derzeit die Entit\u00e4ten der ITG<\/span>-Projekte aus. Diese sollen mit Wikidata verkn\u00fcpft werden. Es ist jedoch noch nicht klar, ob sich alle Entit\u00e4ten mit Wikidata abbilden lassen.<\/li>\n<\/ul>\n
Release 0.4 (Winter 2018\/19)<\/strong><\/p>\n
Geo-Granularit\u00e4t verbessert (Merging der Polygone f\u00fcr einen besseren
\nInformationsgehalt).
\nAnbindung der Data Provider f\u00fcr die Datenkorrelation in den GeRDI-Index.<\/p>\n
Release 0.5 (Fr\u00fchling 2019)<\/strong><\/p>\n
Erste Tests des Daten-Stagings (automatischer Bezug der VA<\/span>-Daten mit
\nden Daten anderer Data-Provider) \"so automatisch wie m\u00f6glich\"
\nAutomatischer Bezug der Daten<\/p>\n
\n
Bis Release 0.5 sollen alle Daten von VA<\/span> und Daten aus anderen Quellen auf die Plattform von GeRDI gebracht werden. Man hat eine erste Idee, wie automatisierbar dieser Prozess ist.<\/li>\n<\/ul>\n
Release 0.6 (Sommer 2019)<\/strong><\/p>\n
Anbindung Knowledge Base an VerbaAlpina-Metadaten
\nAnalyse der gestagten Daten auf LRZ-Rechnern<\/p>\n
\n
Es soll gepr\u00fcft werden, welche Aufbereitung der Daten m\u00f6glich ist.<\/li>\n
Die Daten sollen mit einer logischen Einheit referieren.<\/li>\n
Es soll festgelegt werden, wie genau die Datenanalyse ablaufen soll (welche Analyseschritte etc.).<\/li>\n<\/ul>\n
Release 0.7 (Herbst 2019)<\/strong><\/p>\n
Puffer f\u00fcr Unvorhergesehenes<\/p>\n
\n
Im Herbst 2019 endet GeRDI Phase I.<\/li>\n
Bis dahin soll ein Anwendungsfall von VA<\/span> \u00fcber die GeRDI-Plattform zum Laufen gebracht worden sein.<\/li>\n
Bei Verl\u00e4ngerung von GeRDi soll mit den Communities aus Phase I auch in Phase II weiter zusammengearbeitet werden. Bei fehlender Anschlussfinanzierung von GeRDI ist vorstellbar, dass das LRZ und die UB<\/span> als Ansprechpartner dienen und dass das e-humanities Projekt der UB<\/span> die von GeRDI entwickelten Funktionalit\u00e4ten \u00fcbernimmt.<\/li>\n<\/ul>\n
Methodik GeRDI<\/strong><\/p>\n
\n
GeRDI nutzt existierende Metadaten-Harvesting-Modelle<\/li>\n
gearbeitet wird mit DataCite als Standard und OAI-PMH-Protokoll (pleonastisch); damit soll bis Release 0.3 die erste laufbare Version produziert werden<\/li>\n
wenn DataCite technisch nicht funktioniert, wird darauf entsprechend reagiert<\/li>\n
laut TW bietet DataCite alles, um die Daten zugreifbar und interseparabel zu machen<\/li>\n
im Endeffekt soll anhand von Usecases festgestellt werden, welche Anforderungen ein Metadatenstandard erf\u00fcllen muss und ob DataCite daf\u00fcr ausreicht<\/li>\n
bei Version 0.2\/0.3 soll deshalb geschaut werden, ob die Funktionalit\u00e4ten von DataCite ausreichen; wenn nicht, wird man sich nach entsprechenden Alternativen umschauen (Standard selbst kreieren oder einen bestehenden Standard entsprechend anpassen) und kann, wenn n\u00f6tig, dann immer noch nachsteuern<\/li>\n
geplant ist das Mapping von DataCite zu Dublin Core (= Mindeststandard, es gibt aber bessere Metadatenstandards)<\/li>\n<\/ul>\n
Allgemeines<\/strong><\/p>\n
\n
ab 18\/1 sollen Metadatenannotationen auf SQL<\/span>-Abfragen losgeschickt werden,\u00a0Datenbasis: Schnittstelle vap_ling_xx<\/li>\n
Die Daten sind dann redundant verf\u00fcgbar und automatisch beziehbar<\/li>\n
Usecases sind m\u00f6glich, wie z.B. die Ausgabe bestimmter Diffusionsmuster f\u00fcr bestimmte Gemeinden<\/li>\n
die entscheidenden Kategorien sind: Gemeinden, Konzepte, Morph-Typen, Zeit; jeder einzelne Morph-Typ ist ansprechbar; wenn eine Wissensdatenbank dazukommt, k\u00f6nnen andere, z.B. gro\u00dfe Online-W\u00f6rterb\u00fccher, auch daran ankn\u00fcpfen<\/li>\n
auch der umgekehrte Fall ist denkbar, d.h. Metadaten aus GeRDI flie\u00dfen in VA<\/span> und nicht umgekeht; Daten aus 3 Bereichen stehen zur Verf\u00fcgung: Statistik-Beh\u00f6rden, Transportdaten und Geophysikdaten<\/li>\n<\/ul>\n
TOP 2: Usecases Datenkorrelation (TW\/HN)<\/strong><\/p>\n
\n
Nachnamen => Korreliert die Parzellierung der Typen mit der geographischen Distribution von Nachnamen?<\/li>\n
Demographie-Daten => Welche Zusammenh\u00e4nge gibt es zu Nivellierungen?<\/li>\n
geophysikalische Daten => Stichworte: \"Baumgrenze\", Flora und Fauna-Daten; hier fehlt eine genaue Fragestellung.<\/li>\n
Daten, die Verh\u00e4ltnis von Einheimischen zu nicht-Einheimischen beschreiben (\u00dcbernachtungszahlen, Verkehrswege, Transportsysteme) => Korelliert dies mit Nivellierungen?<\/li>\n<\/ul>\n
TOP 3: Bericht \u00fcber Kontakte zu UBs (LMU<\/span>, Erlangen) (SL), <\/strong>TOP 4: Kooperation GeRDI \u2013 UZH (TK)<\/strong><\/p>\n
\n
da geisteswissenschaftliche Projekte derzeit allgemein aufgefordert werden, Metadaten anzulegen, ist ein einheitliches Metadatenmodell anzustreben, damit die Daten kompatibel sind<\/li>\n
TK w\u00e4re deshalb daf\u00fcr, Kontakt zu anderen aufzunehmen (UZH\/UBs)<\/li>\n
TW pl\u00e4diert daf\u00fcr, zun\u00e4chst einen konkreten technischen Vorschlag zu machen und diesen in eine Version zu bringen, die pr\u00e4sentabel ist, bevor man mit anderen in Kontakt tritt<\/li>\n<\/ul>\n
\n
VA<\/span>@GeRDI (09. Juli 2018) \u2013 Treffen zum Thema \"Data Provider\"<\/h1>\n
Teilnehmer: Krefeld, L\u00fccke, Nguyen, Weber<\/p>\n
Ort: ITG<\/span><\/p>\n
Zeit: 12:30-13:30<\/p>\n
VA<\/span> ist interessiert an Daten aus folgenden Kategorien:<\/p>\n
\n
Demographie<\/li>\n
Infrastruktur (Internet-Erschlie\u00dfung und -Nutzung, Verkehrswege [Stra\u00dfen, Eisenbahn, Flugh\u00e4fen], Tourismus)<\/li>\n
geophysikalische Daten (Klima, Wetter, Bodeng\u00fcte)<\/li>\n
Wirtschaft (Verbreitung bestimmter Wirtschaftsformen, z.B. Almwirtschaft, Holzwirtschaft etc.)<\/li>\n<\/ul>\n
Alle Daten sollten mit Chronoreferenzierung versehen sein und m\u00f6glichst mehrere Zeitschnitte enthalten (Diachronie).<\/p>\n
Als Data Provider wird zun\u00e4chst Eurostat (http:\/\/ec.europa.eu\/eurostat\/data\/database<\/a>ausgewertet. Erst wenn gew\u00fcnschte Daten von dort nicht zu beziehen sind, wird auf nationale Datenquellen zur\u00fcckgegriffen.<\/p>\n
Im ersten Anlauf werden zun\u00e4chst nur Daten zur Demographie erfasst.<\/p>\n
Anregung1: MA-Arbeit zur algorithmischen Strukturierung der Daten des Idiotikons (https:\/\/digital.idiotikon.ch\/idtkn\/id12.htm#!page\/120031\/mode\/1up<\/a>) am LRZ?<\/p>\n
Anregung2: Integration der von FZ im Rahmen seiner Diss erzeugten Daten\u00a0 aus dem REW<\/span> (http:\/\/www.nbn-resolving.de\/urn:nbn:de:bvb:355-ubr07799-0<\/a>) in GeRDI?<\/p>\n
Das n\u00e4chste VA<\/span>@GeRDI-Treffen findet statt, sobald entweder das Ziel von release 0.3 (\"Minimal viable product\" -> VA<\/span>-Daten im GeRDI-Index) erreicht ist oder demographische Daten im Gerdi-Index aufgenommen sind. Herr Nguyen und Herr Weber melden sich bei VA<\/span>.<\/p>\n
\n\n
Teilnehmer: K\u00fcmmet, L\u00fccke, Mutter, Nguyen, Weber, Zacherl<\/p>\n
Ort: Medienlabor, Raum 3010, Schellingstra\u00dfe 33<\/p>\n
Zeit: 14:00-16:00 Uhr<\/p>\n
Tagesordnung<\/strong><\/p>\n
TOP 1: Aktueller Stand: Metadaten, Harvester
\n<\/strong><\/p>\n
TOP 2: Statusbericht GeRDI 0.2 und 0.3
\n<\/strong><\/p>\n
TOP 3: N\u00e4chste Planungen GeRDI 0.4
\n<\/strong><\/p>\n
TOP 4: Vorbereitungen Community Workshop
\n<\/strong><\/p>\n
TOP 5: VA<\/span>-Datenexport
\n<\/strong><\/p>\n
<\/p>\n
TOP 1: Aktueller Stand: Metadaten, Harvester
\n<\/strong><\/p>\n
GeRDI-Dienste<\/strong><\/p>\n
\n
die Dienste \"Harvest\", \"Search\" und \"Bookmark\" sind in GeRDI zentral, der Harvest-Dienst ist f\u00fcr die Nutzer nicht sichtbar<\/li>\n
GeRDI bezieht sich hinsichtlich des Forschungsdaten-Lebenszyklus auf das Modell UK data life cycle <\/em>(Quelle: UK Data Service https:\/\/www.ukdataservice.ac.uk\/manage-data\/lifecycle<\/a>), beinhaltet die folgenden Schritte: creating data --> processing data --> analysing data --> preserving data --> giving access to data --> re-using data<\/li>\n
VA<\/span> w\u00fcrde gerne auf das Modell, das GeRDI zugrunde legt, referieren k\u00f6nnen; zu diesem Zweck soll das Modell irgendwo zentral abgelegt werden<\/li>\n<\/ul>\n
Workflows<\/strong><\/p>\n
\n
bislang gibt es in GeRDI zwei Suchm\u00f6glichkeiten: einfache Suche + erweiterte Suche<\/li>\n
weitere Funktionen: Suchbereich einschr\u00e4nken; Daten speichern, bearbeiten, visualisieren; bookmark (speichert Daten als Lesezeichen zur sp\u00e4teren Ansicht)<\/li>\n
beide Suchm\u00f6glichkeiten sollen von Beginn an angeboten werden<\/li>\n
Auswahl an Filterm\u00f6glichkeiten soll sich an den Elementen von DataCite orientieren<\/li>\n
Datens\u00e4tze von VA<\/span> sollen georeferenziert dargestellt werden, M\u00f6glichkeit zu georeferenzierter Suche ist aber wichtiger als georeferenzierte Visualisierung, die bereits durch VA<\/span> selbst geleistet wird<\/li>\n
an sprachunabh\u00e4ngiger Suche wird gearbeitet (Suche nach \"Butter\" findet \"Butter\", \"burro\", \"beurre\" ...)<\/li>\n
Material muss downloadbar und ver\u00e4nderbar sein<\/li>\n
f\u00fcr VA<\/span> w\u00e4re wichtig: Auffindbarkeit, feine Granulierung und luzide Beschreibung des Materials (\u00e4hnlich https:\/\/data.ub.uni-muenchen.de\/110\/<\/a>)<\/li>\n
Auswahl des Materials soll sich an Metadaten orientieren, die in DataCite vorliegen; zun\u00e4chst sollen Daten ausgew\u00e4hlt werden, die sich bez\u00fcglich Georeferenz decken; danach soll der Nutzer die M\u00f6glichkeit erhalten, die Daten in gesonderter Umgebung (mit Python\/R etc.) zu entpacken\/explorieren\/statistisch auszuwerten. \u2013 \u00c4hnliches leistet bereits https:\/\/www.max.gwi.uni-muenchen.de\/<\/a><\/li>\n
Format der Daten: CSV, evtl. auch XML<\/li>\n
Partnerprojekte von GeRDI m\u00fcssen bestimmte Metadaten mitteilen: Georeferenzierung, Chronoreferenzierung, Zuordnung zu groben Bereichen<\/li>\n
M\u00f6gliche Gestaltung der Suchanfragen: Zeiteinschr\u00e4nkung, Ortseinschr\u00e4nkung, Schlagwort<\/li>\n<\/ul>\n
Metadatenschema<\/strong><\/p>\n
\n
Bislang nur das Standard-Set des DataCite-Schemas implementiert<\/li>\n
Metadatenschemata von verschiedenen Disziplinen werden zun\u00e4chst angeschaut und dann auf entsprechende T\u00f6pfe verteilt: DataCite, Extension, Disziplin-spezifisch etc.<\/li>\n
die gelieferten Metadaten sollen einem gewissen Standard entsprechen<\/li>\n
Grundlage soll das Formular zur Vergabe von DataCite sein; erst wenn bestimmte Felder ausgef\u00fcllt sind, sind Metdaten akzeptabel<\/li>\n<\/ul>\n
<\/p>\n
TOP 2: Statusbericht GeRDI 0.2 und 0.3
\n<\/strong><\/p>\n
GeRDI 0.2:<\/strong><\/p>\n
\n
weitere Repositorien wurden eingebunden<\/li>\n
weitere Filterfunktionen wurden implementiert<\/li>\n<\/ul>\n
GeRDI 0.3:<\/strong><\/p>\n
\n
v.a. Verbindung von Oberfl\u00e4che mit Backend steht im Mittelpunkt<\/li>\n<\/ul>\n
TOP 3: N\u00e4chste Planungen GeRDI 0.4<\/strong><\/p>\n
\n
kontrolliertes Vokabular f\u00fcr Verwendung in Metadatenschemata wie DataCite<\/li>\n
Suche und Filterung anhand disziplin-spezifischer Metadaten<\/li>\n
weitere Repositorien einbinden<\/li>\n
Download der Suchergebnisse auf lokale Festplatte<\/li>\n
Aufbau eines Jupyter-Hubs (-> f\u00fcr nachgelagerte Analyse von Projektdaten \u00e4hnlich https:\/\/www.max.gwi.uni-muenchen.de\/<\/a>)<\/li>\n<\/ul>\n
TOP 4: Vorbereitungen Community Workshop
\n<\/strong><\/p>\n
F\u00fcr den Community Workshop sind soweit alle Vorbereitungen bereits getroffen.<\/p>\n
TOP 5: VA<\/span>-Datenexport<\/strong><\/p>\n
\n
Daten sollen feingranuliert in 4erlei Gestalt an die UB<\/span> ausgegeben werden: morpholexikalische Typen, Konzepte, Ortschaften, Einzelbelege<\/li>\n
f\u00fcr jeden einzelnen Datensatz wird eine einzelne Datei erzeugt, die jeweils mit einem Buchstaben (A= Ortschaften, C=Konzepte, L=morpholexikalische Typen) und einer Identifikationsnummer\u00a0 versehen wird<\/li>\n
f\u00fcr jeden einzelnen Datensatz wird ein DataCite-Metadatensatz erzeugt; auf diesem Wege landen die Metadaten (nach einem Mapping ins MARC-Format) auch im Bibliothekskatalog (OPAC)<\/li>\n
VA<\/span> spricht sich f\u00fcr die Etablierung von Normdaten (GND<\/span>) f\u00fcr morpholexikalische Typen aus; Teil der GND<\/span> ist die ID<\/span>, die auf genau einen Datensatz verweist; analog soll dies auch f\u00fcr Konzepte erfolgen<\/li>\n
eine DOI<\/span> erhalten: morpholexikalische Typen, Konzepte, Ortschaften, Einzelbelege und der gesamte Datensatz (VA<\/span>_DUMP)<\/li>\n
die genaue Granularit\u00e4t der Daten muss noch diskutiert werden; evtl. gibt es zum Thema \"Data granularity\" eine Empfehlung von Interessensgruppen der RDA (Research Data Alliance https:\/\/www.rd-alliance.org\/<\/a>); Herr Weber schl\u00e4gt vor, dort mal nachzufragen<\/li>\n
sp\u00e4testens ab November soll GeRDI die OAI-PMH-Schnittstelle von Open Data LMU<\/span> ansprechen k\u00f6nnen<\/li>\n<\/ul>\n
\n
Second community workshop GeRDI (16. Mai 2019, Berlin)<\/h1>\n
Ort: DFN-Verein e.V., Alexanderplatz 1, 10178 Berlin<\/p>\n
Zeit: 10:00 \u2013 16:00 Uhr<\/p>\n
Allgemeines<\/h2>\n
\n
Start von GeRDI II ist f\u00fcr Ende dieses Jahr\/Anfang n\u00e4chstes Jahr geplant<\/li>\n
Verl\u00e4ngerungsantrag wurde bereits eingereicht<\/li>\n
bisher implementierte Funktionen von GeRDI: Search, Bookmark, Store (Jupyter Hub storage) --> aktuell wird an den Funktionen \"Process\" und \"Analyze\" gearbeitet (entsprechend dem research data life cycle model)<\/li>\n
Ziel ist es, insgesamt 15 Repositorien einzubinden (derzeit sind es 12)<\/li>\n
die angestrebte Menge an Metadaten, die integriert werden sollen, wurde bereits \u00fcberschritten (geplant waren 700.000, derzeit sind es bereits 875.000 metadata records)<\/li>\n
Ziele f\u00fcr die n\u00e4chste Projektphase: stakeholders + community building, services based on federation, disciplinary metadata, Europe-wide visibility of research data from Germany (FAIR), consideration of the NFDI (= Nationale Forschungsdateninfrastruktur)<\/li>\n<\/ul>\n
Sessions <\/strong><\/h2>\n
(Session A) fand parallel zu Session B) und Session C) parallel zu Session D) statt, CM besuchte Session B) und D) )<\/p>\n
A) Data workflows & data pipelines<\/strong><\/p>\n
Using the research data life cycle as a model, we will demonstrate how researchers can use GeRDI services to support their individual data handling strategies.<\/p>\n
We would like to understand if this workflows and APIs can be formulated in a generic way covering a wider range of research disciplines or \u2013 alternatively \u2013 if \"data pipelines\" should model discipline-specific data handling strategies. By thinking together with you about specific use cases we will create design sketches for possible new GeRDI functions.<\/p>\n
B) Extending GeRDI Metadata Schema with disciplinary metadata elements<\/strong><\/p>\n
This session will address disciplinary metadata elements. Participants will discover the current state of the GeRDI Metadata Schema and how it is used in different GeRDI services. In an exemplary mapping demonstration the participants will be exposed to the process of extending the metadata schema. In a discussion we will try to identify high-priority metadata elements from participating communities. Other discussion topics include the usage of controlled vocabularies and the re-use of metadata elements across communities.<\/p>\n
C) How to design: Submit service<\/strong><\/p>\n
During this session we will work together on design the new GeRDI service. We will go through discussing the existing use case, extend and value them. Then will bring our idea to paper discuss them and find the possible solutions for the future implementation. We eager to find out, how such service could be supported through GeRDI, which use cases, are most important and what challenges there are. To get the result we will dive into the different techniques of design thinking method.<\/p>\n
D) Improving data quality in research data infrastructures<\/strong><\/p>\n
This session will address the term data quality and its relevance in research. Participants will explore criteria describing and measuring data quality that datasets can be effectively compared and ranked. Learn common criteria and how the scientific domains differ in their quality requirements for data. In a discussion, we will analyze the incentives to motivate data creators as well as the interventions needed to increase the quality of datasets. In the end, the elaborated measures will be assessed and recommendations for research data infrastructures will be made.<\/p>\n
Zu Session B): high-priority metadata<\/strong><\/p>\n
$\"\"$ <\/p>\n
$\"\"$ <\/p>\n
$\"\"$ <\/p>\n
\n
aufgeteilt auf die verschiedenen Disziplinen (Humanities, Life sciences, Natural Sciences) sollte jede Community bezogen auf ihre einzelnen use cases die jeweiligen high-priority Metadaten nennen (f\u00fcr VA<\/span>: concepts, morpho-lexical types, single attestations, municipalities)<\/li>\n
es wurde geschaut, \u00fcber welche Metadaten die Daten der einzelnen Communities am besten miteinander verkn\u00fcpft werden k\u00f6nnen<\/li>\n
wahrscheinlichster Verkn\u00fcpfungspunkt der Metadaten der einzelnen Communities ist die Georeferenz der Metadaten, da dieses Metadatum \u00fcberall vorkommt<\/li>\n<\/ul>\n
Zu Session D): data quality (of metadata)<\/strong><\/p>\n
Frage: Woran kann Datenqualit\u00e4t festgemacht\/gemessen werden?<\/p>\n
Folgende Punkte wurden erarbeitet:<\/p>\n
\n
availability of metadata<\/li>\n
metadata completeness<\/li>\n
granularity<\/li>\n
trust in the source of data<\/li>\n
definition of data quality depends on research question<\/li>\n
description in natural languages<\/li>\n
responsibility within community<\/li>\n
community building<\/li>\n<\/ul>\n
Fazit:<\/p>\n
\n
fast unm\u00f6glich, generisch zu definieren, woran Datenqualit\u00e4t festgemacht werden kann (au\u00dfer den FAIR-Kriterien)<\/li>\n
am Community workshop kam man zu dem Schluss, dass man das offen l\u00e4sst und stattdessen der Community die M\u00f6glichkeit gibt, fehlende Metadaten nachzutragen<\/li>\n
laut Prof. Klaus Tochtermann sollen zudem die Empfehlungen f\u00fcr Datenqualit\u00e4t des RFII (= Rat f\u00fcr Forschungsdateninfrastruktur, NFDI ist daraus entstanden) befolgt werden<\/li>\n<\/ul>\n
<\/p>
VerbaAlpina<\/div>
Datenbank<\/div>
vergleiche<\/div>
siehe<\/div>
structured query language<\/div>
Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div>
Universit\u00e4tsbibliothek<\/div>
IT-Gruppe Geisteswissenschaften (LMU<\/span> Center for Digital Humanities)
Ludwig-Maximilians-Universit\u00e4t M\u00fcnchen<\/div><\/div>
Romanisches Etymologisches W\u00f6rterbuch<\/div>
Gemeinsame Normdatei<\/a><\/div>
Identifikationsnummer<\/div>
Digital Object Identifier<\/div>","protected":false},"excerpt":{"rendered":"
Gerdi-Fragebogen zu VerbAlpina (Februar 2018) Abl\u00e4ufe: Daten-\/Serverinfrastruktur: Die Daten von VerbaAlpina werden modularisiert und versioniert verwaltet. Die sprachlichen Kerndaten liegen auf einem geclusterten MySQL-Server (= Modul VA_DB). Darauf aufsetzend arbeitet eine mit WordPress realisierte GeRDI-VA-DataSources-270618-1638-16Webschnittstelle (VA_WEB), die u.a. eine Seite zur interaktiven kartographischen Visualisierung der in VA_DB gehaltenen Daten erlaubt. Datenmanagementpl\u00e4ne: ja, aber nicht in […]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"btdb_keywords":[],"coauthors":[],"class_list":["post-5746","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/5746","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5746"}],"version-history":[{"count":55,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/5746\/revisions"}],"predecessor-version":[{"id":9692,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/5746\/revisions\/9692"}],"wp:attachment":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5746"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5746"},{"taxonomy":"btdb_keywords","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fbtdb_keywords&post=5746"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcoauthors&post=5746"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}