Methodologie

Sortierung

Alle Einträge anzeigen

A   B   C   D   E   F   G   H  I   J  K   L   M   N   O   P   Q   R   S   T   U   V   W   X  Y  Z  


Normdaten (Zitieren)

Der Begriff NORMDATEN hat seinen Ursprung im Bibliothekswesen. Bei der Katalogisierung von Publikationen ist es z.B. unverzichtbar, Autoren eindeutig identifizieren zu können, um Werke unabhängig von differierenden Schreibweisen oder Namensänderungen jeweils eindeutig dem jeweiligen Autor zuordnen zu können. Die gleiche Notwendigkeit ergibt sich auch bei der Verschlagwortung der erfassten Literatur, etwa um geographische Begriffe, die Gegenstand von verschiedenen Abhandlungen sind, ebenfalls eindeutig identifizieren und diese dann auch aufeinander beziehen zu können. Diese Notwendigkeiten führten zur Anlage entsprechender onomasiologischer Listen, die zunächst individuell von den einzelnen Bibliotheken geführt wurden.

Die Möglichkeiten der technischen Vernetzung von Datenbeständen, deren Anfänge in die 1970er Jahre zurückreichen, erforderten alsbald eine Angleichung der bis dato von den einzelnen Bibliotheken individuell geführten Verzeichnisse. Aus diesem Grund haben die Bibliotheken spätestens in den 1980er Jahren – erste Planungen erfolgten bereits Ende der 1970er Jahre – damit begonnen, die individuellen Verzeichnisse einander anzugleichen und gemeinsame Personen- und Schlagwortverzeichnisse anzulegen, um bibliotheksübergreifende Konsistenz zu erreichen. Im Lauf der Zeit entstanden zunächst thematisch getrennte Verzeichnisse: Ein Personenverzeichnis (Personennamendatei, PND), ein Verzeichnis von Körperschaften (Körperschaftsdatei, GKD) sowie ein Schlagwortverzeichnis (Schlagwortnormdatei, SWD). Schließlich setzte sich die Erkenntnis durch, dass die entstandene thematische Trennung nicht zweckmäßig ist, zumal Personen und Körperschaften nicht nur als Autoren bzw. Herausgeber figurieren können, sondern ihrerseits auch Gegenstand von Publikationen sein können, weswegen sie auch bei Verschlagwortungen auf Basis der Schlagwortnormdatei entsprechend berücksichtigt werden müssen. Aus diesem Grund wurden die drei getrennten Normdateien von 2009 bis 2012 in einer gemeinsamen Unternehmung der Deutschen Nationalbibliothek und der deutschsprachigen Bibliotheksverbünde zur sog. Gemeinsamen Normdatei (GND) vereinigt. Diese steht nunmehr seit 2012, zwischenzeitlich in einer ganzen Reihe von Formaten (MARC 21 Authority, MARC21-xml und RDFxml), der Öffentlichkeit zur Verfügung und wird zunehmend auch für Verschlagwortungen außerhalb des Bibliothekswesens genutzt. So werden Normdaten u.a. in den an der ITG beheimateten DH-Projekten BMLO (Bayerisches Musiker-Lexikon online) und Kaiserhof registriert und zur zweifelsfreien Identifizierung von Personen verwendet.

Unter der Adresse http://ognd.bsz-bw.de/ (ein Dienst des Bibliotheksservice-Zentrums Baden-Württemberg) steht ein komfortables Suchinstrument zur Recherche in der GND zur Verfügung. Mit der GND vergleichbare Normdateien werden von Institutionen, vorrangig Bibliotheken, weltweit geführt. Seit 2003 existiert das von der DNB und Library of Congress gemeinsam ins Leben gerufene Projekt VIAF (Virtual International Authority File), das sich zum Ziel gesetzt hat, diese Datenbestände in einem System zu vereinen und dort abrufbar zu machen.

Auch wenn das System der Normdaten rein theoretisch die eindeutige Identifizierung von Personen und Konzepten erlaubt, hängt die konkrete Nutzbarkeit von der technischen Implementierung in den elektronischen Bibliothekskatalogen ab. In den Katalogen der DNB und der Bayerischen Staatsbibliothek (BSB) liefert die Suche nach "Homère" auch Treffer, deren bibliographische Erfassung nur die deutsche Schreibweise "Homer" enthält. Andererseits listet im Online-Katalog der BSB ein Klick auf einen mit einem Link unterlegten Autorennamen derzeit (Nov. 2018) noch Titel, die nicht nur von dem entsprechenden Individuum, sondern auch von gleichnamigen Autoren stammen.

Auch wenn der Ursprung des Konzepts der Normdaten offenbar im Umfeld des Bibliothekswesens liegt, hat sich die Verwendung von Normdaten mittlerweile auch in anderen Bereichen etabliert. Als Beispiel können die Projekte Geonames (Entität Geographica), Pleiades (Entität antike Geographica) oder auch Glottolog (Entität Weltsprachen) genannt werden.

Normdaten besitzen große Bedeutung für die u.a. von der FAIR-Initiative geforderte Interoperabilität. Durch die Definition eines Normdatums und die Vergabe eines (alpha)numerischen Identifikators besteht, neben der Einbindung in die inhaltliche Erschließung der Bibliothekskataloge, auch die Möglichkeit der logischen und technischen Verknüpfung von kongruenten Daten in von einander getrennten Datenbeständen.

Aus der Perspektive von VerbaAlpina wäre die Etablierung der Normdatenkategorien "morpholexikalischer Typ" (⇒ Typisierung) und "Konzept" methodologisch konsequent und deshalb sehr wünschenswert. Dies würde erlauben, morpholexikalische Typen und Konzepte mit Identifikatoren zu versehen. Auf diese Weise könnten lexikalische Daten weltweit und, im Falle der Konzepte, unabhängig von der Einzelsprache eindeutig aufeinander bezogen werden. Vereinzelt lassen sich Ansätze in diese Richtung beobachten. So werden beispielsweise in den strukturierten Datenbeständen des Wikidata-Projekts sog. Q-IDs vergeben, die außersprachliche Konzepte eindeutig identifizieren und auf diese Weise eine gemeinsame und identische Referenz für die verschiedenen Artikel in den unterschiedlichen Sprachversionen der Wikipedia zu ein und demselben Thema liefern. Das Konzept ALMHÜTTE ist in Wikidata z.B. mit der Q-ID Q2649726 eindeutig identifiziert. Der entsprechende Eintrag in Wikidata verweist auf zugeordnete Wikipedia-Artikel in derzeit (Oktober 2018) insgesamt sieben verschiedenen Sprachen. Von den aktuell (Oktober 2018) insgesamt 2629 von VerbaAlpina erfassten Konzepten konnten bislang genau 400 eine QID zugeordnet werden. Die Q-IDs werden, soweit vorhanden, im Datenbestand von VerbaAlpina registriert. Eine analoge, systematische Identifizierung morpholexikalischer Typen besteht im Rahmen des Wikipedia- bzw. Wikidata-Projekts bislang anscheinend noch nicht. Erst ansatzweise wurden dort bislang L-IDs für sprachliche Bezeichnungen vergeben; ob damit jedoch präzis definierte Typen gemeint sind, wird nicht klar.

Orientiert am Modell der Normdaten-IDs vergibt VerbaAlpina für die Datenkategorien (Entitäten) "Konzept", "morpholexikalischer Typ" (s. Typisierung) und "Gemeinde" eigene Identifikatoren, die per einfachem Mapping auf andere bereits etablierte Normdatensysteme wie etwa die Q-IDs des Wikidata-Projekts bezogen werden können. VerbaAlpina ist überdies bestrebt, speziell die Datenkategorie "morpholexikalischer Typ" in die Systematik der Gemeinsamen Normdatei (GND) einzubringen. Die entsprechende Perspektive besteht, zumal die GND inhaltlich und strukturell erweitert und an die Bedürfnisse der Wissenschaft sowie allgemein kulturtragenden Einrichtungen und Personen angepasst werden soll. Einem entsprechenden Austausch soll die für Dezember 2018 angesetzte Konferenz GNDCon 2018 dienen. Die Interessen von VerbaAlpina werden dort von Mitgliedern der UB München sowie der ITG vertreten werden.

Die GND unterscheidet derzeit die folgenden Entitäten: Körperschaft (Sigle: b), Konferenz (f), Geographikum (g), Person (nicht individualisiert) (n), Person (individualisiert) (p), Sachbegriff (s) sowie Werk (u) (http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/entitaetenSatztypen.pdf?__blob=publicationFile). Einem DNB-Dokument aus der Kategorie "Arbeitshilfen zur gemeinsamen Normdatei (GND)" ist ferner zu entnehmen, dass für die Kategorie "Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen" der spezifische Entitätencode "slz" als Unterkategorie der Entität "Sachbegriff" vorgesehen ist. Es liegt nahe, die Normdaten von VerbaAlpina mit dieser Kategorie zu verknüpfen.

Literatur:
Capellaro 2003

(auct. Stephan Lücke)

Tags: Informationstechnologie



Notation (Zitieren)

In den Textbeiträgen werden die folgenden, weitgehend üblichen Notationsprinzipien angewandt: objektsprachliche Formen (Belegbeispiele) werden kursiviert und sprachliche Bedeutungsangaben werden durch einfache Anführungszeichen markiert, z. B. ita. formaggio 'Käse'. Außersprachliche Kategorien (Konzepte) werden durch Majuskeln repräsentiert. Der Unterschied zwischen sprachlicher Bedeutung und Konzept ist vor allem dann wichtig, wenn es in einzelnen Sprachen/Dialekten kein Wort für bestimmte Konzepte gibt, wie im Fall von KÄSE AUS DER FLÜSSIGKEIT NACH DER ZWEITEN SCHEIDUNG DER FESTSTOFFE. Dafür sagt man ita. ricotta, fra. sérac, alemannisch Ziger usw.; ein hochdeutsches Wort fehlt jedoch.

(auct. Thomas Krefeld)

Tags: Linguistik Webseite