Documentazione relativa al database


Z_geo

Diese Tabelle enthält zusätzliche Daten, die auf der interaktiven Karte mit den Daten aus der Tabelle Z_ling kombiniert werden können. Diese Daten kommen hauptsächlich aus der Tabelle Orte.

Felderdefinition


Z_ling

Diese Tabelle enthält alle sprachlichen Projektdaten in gebündelter Form. Sie wird aus den entsprechenden Daten-Tabellen automatisch generiert. Dadurch enthält sie nicht normalisierte Daten; hauptsächlich bedeutet das, dass es mehrere Zeilen für den selben Sprachbeleg gibt, wenn er beispielsweise verschiedene Typisierungen hat oder ihm mehrere Konzepte zugeordnet sind.

Felderdefinition:
Id_Instance
Varchar
Eindeutige Nummer für diesen Beleg. Wie oben erwähnt können für einen Beleg mehrere Zeilen vorkommen, d.h. es kann auch mehrere Zeilen mit der selben ID geben.
Instance
Varchar
Der Beleg an sich. Prinzipiell gibt es drei Möglichkeiten, wie der Beleg kodiert sein kann:
  • Falls eine IPA-Darstellung existiert, wird diese genutzt.
  • Falls nicht wird die Original-Darstellung des Belegs, wie der Beleg in der ursprünglichen Quelle dargestellt wurde, genutzt.
  • Falls diese ebenfalls nicht vorhanden ist, wird der Beleg im Betacode dargestellt. Dies ist nur ein Übergangszustand für neuere Belege, für welche noch keine der beiden obigen Formen erstellt werden konnte.

Falls das Ausgangsmaterial ausschließlich bereits typisierte Belege liefert, ist dieses Feld leer.

Für Mehrwortlexien gibt es sowohl einen Eintrag für die gesamte Bezeichung, als auch für die Einzelwörter. Letztere werden durch Angabe der vollständigen Bezeichnung (getrennt durch ###) ergänzt, z.B. kaʒˈiːnɑ###kaʒˈiːnɑ dɑl fˈøːk
Instance_Encoding
Enum
Gibt an wie der Beleg codiert ist (vgl. Transkription:
  1. IPA von Quelle geliefert
  2. IPA von VA erzeugt
  3. Originaltranskription der Quelle übernommen (domain specific transcription)
  4. Betacode (temporär)
Instance_Original
Varchar
Gibt (falls vorhanden) die Originaltranskription der Quelle an
Id_Informant
Int
Eindeutige Id für den jeweiligen Informanten


Die Felder "Id_Stimulus" und "Id_Informant" zusammen bestimmen den Inhalt des Felds "Instance_Source".
Instance_Source
Varchar
Quelleninformation des Belegs im folgenden Format: <Quelle>#<Stimulus- oder Kartennummer>#<Nummer innerhalb der Karte>#<Informantnummer#<Erhebungsort>


z.B. VALTS#IV_101#1#A28#Füssen
Id_Concept
Int
Eindeutige Nummer für das jeweilige Konzept
Id_Stimulus
Int
Eindeutige Id für den Stimulus, der für die Erhebung dieses Beleges verwendet wurde. Der Stimulus entspricht im Prinzip der Frage, die dem jeweiligen Informanten gestellt wurde.


Die Felder "Id_Stimulus" und "Id_Informant" zusammen bestimmen den Inhalt des Felds "Instance_Source".
QID
Int
Gibt die Id in der Wikidata-Datenbank (https://www.wikidata.org/) an, die diesem Konzept entspricht.
Geo_Data
Varchar
Georeferenzierung des Belegs im WKT-Format
Alpine_Convention
Tinyint
Gibt an, ob sich der Beleg in der Alpenkonvention befindet (1) oder nicht (0)
Community_Name
Varchar
Name der Gemeinde. Im Gegensatz zum Feld "Instance_Source" wird hier immer der offizielle Gemeindename angegeben. Der Wert dort entspricht oft dem Gemeindenamen, ist aber quellenabhängig und kann unter Umständen auch einen kleineren Ort innerhalb einer Gemeinde angeben.

Falls es für eine Gemeinde weitere Namen in anderen Sprachen gibt, werden diese getrennt durch ### angegeben, z.B. Bolzano###D:Bozen. Hierbei sind die Sprachen D (Deutsch), I (Italienisch), F (Französisch), S (Slowenisch), R (Rätoromanisch) oder L (Ladinisch) möglich.
Community_Center
Varchar
Referenzpunkt der Gemeinde im WKT-Format. Dies entspricht in den meisten Fällen dem geometrischen Mittelpunkt der Gemeinde. Besonders bei Gemeinden aus mehreren Teilstücken muss das aber nicht der Fall sein.
Year_Publication
Varchar
Jahr, in dem der Beleg publiziert wurde. Mögliche Formate:
  • <Jahreszahl>
  • <Jahreszahl>-<Jahreszahl>
  • <Jahreszahl>, <Jahreszahl> ...
  • <Jahreszahl>ff.
Year_Survey
Varchar
Jahr, in dem der Beleg erhoben wurde. (Dieses Feld ist aktuell nur ein Platzhalter und enthält keine Werte)
Informant_Lang
Enum
Sprachfamilie des Informanten (falls bekannt). Kann die Werte "rom", "ger" oder "sla" enthalten
Type_Kind
Char(1)
Gibt an ob der Wert im Feld "Type" ein morpho-lexikalischer (L) oder phonetischer (P) Typ ist
Id_Type
Int
Eindeutige Nummer für den jeweiligen Typ (Die Nummer ist allerdings nur innerhalb einer "Typgattung" eindeutig, es können durchaus morpho-lexikalische und phonetische Typen mit der selben Nummer vorkommen)
Type
Varchar
Typ des Belegs
Type_Lang
Enum
Sprachfamilie des Typs. Kann die Werte "rom", "ger" oder "sla" enthalten
Type_Reference
Varchar
Lemmata aus Referenzwörterbüchern, die dem jeweiligen Typ entsprechen. Die Einträge haben das Format:
<Wörterbuch>|<Stichwort>|<bibliographischer Verweis (z.B. Seitenzahl)>|<Link>


z.B. Idiotikon|Teien|12, 31|https://digital.idiotikon.ch/idtkn/id12.htm#!page/120031/mode/1up
Source_Typing
Varchar
Gibt an, woher die Typisisierung stammt. Enthält in den meisten Fällen "VA" oder das Kürzel eines Sprachatlases.
POS
Enum
Wortart des Typs. Kann folgende Werte enthalten: "v", "art", "sub", "pron", "adj", "PPP", "PPA", "adv", "num", "praep", "konj", "mod", "int"
Affix
Varchar
Affix des Typs
Gender
Enum
Genus des Typs. Kann folgende Werte enthalten: "m", "f", "n"
Id_Base_Type
Int
Eindeutige Nummer für den Basistyp
Base_Type
Varchar
Basistyp des Belegs
Base_Type_Lang
Char(3)
Sprache des Basistyps. Größenteils in ISO 639-3 Codierung. Eine Liste mit allen Sprachabkürzungen befindet sich im Methodologie-Eintrag Abkürzungen.
Base_Type_Unsure
Boolean
Wird auf 1 gesetzt, wenn die Zuordnung des Basistyps unsicher ist
Base_Type_Reference
Varchar
Lemmata aus etymoglogischen Referenzwörterbüchern, die dem jeweiligen Basistyp entsprechen. Die Einträge haben das Format:
<Wörterbuch>|<Stichwort>|<bibliographischer Verweis (z.B. Seitenzahl)>|<Link>


z.B. FEW|abbĭbĕrare|24, 23|https://apps.atilf.fr/lecteurFEW/lire/volume/240/page/23
Id_Etymon
Number
Eindeutige Nummer für das Etymon
Etymon
Varchar
Etymon des Belegs
Etymon_Lang
Char(3)
Sprache es Etymons in ISO 639-3 Codierung (siehe http://www-01.sil.org/iso639-3/codes.asp?order=639_3)
Remarks
Varchar
Bemerkungen. Wird aktuell nicht genutzt
Cluster_Id
Number
Eindeutige Id für die Georeferenz dieses Informanten. Wird zur Optimierung von Anfragen der interaktiven Karte verwendet
External_Id
Varchar
Gibt die Id des Belegs in der jeweiligen Ursprungstabelle an. S(ingle) steht für Tokens, G(roup) für Tokengruppen.