Tabelle aeusserungen
Beschreibung
Diese Tabelle enthält unbearbeitete Sprachbelege, die in die VerbaAlpina-Datenbank eingefügt werden. Die hauptsächlichen Quellen sind dabei das Transkriptionstool, das Crowdsourcing-Tool und aus den Partnerdatenbanken importierte Belege (vgl. Kooperation).
Die Belege werden im Zuge der Tokenisierung verarbeitet und in die Tabellen Tokens und Tokengruppen übertragen, die dann als Grundlage für die Publikation dienen.
Diese Tabelle enthält unbearbeitete Sprachbelege, die in die VerbaAlpina-Datenbank eingefügt werden. Die hauptsächlichen Quellen sind dabei das Transkriptionstool, das Crowdsourcing-Tool und aus den Partnerdatenbanken importierte Belege (vgl. Kooperation).
Die Belege werden im Zuge der Tokenisierung verarbeitet und in die Tabellen Tokens und Tokengruppen übertragen, die dann als Grundlage für die Publikation dienen.
Spalten
Der Name von Spalten, die Teil des Primärschlüssels sind wird fett dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
id_aeusserung | int(10) unsigned | beliebig | Eindeutige ID. | ||||||||||
id_stimulus | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle stimuli verweist. | ||||||||||
id_informant | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle informanten verweist. | ||||||||||
aeusserung | varchar(500) | beliebig | Die eigentliche Äußerung. Die Kodierung ist abhängig von der jeweiligen Quelle, die über den Stimulus bzw. den Informanten festgelegt wird. Diese Spalte kann außer einer transkribierten Äußerung auch einen speziellen Wert in spitzen Klammern enthalten. Die folgende Tabelle erklärt diese Sonderfälle:
| ||||||||||
bemerkung | varchar(5000) | beliebig | Freitextfeld für Bemerkungen. Bei Belegen, die über das Crowdsourcing-Tool eingegeben werden, wird in diesem Feld auch die originale Nutzereingabe angegeben, falls die Äußerung strukturell nicht den Anforderungen entspricht. Dies ist hauptsächlich bei falschen Trennzeichen oder abkürzenden Schreibweisen der Fall (siehe die folgenden Beispiele).
| ||||||||||
erfasst_von | varchar(50) | beliebig | Nutzername der Person, die diese Äußerung eingegeben/importiert hat. | ||||||||||
erfasst_am | timestamp | beliebig | Zeitpunkt der Erstellung. | ||||||||||
version | tinyint(4) unsigned | 1 | Aufsteigende Nummer um redundante Mehrfachtranskriptionen zum Auffinden von Fehlern zu ermöglichen. Dies wird aktuell nicht verwendet; das Feld enthält somit immer den Wert 1. | ||||||||||
klassifizierung | enum | 'B','P','M' | Jede Äußerung ist entweder ein Einzelbeleg (B), d.h. eine direkte phonetische Transkription der Sprecheräußerung, oder bereits von der Quelle vortypisiert. Je nachdem welche Eigenschaften der verschiedenen Äußerungen eines Stimulus noch unterscheidbar ist, werden solche Belege als phonetischer Typ (P) oder morpho-lexikalischer Typ (M) markiert. Die Einteilung ist in vielen Fällen rein quellenabhängig, muss aber bei gewissen Quellen nach Einzelfall bei der Transkription entschieden werden. | ||||||||||
tokenisiert | tinyint(1) | beliebig | Gibt an, ob diese Äußerung bereits tokenisiert ist. Dieses Flag ist nicht zwingend notwendig, da sein Wert aus der Tabelle Tokens abgeleitet werden kann, es dient lediglich zur Optimierung. | ||||||||||
gesperrt | tinyint(1) | beliebig | Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Solange eine Äußerung nicht gesperrt ist, kann der jeweilige Nutzer sie noch im Tool abändern. Die Sperrung wird als Vorstufe zur Tokenisierung verwendet und erlaubt keine weiteren Änderungen. | ||||||||||
portalsprache | varchar(10) | 'deu', 'ita', 'fra', 'slv' | Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt die Sprache an, die jeweilige Nutzer im Tool gewählt hat. Diese entspricht nicht der Sprache der Äußerung, sondern nur der der Oberfläche (Bedienelemente, Hinweise, etc.) | ||||||||||
id_dialekt | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle dialects verweist. Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt den im Tool ausgewählten Dialekt an. Da diese Möglichkeit in älteren Versionen des Tools noch nicht gegeben war, gibt es auch Crowdsourcing-Äußerungen, bei denen dieses Feld leer ist. | ||||||||||
ignoriert | tinyint(1) | beliebig | Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Dieses Flag dient der Markierung von Äußerungen, die offensichtlich absichtliche Falschangaben sind oder so formatiert sind, dass sie technisch nicht verarbeitet werden können. Diese werden bei der Tokensierung (aktuell) nicht berücksichtigt. | ||||||||||
geaendert_am | timestamp | beliebig | Zeitpunkt der letzten Änderung | ||||||||||
verifiziert_am | timestamp | beliebig | Temporäres Feld zur Verfikation der Tokensierung von älteren Belegen. Gibt den Zeitpunkt der Verifikation an. | ||||||||||
nicht_verifizieren | tinyint(1) | beliebig | Temporäres Feld zur Verfikation der Tokensierung von älteren Belegen. Gibt an, dass diese Äußerung übersprungen werden soll. |
Ausschnitt
(Eine oder mehrere Spalten dieser Tabelle werden nicht dargestellt.)
Id_Aeusserung | Id_Stimulus | Id_Informant | Aeusserung | Bemerkung | Erfasst_Am | Version | Klassifizierung | Tokenisiert | Gesperrt | Portalsprache | Id_dialekt | Ignoriert | Geaendert_Am | Verifiziert_Am | Nicht_Verifizieren |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
661696 | 120128 | 3349 | mαłẹ́m | 2020-09-25 16:26:15 | 1 | B | 1 | 0 | 0 | 2020-09-25 17:02:10 | 0 | ||||
157653 | 5158 | 1885 | tʀupˈɛw | 2017-12-21 11:59:45 | 1 | B | 1 | 0 | 0 | 2018-07-04 18:36:12 | 0 | ||||
511940 | 1128 | 156 | la/rd1o( | 2020-07-17 13:22:39 | 1 | B | 1 | 0 | 0 | 2021-03-08 12:00:36 | 0 | ||||
342568 | 657 | 12 | il gla/w0n10{n}t | 2019-11-21 11:19:16 | 1 | B | 1 | 0 | 0 | 2020-04-16 11:24:35 | 0 | ||||
576082 | 118444 | 3283 | ć̆αntā́dα | 2020-09-25 16:01:12 | 1 | B | 1 | 0 | 0 | 2020-09-25 16:55:09 | 0 | ||||
84461 | 1244 | 106 | a1l ve?-/la kaz^a-/da | 2016-06-25 12:37:16 | 1 | B | 1 | 0 | 0 | 2018-07-04 18:36:12 | 0 | ||||
695542 | 456 | 3 | l2 a/ tuna-/w | 2021-03-09 11:07:06 | 1 | B | 1 | 1 | 0 | 2021-09-15 14:17:18 | 0 | ||||
538042 | 117794 | 3283 | bilǫ́k | 2020-09-25 15:38:22 | 1 | B | 1 | 0 | 0 | 2020-09-25 16:50:20 | 0 | ||||
220790 | 106058 | 4707 | Paidnschwarm, Painschwarm | 2019-03-21 10:52:56 | 1 | P | 0 | 0 | 0 | 2019-03-21 10:52:56 | 0 | ||||
383344 | 92413 | 1525 | c3a$!\rpe/~ <f> | 2020-03-07 11:23:12 | 1 | B | 1 | 0 | 0 | 2020-03-25 16:02:44 | 0 |
(Eine oder mehrere Spalten dieser Tabelle werden nicht dargestellt.)