				<script type="text/javascript">
					jQuery(document).ready(function() {
						addBiblioQTips(jQuery(".entry-content"));
					});
				</script> 
							<script type="text/javascript">
					jQuery(document).ready(function() {
						addBiblioQTips(jQuery(".entry-content"));
					});
				</script> 
			{"id":21044,"date":"2022-06-14T16:16:39","date_gmt":"2022-06-14T14:16:39","guid":{"rendered":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=21044"},"modified":"2022-09-23T22:22:07","modified_gmt":"2022-09-23T20:22:07","slug":"stand-va_3","status":"publish","type":"post","link":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/?p=21044","title":{"rendered":"Stand VerbaAlpina"},"content":{"rendered":"<p>Projektphase f\u00fcr Zeitraum 1, 2, 3<br>\nKonzeptdom\u00e4ne 1, 2, 3<\/p>\n<p>Dieser Beitrag bietet einen \u00dcberblick \u00fcber die Daten von VerbaAlpina, wobei der Schwerpunkt auf der dritten Phase liegt.<\/p>\n<h1>Crowd-Belege gesamt<\/h1>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT COUNT(*) AS Crowd_Belege_gesamt\\nFROM tokens t\\nJOIN informanten i USING (id_informant)\\nLEFT JOIN VTBL_Token_Konzept USING (id_token)\\nWHERE i.Erhebung = &#039;CROWD&#039;&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Crowd-Belege noch zu typisieren, gesamt<\/h1>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT count(*) AS Anzahl_nicht_Typ\\nFROM tokens t\\nJOIN informanten i USING (Id_Informant)\\nLEFT JOIN vtbl_token_morph_typ vtmt USING (id_token)\\nWHERE Erhebung = &#039;Crowd&#039; AND Id_morph_Typ IS NULL\\n&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>&nbsp;<\/p>\n<p>SELECT<br>\n(SELECT count(*)<br>\nFROM tokens t<br>\nJOIN informanten i USING (Id_Informant)<br>\nLEFT JOIN vtbl_token_morph_typ vtmt USING (id_token)<br>\nWHERE Erhebung = 'Crowd' AND Id_morph_Typ IS NULL)<br>\n+<br>\n(SELECT count(*)<br>\nFROM tokengruppen tg<br>\nJOIN tokens USING (id_tokengruppe)<br>\nJOIN informanten i USING (Id_Informant)<br>\nLEFT JOIN vtbl_tokengruppe_morph_typ vtmt USING (id_tokengruppe)<br>\nWHERE Erhebung = 'Crowd' AND Ebene_1 = 1 AND Ebene_2 = 1 AND Ebene_3 = 1 AND Id_morph_Typ IS NULL) AS Anzahl_nicht_Typ<\/p>\n<h1>Crowd-Belege zu Phase 3, gesamt<\/h1>\n<p>1624 sono i token per il dominio vita moderna,<br>\nnumero dei token per la terza fase: vedere con timestamp<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT COUNT(*) AS Crowd_Belege_VA3\\nFROM vtbl_token_konzept tk\\nJOIN tokens t\\nUSING(id_token)\\nJOIN Informanten i\\nUSING(id_informant)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE k.va_phase LIKE &#039;3&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Stand Typisierung Crowd-Belege, gesamt<\/h1>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT COUNT(token) AS Anzahl_nicht_Typ\\nFROM tokens t\\nJOIN informanten i\\nUSING (Id_Informant)\\nJOIN vtbl_token_Konzept tk\\nUsing(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN dialects d ON t.Id_Dialekt = d.Id_dialect\\nWHERE id_token NOT IN\\n(SELECT id_token\\nFROM vtbl_token_morph_typ AS tmp)\\nAND i.Erhebung LIKE &#039;Crowd&#039;\\nAND k.va_phase LIKE &#039;3&#039;\\nORDER BY anzahl_nicht_Typ DESC&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>TOT: 63% typisiert<\/p>\n<h1>Stand Typisierung Crowd-Belege, nach Dialekt<\/h1>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT d.Name, COUNT(token) AS Anzahl_nicht_Typ\\nFROM tokens t\\nJOIN informanten i\\nUSING (Id_Informant)\\nJOIN dialects d ON t.Id_Dialekt = d.Id_dialect\\nWHERE id_token NOT IN\\n(SELECT id_token\\nFROM vtbl_token_morph_typ AS tmp)\\nAND i.Erhebung LIKE &#039;Crowd&#039;\\nGROUP BY d.Id_dialect\\nORDER BY anzahl_nicht_Typ DESC&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Variation<\/h1>\n<p>Morpho-lexikalische Typen zum Konzept TOURIST<br>\n<iframe loading=\"lazy\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=4379\" width=\"800\" height=\"400\">Morpho-lexikalische Typen zum Konzept REISE<br>\n<iframe loading=\"lazy\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de?page_id=133&amp;db=xxx&amp;tk=4385\" width=\"800\" height=\"400\"><\/iframe><\/iframe><\/p>\n<p>Hypothese: wenige(r) Typen, die in einem kleineren Areal belegt sind? (Mehr Vermischung und Konkurrenz der Typen?)<\/p>\n<h2>Durchschnitt der Morph_Typen pro Konzept nach <span class=\"vaabr\" data-vaabr=\"VA\">VA<\/span>_Phase<\/h2>\n<p>Durchschnitt der unterschiedlichen morpho-lexikalischen Typen pro Konzept, pro va_phase<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT AVG(Durchschnitt_Morph_Typen_va_1)\\nFROM\\n(SELECT k.Id_Konzept, k.Name_D, k.Beschreibung_D, COUNT(DISTINCT Orth) AS Durchschnitt_Morph_Typen_va_1\\nFROM vtbl_token_morph_typ tmt\\nJOIN morph_typen mt\\nUSING(id_morph_Typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE k.va_phase LIKE &#039;1&#039;\\nGROUP BY id_konzept\\nORDER BY Durchschnitt_Morph_Typen_va_1 DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT AVG(Durchschnitt_Morph_Typen_va_2)\\nFROM\\n(SELECT k.Id_Konzept, k.Name_D, k.Beschreibung_D, COUNT(DISTINCT Orth) AS Durchschnitt_Morph_Typen_va_2\\nFROM vtbl_token_morph_typ tmt\\nJOIN morph_typen mt\\nUSING(id_morph_Typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE k.va_phase LIKE &#039;2&#039;\\nGROUP BY id_konzept\\nORDER BY Durchschnitt_Morph_Typen_va_2 DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT AVG(Durchschnitt_Morph_Typen_va_3)\\nFROM\\n(SELECT k.Id_Konzept, k.Name_D, k.Beschreibung_D, COUNT(DISTINCT Orth) AS Durchschnitt_Morph_Typen_va_3\\nFROM vtbl_token_morph_typ tmt\\nJOIN morph_typen mt\\nUSING(id_morph_Typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE k.va_phase LIKE &#039;3&#039;\\nGROUP BY id_konzept\\nORDER BY Durchschnitt_Morph_Typen_va_3 DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Morpho-lexikalische Typen f\u00fcr va_3<\/h1>\n<h2>Romanische morpho-lexikalische Typen = 301<\/h2>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT DISTINCT m.Orth, m.Sprache\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN morph_typen mt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung = &#039;Crowd&#039;\\nAND va_phase LIKE &#039;3&#039;\\nAND m.Sprache = &#039;roa&#039;\\nand m.orth not in\\n(\\nSELECT m.Orth\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung != &#039;Crowd&#039;\\n)\\nLIMIT 10\\n&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h2>Germanische morpho-lexikalische Typen = 82<\/h2>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT DISTINCT m.Orth, m.Sprache\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN morph_typen mt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung = &#039;Crowd&#039;\\nAND va_phase LIKE &#039;3&#039;\\nAND m.Sprache = &#039;gem&#039;\\nand m.orth not in\\n(\\nSELECT m.Orth\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung != &#039;Crowd&#039;\\n)\\nLIMIT 10\\n&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h2>Slovenische morpho-lexikalische Typen<\/h2>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT DISTINCT m.Orth, m.Sprache\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN morph_typen mt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung = &#039;Crowd&#039;\\nAND va_phase LIKE &#039;3&#039;\\nAND m.Sprache = &#039;sla&#039;\\nand m.orth not in\\n(\\nSELECT m.Orth\\nFROM morph_typen m\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE i.Erhebung != &#039;Crowd&#039;\\n)\\n&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Sprachliches<\/h1>\n<p>Situation der Alpendialekte: Verschwund oder Entwicklung?<\/p>\n<p>Beispiel 1:<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT tk.Id_Token, tk.Id_Konzept, k.Name_D, t.token\\nFROM vtbl_token_konzept tk\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE k.va_phase LIKE &#039;3&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;\\nAND k.id_Konzept = 19088&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>Beispiel 2:<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT tk.Id_Token, tk.Id_Konzept, k.Name_D, t.token\\nFROM vtbl_token_konzept tk\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE k.va_phase LIKE &#039;3&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;\\nAND k.id_Konzept = 7928&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Transkriptionsstrategien der Crowder<\/h1>\n<p>Beispiel: Phonen \/kw\/ im Italienischen, Verschriftung der Crowder:<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT mt.ID_morph_Typ, mt.Orth, mt.genus, t.token, COUNT(t.token) AS Anzahl\\nFROM morph_typen mt\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_Typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nJOIN dialects d ON t.Id_Dialekt = d.Id_dialect\\nWHERE mt.Orth RLIKE &#039;q&#039;\\nAND token RLIKE &#039;aq&#039;\\nAND mt.sprache LIKE &#039;roa&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;\\nAND id_morph_Typ = 5092\\nUNION\\nSELECT mt.ID_morph_Typ, mt.Orth, mt.genus, t.token, COUNT(t.token) AS Anzahl\\nFROM morph_typen mt\\nJOIN vtbl_token_morph_typ tmt\\nUSING(id_morph_Typ)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nJOIN dialects d ON t.Id_Dialekt = d.Id_dialect\\nWHERE mt.Orth RLIKE &#039;q&#039;\\nAND token RLIKE &#039;cq&#039;\\nAND mt.sprache LIKE &#039;roa&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;\\nAND id_morph_Typ = 5092&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>Mehr Tokens, die von der Standardverschriftung abweichen (trotz Priming).<br>\nArealdistribution ber\u00fccksichtigen<\/p>\n<h1>Dialekte<\/h1>\n<p>145 Dialekte (Stand 21.06)<br>\n&gt; Verbesserungsbed\u00fcrftig<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;select distinct Nummer as Informant, i.Ortsname, d.name as Dialekt\\nfrom aeusserungen a\\njoin informanten i using (id_informant)\\njoin dialects d on Id_dialekt = Id_dialect\\nGROUP BY dialekt&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>Tokens, die mit dem Stimulus identisch sind<\/h1>\n<p>Phase 1, in %<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT(davon_identisch\\\/AnzTokGesamt)* 100 AS Proz_identische_tok_va_1\\nFROM\\n(SELECT t.Id_Token, i.Id_Informant, t.token, tk.Id_Konzept, k.Name_D, k.Beschreibung_D,\\nCOUNT(Token) AS AnzTokGesamt,\\nSUM(IF(k.Name_D = t.token OR k.Beschreibung_D = t.token OR k.Name_I = t.token OR k.Beschreibung_I = t.token\\nOR k.Name_F = t.token OR k.Beschreibung_F = t.token OR k.Name_S = t.token OR k.Beschreibung_S = t.token, 1, 0)) AS davon_identisch\\nFROM tokens t\\nJOIN informanten i\\nUSING(id_informant)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE i.erhebung LIKE &#039;crowd&#039;\\nAND k.va_phase LIKE &#039;1&#039;\\nORDER BY AnzTokGesamt DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>Phase 2, in %<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT(davon_identisch\\\/AnzTokGesamt)* 100 AS Proz_identische_tok_va_2\\nFROM\\n(SELECT t.Id_Token, i.Id_Informant, t.token, tk.Id_Konzept, k.Name_D, k.Beschreibung_D,\\nCOUNT(Token) AS AnzTokGesamt,\\nSUM(IF(k.Name_D = t.token OR k.Beschreibung_D = t.token OR k.Name_I = t.token OR k.Beschreibung_I = t.token\\nOR k.Name_F = t.token OR k.Beschreibung_F = t.token OR k.Name_S = t.token OR k.Beschreibung_S = t.token, 1, 0)) AS davon_identisch\\nFROM tokens t\\nJOIN informanten i\\nUSING(id_informant)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE i.erhebung LIKE &#039;crowd&#039;\\nAND k.va_phase LIKE &#039;2&#039;\\nORDER BY AnzTokGesamt DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>Phase 3, in %<\/p>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT(davon_identisch\\\/AnzTokGesamt)* 100 AS Proz_identische_tok_va_2\\nFROM\\n(SELECT t.Id_Token, i.Id_Informant, t.token, tk.Id_Konzept, k.Name_D, k.Beschreibung_D,\\nCOUNT(Token) AS AnzTokGesamt,\\nSUM(IF(k.Name_D = t.token OR k.Beschreibung_D = t.token OR k.Name_I = t.token OR k.Beschreibung_I = t.token\\nOR k.Name_F = t.token OR k.Beschreibung_F = t.token OR k.Name_S = t.token OR k.Beschreibung_S = t.token, 1, 0)) AS davon_identisch\\nFROM tokens t\\nJOIN informanten i\\nUSING(id_informant)\\nJOIN vtbl_token_konzept tk\\nUSING(id_token)\\nJOIN konzepte k\\nUSING(id_konzept)\\nWHERE i.erhebung LIKE &#039;crowd&#039;\\nAND k.va_phase LIKE &#039;3&#039;\\nORDER BY AnzTokGesamt DESC) x&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<h1>20 beliebteste Konzepte va_3<\/h1>\n<p><\/p><div class=\"sth_lazy_sql\" data-author=\"13\" data-sql=\"&quot;SELECT tk.Id_Konzept, k.Name_D, t.token, COUNT(t.token) AS Anzahl_Tokens\\nFROM vtbl_token_konzept tk\\nJOIN konzepte k\\nUSING(id_konzept)\\nJOIN tokens t\\nUSING(id_token)\\nJOIN informanten i\\nUSING(id_informant)\\nWHERE k.va_phase LIKE &#039;3&#039;\\nAND i.Erhebung LIKE &#039;CROWD&#039;\\nGROUP BY id_konzept\\nORDER BY Anzahl_Tokens DESC\\nLIMIT 20&quot;\" data-slug=\"va_wordpress\" data-db=\"va_232\" data-width=\"auto\" data-height=\"auto\" data-font-size=\"initial\" data-id=\"\" data-type=\"table\" data-gc-len=\"\" data-format=\"text\" data-log=\"\" style=\"overflow: auto; width: auto; height: auto\"><img style=\"\" src=\"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/wp-includes\/images\/spinner-2x.gif\"><\/div>\n<p>Morpho-lexikalische Typen, die keine Entsprechung in den RefWB finden<br>\nMorph_typen, die nicht mit Lemmata aus Treccani, Nuovo de Mauro, TLIO oder TLFI CNRTL verkn\u00fcpft sind<\/p>\n<p><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>Die Abfrage zu \"Crowd-Belege gesamt\" w\u00fcrde ich umformulieren zu<br>\nSELECT COUNT(*) AS Crowd_Belege_gesamt<br>\nFROM tokens t<br>\nJOIN informanten i USING (id_informant)<br>\nLEFT JOIN VTBL_Token_Konzept USING (id_token)<br>\nWHERE i.Erhebung = 'CROWD';<br>\nDer entscheidende Unterschied ist dabei das \"LEFT\", das daf\u00fcr sorgt, dass auch Tokens ohne Konzeptzuordnung gez\u00e4hlt werden. Das sind aber alle Tokens, was ich nicht unbedingt mit \"Belege\" gleichsetzen w\u00fcrde, weil nicht tokensierte Belege fehlen und aufgespaltene Mehtwortlexien mehrfach gez\u00e4hlt werden. Ich w\u00fcrde vielleicht eher \u00fcber die \u00c4u\u00dferungen gehen und \u00fcber Eintragungen im CS-Tool sprechen. Oder man nimmt diese Abfrage, die Einzelwortbelege und Mehrwortlexien z\u00e4hlt, aber Bestandteile von l\u00e4ngeren \u00c4u\u00dferungen ignoriert:<br>\nSELECT<br>\n(SELECT COUNT(*)<br>\nFROM tokens t<br>\nJOIN informanten i USING (id_informant)<br>\nLEFT JOIN VTBL_Token_Konzept USING (id_token)<br>\nWHERE i.Erhebung = 'CROWD' AND Id_Tokengruppe IS NULL)<br>\n+<br>\n(SELECT COUNT(DISTINCT Id_Tokengruppe, Id_Konzept)<br>\nFROM tokens t<br>\nJOIN informanten i USING (id_informant)<br>\nLEFT JOIN VTBL_Tokengruppe_Konzept USING (id_tokengruppe)<br>\nWHERE i.Erhebung = 'CROWD' AND Id_Tokengruppe IS NOT NULL<br>\n) AS Crowd_Belege_gesamt<br>\nDas w\u00e4re f\u00fcr mich am ehesten die Zahl der (verarbeiteten, d.h. tokenisierten) Belege.<br>\nMir ist dabei zuf\u00e4llig noch ein Problem aufgefallen: Bei allen CS-Belegen, sollte jeder Beleg genau einem Konzept zugeordnet sein. Das ist aber nicht immer so. Bei Token 174879 (Oim) sind z.B. ALM und ALMH\u00dcTTE zugeordnet, obwohl die \u00c4u\u00dferunng sich nur auf ALMH\u00dcTTE bezieht. Genauso auch bei 864838 (Acqua) mit WASSER und TRINKWASSER, obwohl im CS-Tool TRINKWASSER verwendet wurde. Kann es sein, dass da im Typisierungstool aus Versehen zus\u00e4tzliche Konzepte zugeordnet wurden? Die vollst\u00e4ndige Liste kann mit<br>\nSELECT * FROM tokens t<br>\nJOIN informanten i USING (id_informant)<br>\nJOIN vtbl_token_konzept vtk USING (id_token)<br>\nWHERE i.Erhebung LIKE 'CROWD' AND Id_Tokengruppe IS null<br>\nGROUP BY Id_Token<br>\nHAVING count(*) &gt; 1<br>\nerzeugt werden.<br>\nDie Abfrage zu \"Crowd-Belege noch zu typisieren, gesamt\" k\u00f6nnte man vereinfachen zu<br>\nSELECT count(*) AS Anzahl_nicht_Typ<br>\nFROM tokens t<br>\nJOIN informanten i USING (Id_Informant)<br>\nLEFT JOIN vtbl_token_morph_typ vtmt USING (id_token)<br>\nWHERE Erhebung = 'Crowd' AND Id_morph_Typ IS NULL;<br>\nSo oder so w\u00fcrde ich aber den JOIN mit dialects weglassen, weil so die Belege ignoriert werden, die \u00e4lter sind und denen noch kein Dialekt zugeordnet wurde. Auch hier sind das nat\u00fcrlich nur die Tokens. Am sinnvollsten w\u00e4re es wohl auch die nicht typisierten Tokengruppen zu addieren, dann hat man alles, was noch typisiert werden muss:<br>\nSELECT<br>\n(SELECT count(*)<br>\nFROM tokens t<br>\nJOIN informanten i USING (Id_Informant)<br>\nLEFT JOIN vtbl_token_morph_typ vtmt USING (id_token)<br>\nWHERE Erhebung = 'Crowd' AND Id_morph_Typ IS NULL)<br>\n+<br>\n(SELECT count(*)<br>\nFROM tokengruppen tg<br>\nJOIN tokens USING (id_tokengruppe)<br>\nJOIN informanten i USING (Id_Informant)<br>\nLEFT JOIN vtbl_tokengruppe_morph_typ vtmt USING (id_tokengruppe)<br>\nWHERE Erhebung = 'Crowd' AND Ebene_1 = 1 AND Ebene_2 = 1 AND Ebene_3 = 1 AND Id_morph_Typ IS NULL) AS Anzahl_nicht_Typ<br>\nDie beiden n\u00e4chsten Abfragen sind ja dann quasi identisch zu den ersten beiden. Bei der letzten w\u00fcrde ich evtl. auch wieder die Tokens ohne Dialekt mitz\u00e4hlen:<br>\nSELECT IFNULL(d.Name, 'OHNE DIALEKTZUORDNUNG') AS Dialekt, count(*) AS Anzahl_nicht_Typ<br>\nFROM tokens t<br>\nJOIN informanten i USING (id_informant)<br>\nLEFT JOIN dialects d ON t.Id_Dialekt = d.Id_dialect<br>\nLEFT JOIN vtbl_token_morph_typ vtmt USING (id_token)<br>\nWHERE i.Erhebung = 'Crowd' AND Id_morph_Typ IS NULL<br>\nGROUP BY d.Id_dialect<br>\nORDER BY anzahl_nicht_Typ DESC<br>\nAuch hier w\u00e4re es grunds\u00e4tzlich sinnvoller auch die Tokengruppen mitzuz\u00e4hlen, das w\u00e4re dann aber eine eher komplizierte Abfrage. Kann ich aber aufstellen, wenn du willst.<\/p>\n<p>&nbsp;<\/p><div id=\"ABR_VA\" style=\"display: none;\">VerbaAlpina<\/div>","protected":false},"excerpt":{"rendered":"<p>Projektphase f\u00fcr Zeitraum 1, 2, 3 Konzeptdom\u00e4ne 1, 2, 3 Dieser Beitrag bietet einen \u00dcberblick \u00fcber die Daten von VerbaAlpina, wobei der Schwerpunkt auf der dritten Phase liegt. Crowd-Belege gesamt Crowd-Belege noch zu typisieren, gesamt &nbsp; SELECT (SELECT count(*) FROM tokens t JOIN informanten i USING (Id_Informant) LEFT JOIN vtbl_token_morph_typ vtmt USING (id_token) WHERE Erhebung [&hellip;]<\/p>\n","protected":false},"author":13,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"btdb_keywords":[],"coauthors":[92],"class_list":["post-21044","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/21044","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/users\/13"}],"replies":[{"embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=21044"}],"version-history":[{"count":65,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/21044\/revisions"}],"predecessor-version":[{"id":21062,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=\/wp\/v2\/posts\/21044\/revisions\/21062"}],"wp:attachment":[{"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=21044"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=21044"},{"taxonomy":"btdb_keywords","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fbtdb_keywords&post=21044"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.verba-alpina.gwi.uni-muenchen.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcoauthors&post=21044"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}