Metodologija

sortiranje/razvrščanje

Prikaži vse zapise

A   B   C   D   E   F   G   H  I   J   K   L   M   N   O   P   Q  R   S   T   U   V   W   X  Y  Z  


Večbesedna leksija

Pod večbesedno leksijo razume VerbaAlpina posebno zaporedje dveh ali več posameznih besed (tokens), ki skupaj pomenijo določen koncept ali pa tudi različne koncepte. Tako je npr. med drugim v Val Gardeni (AIS 1192_1, 312) koncept PLANŠARSKA KOČA označen kot casa da fuoco (ʧˌaz dɑ fˈuɑk), dobesedno ‘ognjena hiša’; v drugih narečjih (Engadin, Ticino idr.) označuje ista zveza koncept KUHINJA.

S stališča informatike pri tem nastane problem večplastne določitve koncepta, ki mora biti odslikan v relacijskem podatkovnem modelu: poleg pomena večbesedne leksije kot celote imajo posamezne besede lastne pomene, ki mečejo luč na motivacijo tvorbe večbesedne leksije. Da bi upoštevali to posebnost, so v podatkovni zbirki VerbeAlpine uporabljene tako imenovane skupine posameznih besed. Zapis, ki je sestavljen iz več posameznih besed, je tu razdeljen na sestavine, te pa so vnesene v preglednico ‘posamezne besede’ (tokens). Vsaka posamezna beseda pri tem opozarja na eden in isti vnos v preglednici 'skupine posameznih besed' in vsebuje podatek o položaju v skupini posameznih besed (1., 2. itd. mesto), tako da je večbesedno leksijo mogoče rekonstruirati iz posameznih besed. Eksplicitno shranjevanje večbesedne leksije tako ni potrebno; v preglednici ‘skupine posameznih besed’ so torej (poleg identifikacijskega podatka) vnesene le dodatne informacije, ki ne morejo slediti iz posameznih besed, kot recimo spol skupine posameznih besed.

Dodelitev konceptov se zgodi tako na ravni posameznih besed kot tudi na ravni skupine posameznih besed. Za zgornji primer so tako v preglednici posamezne besede trije vnosi, ki so jim vsakič pripisani različni koncepti:



Poleg tega je vnos v preglednico ‘skupine posameznih besed’ z lastno dodelitvijo koncepta:



Pri kartografski predstavitvi na površini VerbeAlpine so posamezne besede in skupine posameznih besed obravnavane enakovredno, kar pomeni, da iskanje po konceptu PLANŠARSKA KOČA da tako skupine posameznih besed kot posamezne besede, ki so povezane s tem konceptom. Posamezne besede, ki so le sestavina večbesedne leksije, so pri tem ustrezno označene.


(auct. Stephan Lücke | Florian Zacherl – trad. Peter Weiss)

Tags: lingvistika



Vhodni podatki

V VerbiAlpini se uporabljajo izključno podatki, ki so georeferencirani vsaj na področju ene politične občine, po možnosti pa še natančneje (npr. s fotografijami planin). Glede na posebej pomembne jezikovne podatke je treba razlikovati dva tipa: po eni strani take, ki izvirajo neposredno iz izjav posameznih informatorjev, npr. podatki nekaterih, posebej še romanskih jezikovnih atlasov ali tudi Bavarske narečne zbirke (BayDat); te izjave so razgrajene na bistvene sestavine, tako imenovane člene. Po drugi strani pa nekateri atlasi, kot npr. SDS ali VALTS, in tudi slovarji nasploh ne prinašajo izjav govorcev, ampak oblike, ki jih uredniki že tipizirajo, tako da ni mogoče priti nazaj do členov.


(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: lingvistika



Viri

V VerbiAlpini so združeni zelo različni viri. Razlikovati je treba že objavljene vire (atlase, slovarje, monografije o krajih) na eni strani in nove, to je v okviru projekta samega prvič pridobljene vire po drugi strani; sem spadajo podatki, ki so jih pridobili sodelavci, kot je npr. Beatrice Colcuc, pa tudi taki, ki jih je prispevala množica (crowd), to je individualni in ne osebno znani govorci. V poštev prihajajo izključno viri, ki dajejo že georeferencirane jezikovne podatke ali pa vsaj take, ki se jih da georeferencirati. Seveda morajo biti ti podatki zaradi tipizacije sistematično različno obdelani. Fonetično natančno zapisane izjave so v VerbiAlpini izkazane kot 'posamezni zapis'. Zdaj je smiselno te posamezne zapise razvrstiti v skupine po določenih merilih (jih 'tipizirati'); podatke, ki so bili v viru ponujeni v standardni ali standardizirani obliki, lahko od vsega začetka obravnavamo kot tipizirane, saj ta oblika zapisa izključi zelo veliko fonetičnih variantnih značilnosti. VerbaAlpina zato ne navaja le vira, ampak precizira tudi sistematični status ('posamezni zapis' proti 'fonetični tip' proti 'morfoleksični tip') vsakokratnega jezikovnega podatka, ki ga prinaša vir. Med vire ne štejejo referenčni slovarji, s katerimi se morfosintaktični tipi leksikografsko pokrijejo in v idealnem primeru povežejo. Primeri so tile:

(1) Vir prinaša posamezni zapis:

Posamezni zapis: [a̠lpˈejo̞] – Kraj: Bassano del Grappa – Vir: ALD-II 848_1, 181 (Valrovina)
Fonetični tip: (netipizirano)
Morfoleksični tip: Treccani alpeggio (roa. m.)
Osnovni tip: alpe; prim. DELI 42
Koncept: PLANINA

(2) Vir prinaša fonetični tip:

(Ni posameznega zapisa) – Kraj: Adelboden
Fonetični tip: Anke – Vir: SDS V_179_1, BE104
Morfoleksični tip: Anke (gem. m.), prim. Idiotikon s. v. Anke, 1, 341 in naslednje
Osnovni tip: anko; prim. Kluge 2001, 47
Koncept: MASLO

(3) Vir prinaša morfoleksični tip:

(Ni posameznega zapisa) – Kraj: St. Peter-Pagig
Fonetični tip: Putter – Vir: SDS V_179_1, GR22
Morfoleksični tip: Butter (gem. n.), prim. Idiotikon s. v. [[Butter,  1, 341 in naslednje – Vir: SDS V_179_1, GR22
Osnovni tip: butyru(m); prim. DELI 178
Koncept: MASLO

(4) Vir prinaša morfoleksični tip, ki v standardni nemščini sicer obstaja, vendar je povezan z drugim konceptom:

Morfoleksični tip: Pelz Duden s. v. Pelz (ne za ta koncept); Idiotikon s.v. Belz P-, 4, 1222 – Vir: SDS V_162_1
Koncept: SMETANA NA MLEKU, POTEM KO SE PO KUHANJU OHLADI



(auct. Thomas Krefeld | Stephan Lücke – trad. Peter Weiss)

Tags: spletna stran