S stališča informatike pri tem nastane problem večplastne določitve koncepta, ki mora biti odslikan v relacijskem podatkovnem modelu: poleg pomena večbesedne leksije kot celote imajo posamezne besede lastne pomene, ki mečejo luč na motivacijo tvorbe večbesedne leksije. Da bi upoštevali to posebnost, so v podatkovni zbirki VerbeAlpine uporabljene tako imenovane skupine posameznih besed. Zapis, ki je sestavljen iz več posameznih besed, je tu razdeljen na sestavine, te pa so vnesene v preglednico ‘posamezne besede’ (tokens). Vsaka posamezna beseda pri tem opozarja na eden in isti vnos v preglednici 'skupine posameznih besed' in vsebuje podatek o položaju v skupini posameznih besed (1., 2. itd. mesto), tako da je večbesedno leksijo mogoče rekonstruirati iz posameznih besed. Eksplicitno shranjevanje večbesedne leksije tako ni potrebno; v preglednici ‘skupine posameznih besed’ so torej (poleg identifikacijskega podatka) vnesene le dodatne informacije, ki ne morejo slediti iz posameznih besed, kot recimo spol skupine posameznih besed.
Dodelitev konceptov se zgodi tako na ravni posameznih besed kot tudi na ravni skupine posameznih besed. Za zgornji primer so tako v preglednici posamezne besede trije vnosi, ki so jim vsakič pripisani različni koncepti:

Poleg tega je vnos v preglednico ‘skupine posameznih besed’ z lastno dodelitvijo koncepta:

Pri kartografski predstavitvi na površini VerbeAlpine so posamezne besede in skupine posameznih besed obravnavane enakovredno, kar pomeni, da iskanje po konceptu PLANŠARSKA KOČA da tako skupine posameznih besed kot posamezne besede, ki so povezane s tem konceptom. Posamezne besede, ki so le sestavina večbesedne leksije, so pri tem ustrezno označene.
(auct. Stephan Lücke | Florian Zacherl – trad. Peter Weiss)
Tags: lingvistika