Metodologija

sortiranje/razvrščanje

Prikaži vse zapise

A   B   C   D   E   F   G   H  I   J   K   L   M   N   O   P  Q  R   S   T   U   V   W  X  Y  Z  


Digitalizacija  (citiranje)

Digitalizacija v projektu VerbaAlpina ne pomeni preproste uporabe računalnikov za elektronsko obdelavo podatkov, ampak nasprotno in v bistvu digitalno globinsko obdelavo gradiva s sitematičnim in preglednim strukturiranjem in kategorizacijo.





Pri tem se uporablja skorajda izključno relacijski podatkovni model, pri katerem je podatkovno gradivo organizirano načelno v obliki preglednic. Preglednice so sestavljene iz vrstic (= zapisov, n-terčkov) in stolpcev (= atributov, polj, lastnosti), pri čemer se da vsako preglednico razširiti v vsako smer z dodatnimi vrsticami in stolpci. Med preglednicami obstajajo logične zveze, ki omogočajo smiselne povezave in ustrezne sinoptične prikaze (stike, joins) dveh ali več preglednic. Za urejanje preglednic uporablja VerbaAlpina trenutno sistem za upravljanje podatkovnih zbirk MySQL. Vendar pa preglednice niso vezane na ta sistem, ampak jih je mogoče npr. v besedilni obliki z enoumno določujočimi ločili za meje polj in podatkov (t. i. separatorji) skupaj z imeni stolpcev in dokumentacijo logičnih zvez (entitetnopovezavni model) kadar koli izvoziti. Trenutno pogosto rabljena struktura XML se na operativnem področju VerbeAlpine ne uporablja. V okviru vmesniškega koncepta pa je XML zasidran kot izvozni format.

Poleg logičnega strukturiranja podatkov igra v povezavi z digitalizacijo drugo osrednjo vlogo kodiranje jezikovnih znakov. Prav zaradi dolgoročnega arhiviranja podatkovnega gradiva je pravilno ravnanje s to tematiko zelo pomembno. VerbaAlpina se pri tem kar se da ravna po kodnih preglednicah in zahtevah konzorcija Unicode. Pri digitalizaciji jezikovnih znakov, ki doslej še niso bili sprejeti v unikodno preglednico, je posamezni znak digitalno zajet predvsem z nizanjem v obliki zaporedja znakov z unikodnega področja x21 do x7E (v območju ASCII). Ustrezne določitve pripadnosti so dokumentirane v posebnih preglednicah, s čimer je vedno možna poznejša pretvorba v unikodne vrednosti, ki bodo takrat morda na razpolago.


(auct. Stephan Lücke – trad. Peter Weiss)

Tags: lingvistika



Digitalna humanistika  (citiranje)

Projekt VerbaAlpina je bil že zasnovan s pogledom na možnost spletnega predstavljanja, saj namerava odločno prispevati k prenašanju uveljavljenih izročil družbenih in humanističnih ved, natančneje geolingvistike, v digitalno humanistiko.
To pomeni:
(1) Empirična osnova raziskovanja temelji na podatkih (prim. Schöch 2013), to je v digitalno kodiranih in strukturiranih enotah ali vsaj takih, ki se jih da strukturirati; pri tem gre za delno že objavljene podatke (kot je npr. starejše gradivo iz atlasov), delno pa tudi za podatke, ki se pridobivajo na novo. Z mislijo na relevantne koncepte si prizadevamo za kar se da obsežne podatkovne zbirke. Metoda je torej kvantitativna in v glavnem induktivna.
(2) Raziskovalna komunikacija poteka v internetnih medijskih razmerah. To najprej omogoča, da se hipertekstualno prepletejo različni mediji (pisava, slika, video in zvok); v prihodnje lahko osebe, ki so udeležene kot raziskovalci (predvsem kot projektni partnerji) in/ali kot informatorji, še naprej komunicirajo in sodelujejo med seboj.
(3) S tem je zainteresiranim raziskovalcem dana možnost, da so udeleženi pri razvoju te raziskovalne platforme in da pri njej sodelujejo. Ta perspektiva je uporabna vsaj v dveh pogledih in vodi naprej: dopušča povezovanje različnih stališč in predvsem pospeševanje konstruktivnega križanja informacijske tehnologije in jezikovne geografije z javnimi viri, ne da bi bilo treba poseči po (pravno in ekonomsko problematični) podpori zasebnih informacijskotehnoloških podjetij.
(4) Projektno relevantno znanje se da dolgoročno kontinuirano zbirati in preoblikovati, čeprav je tehnično še težko zajamčiti trajno dostopnost (prim. pomembno raziskovalno infrastrukturo CLARIN-D http://de.clarin.eu/de/home.html). Vsekakor objavljanje rezultatov na dejanskih medijskih nosilcih (knjige, cedeji ali devedeji) ob vsem tem ni nikakršna osrednja potreba več; kljub temu je omogočena drugotna možnost tiskanja, kot jo občasno daje tudi spletna leksikografija, npr. zgledni Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Informacijska tehnologija



Dokumentacija  (citiranje)

VerbaAlpina dokumentira narečne različke znotraj etnografsko določenega prostora; onomaziološki okvir je podan s kulturnimi tehnikami in življenjskimi oblikami, ki so se uveljavile v vsakič posebnih, tudi kulturno neodvisnih okoljskih razmerah. Takih prostorov, ki jih kot prototip predstavljajo Alpe, jezikoslovne raziskovalne tradicije ne morejo zajeti primerno, ker se podpodročja, ki se sistematično ukvarjajo z ustrojem prostorov – torej jezikovna geografija oz. dialektologija ali tudi geolingvistika –, skoraj brez izjeme ravnajo po danih političnih in/ali jezikovnih mejah (tudi posameznih jezikov). Prostorskemu profilu osrednjih in v marsikaterem pogledu do danes določujočih projektov je mogoče sicer slediti (prim. npr. AIS in FEW), pogosto pa se z njim ni mogoče strinjati. Ravno posebej očarljivi večjezični kulturni prostori, kot je npr. področje med črnogorsko-albansko obalo Jadrana in Donavo, se zato izmaknejo uveljavljenemu raziskovanju, ki ga vodijo vnaprejšnje nacionalnofilološke predstave. Ambiciozno načrtovani Sredozemski lingvistični atlas (Atlante linguistico mediterraneo ) bi lahko postal velik projekt, ki bi določal smer, vendar pa ni prišel dalj od zasnove.
VerbaAlpina meri na alpski prostor; projekt pa ne želi vleči ne jezikovnih ne narečnih meja in nikakor tudi ne slikati mozaika različkov (narečij), ki so zamejeni eden nasproti drugemu. Nasprotno: s tem se razvija medjezikovna geolingvistika, ki raziskuje, v kolikšni meri so specifične različice, namreč označevalni tipi, ki so značilni za alpski kulturni prostor, skupne ravno narečjem in jih morda vendarle povezujejo čez meje jezikovnih družin. Relativna podobnost lokalnih narečij se induktivno kaže iz podatkov samih. Edina vnaprej dana členitev alpskega prostora, ki je znana že od vsega začetka, se tiče aktualnih mej med tremi velikimi jezikovnimi družinami (germansko, romansko, slovansko).

Perspektiva

Razdelitev različic na teh narečnih področjih implicira raznovrstne stike, ki segajo v daljno ali bližnjo preteklost; zato je lahko čedalje širša perspektiva projekta le zgodovinska. Glede na začrtani raziskovalni prostor VerbaAlpina nikakor ni razumljena kot prispevek k nacionalnim jezikovnozgodovinskim raziskavam upoštevanih jezikov, ampak kot poskus, da bi rekonstruirali stratigrafijo večjezikovnega komunikacijskega prostora kot primer.

Pri tem se projekt ravna izključno po postopku gledanja na osnovo (bottom up), to je na podlagi podatkov, ki se jih da lokalno georeferencirati. Minimalna in privzeto (by default) veljavna referenčna enota je politična občina, natančneje rečeno: prostorska točka, ki predstavlja občino kot celoto, ali pa celotno področje občine. Po potrebi pa je lahko georeferenciranje na nekaj metrov natančno.

Kartografija

Dostop do dokumentacije omogoča predvsem interaktivna karta. Doslej so bile za vizualizacijo uporabljene le točkovne simbolne karte z interaktivnimi simboli. Kot dopolnilo je v pripravi interaktivna simbolizacija na osnovi področij občin, da bi tako dosegli boljšo vizualizacijo kvantitativnih razmer. Interaktivne simbolne karte pomenijo bistven napredek pri jezikoslovni in družboslovni predstavitvi prostora, saj omogočajo obogatitev močno abstrahiranih ('sintetičnih') predstavitev s čisto konkretnimi, krajevnimi ('analitičnimi') informacijami.

Jezikoslovna priprava podatkov

Pri aktiviranju točkovnega simbola (s klikom nanj) se odpre okno z jezikovnimi podatki, ki so na razpolago za konkretni kraj; naslednji primer kaže označitev koncepta MASLO v kraju Ramosch (Unterengadin):



Predstavitev jezikovnih podatkov s pojavnim oknom interaktivne karte

Podatki so predstavljeni tako kot v viru (kot glasoslovno transkribirani posamezni zapis, kot v zgornjem primeru, ali pa v pravopisno tipizirani obliki) in uvrščeni k splošnejšim tipom, najbolj abstraktno kategorijo pa zastopa etimološko definirani osnovni tip. Kmalu se jim bodo po možnosti pridružile kazalke na referenčne slovarje.

Filtri

Različni filtri omogočajo uporabniku izmed podatkov, ki so na razpolago, izbrati želene in jih kartografsko predstaviti. Zgoraj predstavljeni izrez iz karte je del karte, ki se pojavi pri izboru 'koncepta' MASLO:



Filter za upravljanje interaktivne karte

Zajemanje v skupine in razvrščanje

Neredko so v izbranih kategorijah že na razpolago mnogi jezikovni izrazi; iskanje 'koncepta' MASLO (prim. naslednjo sliko) da 1448 zapisov. S tem je dana možnost, da vse relevantne izraze po različnih merilih zajamemo v skupine in jih razvrstimo:



Funkcija za razvrščanje na interaktivni karti: koncepti

Ustrezna možnost se pokaže tudi pri iskanju morfoleksičnih ali osnovnih tipov; predvsem razvrstitev po merilu 'koncept' je zanimiva tudi neodvisno od zajetega jezikovnega prostora, ker razkriva polisemijo vsakega izraza. Tu sta dva posnetka zaslona ravnanja ob primeru malga:





Kot rezultat se pokažejo naslednji pomeni, ki so med seboj v jasnem metonimičnem odnosu. Polisemija morfoleksičnega tipa malga: prim. karta morfo-leksilanega tipa malga

Viri

Doslej so bili obdelani nekateri slovarji, ki se jih je dalo georeferencirati, predvsem pa jezikovni atlasi. Pri tem so bile v glavnem uporabljene tri tehnike:
    1. Že na natisnjenih kartah objavljeno gradivo je bilo s posebej razvitim orodjem zapisano na novo in vneseno v podatkovno zbirko VerbeAlpine; tako je bilo pri večini atlasov: (SDS, AIS, TSA itd.).


    2. Transkripcijsko orodje, ki ga je razvila VerbaAlpina

    3. Že na natisnjenih kartah objavljeno gradivo, ki pa je že v izvirniku digitalno, je bilo pretvorjeno in algoritmično na novo transkribirano tako, da je lahko bilo vneseno v podatkovno zbirko VerbeAlpine. Ta postopek je bil uporabljen za ALD in ALTR.

    4. Še ne objavljeno gradivo drugih projektov je bilo transkribirano oz. digitalno prevzeto neposredno iz njihovih popisnih pol; to velja še posebej za podatke SAO.

    Večrazsežnost

    Za vsestransko razumevanje zgodovinskih procesov je nujno želeno dopolniti jezikovne podatke z drugimi, zgodovinsko relevantnimi; to je pri VerbiAlpini mogoče doseči le pogojno, kljub vsemu pa se mnoge relevantne podatke da priklicati. Tale izrez iz karte kaže v sinoptičnem skupnem pogledu
  • kraje z latinskimi napisi v provinci Norik;
  • kraje z latinskimi napisi iz Recije;
  • rimska imena krajev, ki so izpričana v tako imenovaniTabuli Peutingeriani na viae publicae .
Po drugi strani pa se da iskati reflekse treh latinskih osnovnih tipov, natančneje: dveh latinskih in enega latiniziranega, domnevno predrimskega:
  • osnovni tip lat. casearia v pomenu 'koča' na Severnem, Južnem in še zlasti izrazito na Vzhodnem Tirolskem;
  • osnovni tip predrimsko baita v pomenu 'hiša' v Sloveniji južno od Ljubljane;
  • osnovni tip lat. cellarium v pomenu 'koča' v Zgornji Avstriji.
Sinoptična karta k latinski epigrafiki: prim. karta k latinski epigrafiki, h krajem iz Tabule Peutingeriane in k osnovnim tipom cellarium in baita na delu nemškega in slovenskega prostora (prim. legendo nad karto)

Očitno ujemanje ali vsaj podobnost teh razporeditev komajda lahko pripišemo slučaju.


(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Funkcijska področja



Dolgoročno arhiviranje  (citiranje)

Z vsemi podatki projekta VerbaAlpina se upravlja tako, da bodo kar se da dolgo ostali berljivi in uporabni. Načrtovana perspektiva obsega pri tem vsaj več desetletij, osnovni koncept pa ima navsezadnje za cilj ohranitev brez časovne omejitve.

Natančneje so upoštevani tile vidiki:
1. Kateri ustanovi (katerim ustanovam) je zaupano hranjenje podatkov oz. nosilcev podatkov?
2. Dokumentacija strukturiranja podatkov logičnih povezav med podatki in podatkovnimi kategorijami (entitetni odnos)
3. Dokumentacija uporabljenega kodiranja (uporabljenih kodiranj) znakov

Več kopij projektnih podatkov naj bo arhiviranih pri več različnih ustanovah. Trenutno sta za to predvidena informacijskotehnološka skupina Družbene in humanistične vede Univerze Ludvika in Maksimilijana v Münchnu (ITG) s povezavo na strežnik za arhiviranje Leibničevega računalniškega centra in repozitorij BAS Clarin. Načrtuje se hranjenje dodatnih varnostnih kopij pri drugih ustreznih ustanovah. Arhiviranje se izvaja v ritmu novih različic. Vsakič se shranijo zbirke podatkov z vsemi projektnimi podatki (modul VA_DB skupaj z entitetnoodnosnim modelom) in spletno ogrodje, ki skrbi za predstavljanje podatkov na internetu (vključno z vsakokratno funkcionalnostjo), tako da je – vsaj teoretično – možna »obuditev« vsake posamezne različice v ustrezno emuliranem operacijskosistemskem oz. programskem okolju. Arhivirana je tudi medijska knjižnica, v kateri so predvsem fotografije, filmi ter besedilni in zvočni dokumenti (modul VA_MT).


(auct. Stephan Lücke – trad. Peter Weiss)

Tags: Informacijska tehnologija



Dopolnilni podatki  (citiranje)

Za induktivno raziskovanje kulturnega prostora so demografski in institucionalni podatki zanimivi vedno takrat, ko se jih da georeferencirati. Sem spadajo informacije o zgodovini naseljevanja, še posebej glede na pripadnost cerkvenim in državnim ustanovam. Temeljnega pomena pa so tudi prometne poti, posebej povezave čez prelaze (prim. karto).

Ekološki in geofizikalni podatki so relevantni vedno takrat, ko se jasno nanašajo na naselitveno zgodovino. To je na primer očitno glede na vegetacijske cone, ki dovoljujejo ali zahtevajo določene uporabe (tako npr. alpsko gospodarjenje predpostavlja višinske predele nad drevesno mejo (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_DE)).


(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Zunajjezikovni kontekst