Metodologija

sortiranje/razvrščanje

Prikaži vse zapise

(no Tag)   Crowdsourcing   Dokumentation   Forschungslabor   Kooperation   Publikation  


Betacode  (citiranje)

Z naslonitvijo na terminologijo projekta Thesaurus Linguae Graecae (TLG), pri katerem so v začetku sedemdesetih let 20. stoletja razvili ustrezno zasnovo za zapisovanje starogrških besedil s takratnimi sredstvi računalniške tehnike, se v okviru VerbeAlpine transkripcija kompleksnih pisnih sistemov z izključno uporabo znakov ASCII imenuje Betacode.
Preglednica ponazarja postopek na osnovi primera iz jezikovnega in stvarnega atlasa Italije in južne Švice (AIS):





v preglednici Transkripcijski sistem: Betacode v preglednici Izguba informacij
Pri prenosu fonetične transkripcije po Böhmerju in Ascoliju, ki je uporabljena v jezikovnem atlasu, in iz nizov, ki so sestavljeni iz znakov ASCII, je najprej vzpostavljeno razlikovanje med osnovnimi in diakritičnimi znaki. Če obstaja osnovni znak v naboru znakov ASCII, je pri prenosu zastopan sam s seboj (kakor je vseskozi tudi v konkretnem primeru). Takoj za osnovnim znakom so potem zapisani vsi z njim povezani diakritični znaki, pri tem pa je vsak diakritični znak zamenjan s posebnim znakom ASCII. Razmerje med diakritičnimi znaki in znaki ASCII je v VerbiAlpini dokumentirano enoumno in predstavljeno v posebnih preglednicah podatkovne zbirke VerbeAlpline. Določen znak je, če je le mogoče, izbran po načelu optične podobnosti. Tako je v navedenem primeru kljukica pod uv besedi tu predstavljena z levim okroglim oklepajem: tu(. Diakritični znaki se, če izhajamo iz njihove razvrstitve ob osnovnem znaku, pišejo v zaporedju od spodaj navzgor in z leve na desno za osnovnim znakom. Po načelu optične podobnosti sledi pripadnost diakritičnih znakov znakom ASCII neodvisno od njihove semantike, ki je specifična za konkreten vir; z drugimi besedami: tudi če ima kljukica pod osnovnim znakom v enem viru povsem drugačen fonetični pomen kot v drugem, bo v obeh primerih zapisana kot levi oklepaj, in sicer za osnovnim znakom. Semantične razlike so dokumentirane v transkripcijskih preglednicah za vsak vir posebej: urejajo pretvorbo znaka iz sistema Betacode v izhodno transkripcijo v skladu z mednarodno fonetično abecedo (IPA) – kodiranje v sistemu Betacode lahko torej glede na vir privede do zelo različnih kodiranj v sistemu IPA.
Opisani postopek ima celo vrsto prednosti:
– vnašanje podatkov poteka na navadnih tipkovnicah sorazmerno hitro in je popolnoma neodvisno od operacijskega sistema,
– prepisovalci ne potrebujejo znanja o fonetičnih transkripcijskih sistemih,
– zapisati je mogoče poljubne (diakritične) znake, neodvisno od tega, ali so v unikodu ali ne, in
– elektronski zajem podatkov poteka brez izgube informacij.
Kodiranje v sistemu Betacode se da z zamenjevanjem pretvoriti v skorajda vse poljubne druge transkripcijske sisteme. Pri takih pretvorbah prihaja do izgube informacij, ki pa so upravičene zaradi narave transkripcijskih sistemov. Tako fonetična transkripcija po Böhmerju in Ascoliju razlikuje odprtnostne stopnje v natančnosti, ki v sistemu IPA ni predvidena.

(auct. Thomas Krefeld | Stephan Lücke – trad. Peter Weiss)


Tags: Dokumentation Kooperation Forschungslabor



Digitalna humanistika  (citiranje)

Projekt VerbaAlpina je bil že zasnovan s pogledom na možnost spletnega predstavljanja, saj namerava odločno prispevati k prenašanju uveljavljenih izročil družbenih in humanističnih ved, natančneje geolingvistike, v digitalno humanistiko.
To pomeni:
(1) Empirična osnova raziskovanja temelji na podatkih (prim. Schöch 2013), to je v digitalno kodiranih in strukturiranih enotah ali vsaj takih, ki se jih da strukturirati; pri tem gre za delno že objavljene podatke (kot je npr. starejše gradivo iz atlasov), delno pa tudi za podatke, ki se pridobivajo na novo. Z mislijo na relevantne koncepte si prizadevamo za kar se da obsežne podatkovne zbirke. Metoda je torej kvantitativna in v glavnem induktivna.
(2) Raziskovalna komunikacija poteka v internetnih medijskih razmerah. To najprej omogoča, da se hipertekstualno prepletejo različni mediji (pisava, slika, video in zvok); v prihodnje lahko osebe, ki so udeležene kot raziskovalci (predvsem kot projektni partnerji) in/ali kot informatorji, še naprej komunicirajo in sodelujejo med seboj.
(3) S tem je zainteresiranim raziskovalcem dana možnost, da so udeleženi pri razvoju te raziskovalne platforme in da pri njej sodelujejo. Ta perspektiva je uporabna vsaj v dveh pogledih in vodi naprej: dopušča povezovanje različnih stališč in predvsem pospeševanje konstruktivnega križanja informacijske tehnologije in jezikovne geografije z javnimi viri, ne da bi bilo treba poseči po (pravno in ekonomsko problematični) podpori zasebnih informacijskotehnoloških podjetij.
(4) Projektno relevantno znanje se da dolgoročno kontinuirano zbirati in preoblikovati, čeprav je tehnično še težko zajamčiti trajno dostopnost (prim. pomembno raziskovalno infrastrukturo CLARIN-D http://de.clarin.eu/de/home.html). Vsekakor objavljanje rezultatov na dejanskih medijskih nosilcih (knjige, cedeji ali devedeji) ob vsem tem ni nikakršna osrednja potreba več; kljub temu je omogočena drugotna možnost tiskanja, kot jo občasno daje tudi spletna leksikografija, npr. zgledni Tesoro della Lingua Italiana delle Origini.

(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Kooperation Crowdsourcing



Etimologija  (citiranje)

Razkrivanje jezikovnih plasti, stratigrafija, predvideva etimologizacijo. Etimološki komentar izhaja vsakič iz osnovnega tipa in sledi trem ciljem:
– določitev izvornega jezika leksemske osnove;
– utemeljitev občutka pripadnosti vseh tipov, ki so združeni pod osnovni tip; za to so odločilni pravila zgodovinske fonetike in semantična verjetnost konceptnih odnosov, ki tvorijo osnovo;
– rekonstrukcija poti izposoje, če je osnovni tip razširjen na več jezikovnih področjih; kakor hitro se jezik etimona na eni strani ne ujema z jezikom informatorjev na drugi strani, je samodejno ugotovljen jezikovni stik.

(auct. Thomas Krefeld – trad. Peter Weiss)


Tags: Dokumentation Kooperation



Georeferenciranje  (citiranje)

Bistveno razvrščevalno merilo pri podatkih, s katerimi upravljamo v VerbiAlpini, je georeferenciranje z uporabo širinskih in dolžinskih stopinj. Natančnost tega referenciranja se spreminja glede na tip podatkov, pri čemer pa si načelno prizadevamo za kar se da, do metra natančno referenciranje. Pri jezikovnih podatkih iz atlasov in slovarjev je na splošno možno le sorazmerno približno referenciranje v sorazmerju s krajevnim imenom, pri npr. arheoloških podatkih pa je dejansko možno do metra natančno georeferenciranje. Shraniti je mogoče pike, črte (recimo ceste, reke ipd.) in ploskve. S tehničnega vidika se uporablja predvsem tako imenovani format WKT), ki ga v zbirki podatkov VerbeAlpine s funkcijo geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html) pretvorimo v specifični format MySQL in ga tako shranimo. Do izvoza v formatu WKT pridemo s funkcijo astext() v formatu MySQL.
Referenčni raster georeferenciranja je mreža političnih občin v alpskem prostoru, ki so – po potrebi – lahko predstavljene ali kot ploskve ali kot točke. Osnova pri tem so poteki mej občin po stanju približno leta 2014, ki jih je VerbaAlpina dobila od svojega partnerja, Alpske konvencije. Neprestano aktualiziranje teh podatkov, ki se zaradi neredkih upravnih reform vsekakor zelo pogosto menjajo, je nepotrebno, ker gre s stališča VerbeAlpine samo za geografski referenčni okvir. Točkovna predstavitev rastra občin se izpelje iz občinskih mej algoritemsko in torej sekundarno. Izračunane občinske točke predstavljajo geometrična središča občinskih ploskev in kvečjemu slučajno označujejo glavni kraj ali celo njegovo središče. Po potrebi se lahko skupni podatki posamič ali nakopičeni odslikajo na izračunano občinsko točko. Tako je recimo pri jezikovnih podatkih iz atlasov in slovarjev.


(auct. Thomas Krefeld | Stephan Lücke – trad.l Peter Weiss)


Tags: Dokumentation Kooperation Crowdsourcing



Informator  (citiranje)

Izraz se v VerbiAlpini razume tehnično, saj glede na vir združuje dve različni stvari: v atlasih so vsi jezikovni podatki »navzdol« vse do govorca praviloma transparentni; v podatkovni zbirki je te informatorje mogoče identificirati s pomočjo individualne številke (ID). Nadalje so kronoreferencirani z letom anketiranja in georeferencirani s krajem anketiranja. V slovarjih, ki omogočajo georeferenciranje, pa konkretnega govorca nasprotno praviloma ni mogoče identificirati. Iz tehničnih razlogov pa so pri zbirki podatkov tudi virom te vrste pripisani fiktivni informatorji. Vsak informator je dodeljen določeni jezikovni družini; ta jezikovna dodelitev se prenaša na vse jezikovne podatke, ki izvirajo od njega.

(auct. Thomas Krefeld – trad. Peter Weiss)


Tags: Kooperation Crowdsourcing



Kodna stran  (citiranje)

VerbaAlpina združuje podatke iz različnih vrst virov: podatke iz natisnjenih jezikovnih atlasov in slovarjev, ki jih je najprej treba še digitalizirati, pa tudi že elektronsko dosegljive podatke iz vrste partnerskih projektov. Vsak od teh različnih virov uporablja za transkribiranje bolj ali manj individualne sisteme. Da bi dosegli nujno poenotenje, so potrebni seznami, v katerih je določeno, kateri pisni znak v transkripcijskem sistemu enega vira ustreza konkretnemu znaku v transkripcijskem sistemu drugega vira. V glavnem gre za to, da bi različne transkripcijske sisteme preslikali v mednarodno fonetično abecedo (IPA), ki v VerbiAlpini deluje kot referenčna transkripcija. Za pretvarjanje transkripcijskega sistema, specifičnega za vir, v sistem IPA je treba oblikovati popoln seznam v obliki preglednice z ustreznicami pisnih znakov. Taka preglednica se imenuje kodna stran. Sledi izvleček iz osnovne kodne strani za pretvorbo transkripcijskega sistema AIS v sistem IPA. Ta kodna stran obsega 4500 vrstic/povezav.



Stolpec ‚BETA‘ vsebuje znake, uporabljene v AIS, prepisane po načelih sistema Betacode, stolpec ‚IPA‘ ustrezne znake iz mednarodne fonetične abecede (IPA) in stolpec ‚HEX‘ številsko vrednost ali številske vrednosti unikodne preglednice, ki ustrezajo vsakokratnemu znaku IPA.

(auct. Stephan Lücke – trad. Peter Weiss)


Tags: Dokumentation Kooperation



Medjezična geolingvistika  (citiranje)

Med cilji tega portala naj bi bilo oblikovanje prikaza moči jezikovnega stika in posebej še etnolingvističnega pogojevanja pri razvoju alpskega jezikovnega prostora. Zasnova zbirke podatkov bo dovoljevala predstavitev zajetih izposojenk tudi kvantitativno v njihovem lokalnem kopičenju, saj se izkažejo samodejno, če se pripadnost informatorja eni od treh jezikovnih družin ne ujema s pripadnostjo etimona v tem smislu.
Natančneje rečeno: novodobnemu alpskemu prostoru v obliki različno velikih in predvsem različno močno diferenciranih narečnih kontinuumov dajejo pečat tri jezikovne družine; področij razširjenosti teh treh jezikovnih družin se sicer ne da preslikati na specifične države Aktuelle Sprachgebiete. Germansko je zastopano z alemanskimi in bavarskimi različki, ki jih prištevamo k pluricentričnemu nemškemu jeziku; vendar pa pri mnogih walških in starobavarskih (cimbrijskih) jezikovnih otokih na južni strani Alp pravzaprav ni več skupne navezave na švicarski, nemški ali avstrijski standardni različek, ki najprej spodbudi pripadnost k eni in isti jezikovni skupnosti.
V primerjavi z delnim področjem germanskega jezika lahko določimo pripadnost različic romanskega kontinuuma več jezikom; poleg francoščine in italijanščine gre pri tem po merilu političnega priznanja v Švici in Italiji za okcitanščino, frankoprovansalščino, retoromanščino, dolomitsko ladinščino in furlanščino.
Slovansko je zastopano s slovenskimi narečji, ki se govorijo v Sloveniji in tudi v nekaterih italijanskih in avstrijskih občinah. Vendar pa si VerbaAlpina ne postavlja za cilj, da bi kar se da natančno opisala narečja alpskega prostora, izdelala lokalne ali regionalne narečne meje in predstavila prostor tako rekoč kot mozaik različic. Nasprotno, z obsežno zasnovo naj bi se pokazale ravno tiste (predvsem besedne) značilnosti, ki so razširjene čez posamezne narečne in jezikovne meje in tako postavljajo v ospredje skupne etnolingvistične poteze.





Ker tvorijo narečja v sebi popolne jezikovne sisteme, lahko glede na skupno raziskavo treh »genetično« različnih kontinuumov rečemo, da se tu raziskuje jezikovni stik v obliki medjezične jezikovne geografije.

(auct. Thomas Krefeld – trad. Peter Weiss)


Tags: Dokumentation Kooperation



Sinoptična karta  (citiranje)

Ta funkcija omogoča uporabniku, da po svojih interesih izbere obstoječe posamezne karte in jih združi na sinoptične kombinacijske krate. Tako je mogoče vidno ponazoriti področja razširjenosti poljubnih in povezanih jezikovnih in zunajjezikovnih značilnosti. Hkrati obstaja možnost, da te sinoptične karte ohranimo s stopnjo povečave, če naj bo dokumentiran lokalni kontekst, npr. Karwendel ali okcitansko-frankoprovansalsko-piemontski narečni kontinuum Zahodnih Alp Zahodnih Alp.

(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Dokumentation Kooperation Forschungslabor



Stratigrafija  (citiranje)

Alpe so od prazgodovine področje raznovrstnih jezikovnih stikov, ki izvirajo iz zelo različnih konstelacij plasti (prim. Krefeld 2003). Načelno označujemo jezike, ki so na kakem področju v stiku, ker je tam več ali manj dvojezičnih govorcev ali celo skupnosti govorcev, kot adstrate. Če je en osnovni tip razširjen le na določenem področju, torej recimo v Alpah, in se v zadevnih jezikovnih družinah sicer ne pojavlja, smer izposoje in izvorni jezik pogosto nista enoumna (prim. osnovni tip rom. baita / nem. Beiz, Beisl).
Če se izvorni jezik izposojene sestavine na področju razširjenosti ali na delu tega področja ne govori več, razlikujemo dve konstelaciji: v primeru substrata se je izvorni (substratni) jezik govoril na področju razširjenosti, preden je bila tradicijska kontinuiteta prekinjena in je prevladal uveljavljeni jezik; romanščina je substratni jezik celotnega nemško in slovensko govorečega alpskega področja. Substratne besede sicer predpostavljajo menjavo jezika, kljub temu pa se pogosto odlikujejo z izredno regionalno ali lokalno kontinuiteto.
Pri superstratu velja izvorni jezik v določenem časovnem prostoru na področju razširjenosti, ne da bi se tam trajno uveljavil. Tako so obstajali v delih alpskega prostora z romanskimi jeziki po razpadu rimske infrastrukture občasno germanski superstrati (gotščina, langobardščina), v Sloveniji pa je imela to vlogo v habsburškem času nemščina.
Med tremi jezikovnimi družinami so se pokazali trije povsem različni scenariji. Glede na pomen jezikovnega stika za zgodovino jezikovnega prostora je pomembna predvsem kronologija izposoje: ali gre recimo pri romanizmih v germanskem in slovanskem jezikovnem prostoru za substratne besede z regionalno tradicijsko kontinuiteto od antike ali za mlajše adstratne prevzeme? Isto vprašanje velja mutatis mutandis za germanizme v romanskem in za slavizme v nemškem jezikovnem prostoru.





Kontaktni stiki jezikovnih družin v alpskem prostoru – in možna besednozgodovinska vprašanja

substratna zveza (implicirana sprememba jezika)
superstratna zveza (sprememba jezika ni implicirana)
adstratne zveze

slovansko
germansko
latinsko-romansko
predlatinski, delno neindoevropski jeziki
Izposojenke so zanesljiv pokazatelj zgodovinskih akulturacijskih procesov; zato je primerna kvantitativna predstavitev, ki dopušča prostorsko natančno določiti relativno pogostnost izpričanih izposojenk.

(auct. Thomas Krefeld – trad. Peter Weiss)

Tags: Dokumentation Kooperation Forschungslabor