Metodologia

Zavrada

Alle Einträge anzeigen(!!!)

(no Tag)   Context extralinguistic   Secturs d'activitad   Tecnologia d'infurmaziun   Linguistica   Pagina-web  


Archivaziun a lunga durada  (Citar)

Tut las datas dal project VerbaAlpina vegnan administradas uschia ch'ellas restan legiblas ed duvrablas per in spazi da temp uschè lung sco pussaivel. La perspectiva prendida en mira dal project cumprenda silmain plirs decennis, il concept, ch'è a la basa, è dentant orientà vers ina conservaziun senza limitaziun temporara.

En detagl vegnan resguardads ils aspects suandants:
1. Tgei instituziun(s) vegn(an) incumbensada(s) cun la preservaziun da las datas e dals purtaders da datas respectivs?
2. Documentaziun da la structuraziun da datas sco era da las relaziuns logicas tranter datas e categorias da datas (entitad-relaziun)
3. Documentaziun da la(s) codaziun(s) dals caracters duvrada(s)

Pliras copias da las datas da project duain vegnir archivadas tar pliras instituziuns differentas. Actualmain è prevesida a questa finamira la IT-Gruppe Geisteswissenschaften da la Ludwig-Maximilians-Universität Minca (ITG). Questa gruppa è attaschada al server d'archivaziun dal Leibniz-Rechenzentrum sco er al BAS Clarin Repository. Igl è planisà ultra da quai da depositar ulteriuras copias da segirezza tar autras instituziuns adattadas. L'archivaziun ha lieu en il ritmus da la gestiun da la versiun. I vegn mintgamai archivada la banca da datas cun tut las datas da project (modul VA_DB ensemen cun il model entitad-relaziun) sco er il framework per applicaziuns-web (VA_WEB), ch'è responsabel per la preschentaziun da las datas en l'internet (inclus la funcziunalitad respectiva) uschia ch'igl è pussaivel, silmain teoreticamain, da "resvegliar" mintga singula versiun en conturns da sistems operativs resp. software emulads correspundents. I vegn archivada ultra da quai la mediateca che cuntegna en emprima lingia fotos, films, datotecas da texts e documents sonors (modul VA_MT).

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia d'infurmaziun



Code beta  (Citar)

Sa basond sin la terminologia dal Thesaurus Linguae Graecae (TLG), che ha sviluppà il concept correspundent a l'entschatta dals onns otganta per l'endataziun electronica da texts grecs vegls cun ils meds da tecnica da computer da lez temps, vegn designada la transcripziun da sistems da scrittiras duvrond exclusivamain segns ASCII sco "code beta" en connex da VerbaAlpina. La grafica suandanta illustrescha il proceder cun agid d'in exempel dal Sprach- und Sachatlas Italiens und der Südschweiz (AIS):





Cu ch'ins transpona la transcripziun fonetica tenor Böhmer-Ascoli duvrada en l'atlas linguistic en sequenzas da segns ASCII, i vegn differenzià al cumenzament tut simplamain tranter segn da basa e segns diacritics. Sch'in segn da basa è existent en il code ASCII, vegn el represchentà da sasez en il transfer (sco igl è il cas en il exempel sura). Directamain suenter il segn da basa vegn screts tut ils segns diacritics ch'èn liads al segn da basa. Mintga segn diacritic vegn remplazzà d'in segn ASCII spezial. L'attribuziun dals segns diacritics a segns ASCII è univoc a l'intern da VerbaAlpina; ella vegn documentada en tabellas spezialas en la banca da datas da VerbaAlpina. La tscherna da l'attribuziun è definida uschenavant che pussaivel dal princip da la sumeglientscha optica. Uschia vegn il crutschet sut u en il pled tu en l'exempel exprimì d'ina parantesa radunda che s'avra: tu(. Ils segns diacritics vegnan scrits, partind da lur urden tar il segn da basa, suenter il segn da basa en l'urden da sut a sura e da sanester a dretg. Pervia dal princip da la sumeglientscha optica succeda l'attribuziun da segns diacritics a segns ASCII independentamain da lur semantica specifica en la funtauna, q.v.d.: er sch'in crutschet sut il segn da basa ha in'autra significaziun fonetica en ina funtauna ch'en in'autra, vegn tuttina reproducì il crutschet d'ina parantesa suandanta en omadus cas. Las differenzas semanticas vegnan documentadas en tabellas da transcripziun specificas per mintga funtauna: ellas regleschan la conversiun dal code beta en la transcripziun d'output tenor IPA; la medema codaziun beta po pia manar a codaziuns en IPA cumplettamain differentas tut tenor funtauna.

Il proceder descrit ha blers avantatgs:
- la registraziun da datas po vegnir fatga cun in tempo relativamain aut sin tastaturas da standard ed è complettamain independenta dal sistem operativ,
- ils transcripturs n'han betg basegn d'enconuschientscha da sistems da transcripziun fonetics,
- inquals segns resp. segns diacritics pon vegnir endatads, independetamain dal fatg, sch'els sajan codads en Unicode u bet, e
- la registraziun da datas electronica ha lieu senza perdita d'informaziun.
Il code beta po vegnir transferì en bunamain tut auter sistem da transcripziun tras rutinas da substituziun. En connex cun talas conversiuns datti eventualmain perditas d'informaziun ch'èn dentant motivadas da l'esser dals sistems da transcripziun. Uschia differenziescha p.ex. la transcripziun fonetica tenor Böhmer-Ascoli differents grads d'avertura en ina granularitad che n'è betg prevesida en il sistem IPA.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia d'infurmaziun



Descripziun da concept  (Citar)

Ils concepts vegnan endatai en la tabella KONZEPTE (concepts) da la banca da datas suandantamain: sch'ina denominaziun per in concept exista, vegn questa endatada en il champ da banca da datas 'Name_R' (denominaziun rumantscha). Cura che la lexicalisaziun manca, quest champ resta vid. Independentamain da quai vegn il concept specifitgà pli exactamain resp. definì en il champ 'Beschreibung_R' (descripziun rumantscha). Quai succeda tenor ina moda da proceder fixada che vegn demonstrada a l'exempel dal concept 'CHANTA DA LATG' (ID_Konzept 610; identificatur dal concept en la banca da datas): il concept numnà vegn denominà cun in lexem specific, per consequenza vegn chanta da latg endata en il champ 'Name_R'. La descripziun prevesa la successiun ierarchica suandanta: utensil, diever, material, furma (ev.). Applitgà a quest concept resulta damai la descripziun suandanta: RECIPIENT, PER CONSERVAR IL LATG, DA METAL. Sche pussaivel resp. necessari duain vegnir observadas questas reglas supplementaras: ils dumbers dad 1 a 10 vegnan scrits en pleds, per exprimer in process, in'activitad euv. po u 'per+infinitiv' u 'per+artitgel+substantiv' vegnir duvrà. L'observaziun da quests musters pussibilitescha translaziuns analogas, la furmaziun da categorias independentas da la lingua sin differents stgalims d'abstracziun (-> RECIPIENTS ->RECIPIENTS PER LA CONSERVAZIUN ->RECIPIENTS DA METAL euv.), correcturas automatisadas resp. modificaziuns ed ina retschertga transparenta. Tut ils concepts vegnan endatai en quella moda per tudestg, talian, franzos, sloven e rumantsch.

(auct. Giorgia Grimaldi | Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Tecnologia d'infurmaziun



Entitad-relaziun  (Citar)

Datas pon vegnir condensadas per princip ad uschenumnadas "entitads". I sa tracta da classas da datas che mussan mintgamai ina tscherta moda ed ina tscherta quantitad da caracteristicas specificas. Uschia pon per exempel las citads Trento, Innsbruck e Lucerna furmar ina classa "lieus", a la quala appartegnan las caracteristicas "num local", "grad da longhituda", "grad da ladezza", "stadi" e "dumber d'abitants". Ils singuls members d'ina tala classa sa differenzieschan tras valurs differentas da las caracteristicas che furman la classa.
En ina banca da datas relaziunala vegnan memorisadas entitads idealmain en tabellas mintgamai separadas, nua mintga colonna da tabella registra las valurs da mintgamai ina caracteristica specifica. Las lingias da tabella cuntegnan ils members da la classa da data (entitad) ch'èn individualas e sa differenzieschan in da l'auter tras la valur da caracteristica differenta. Quasi adina – ed uschia era tar VerbaAlpina – represchenta ina banca da datas relaziunala ina collecziun da entitads differentas (e cun quai tabellas), tranter las qualas existan relaziuns logicas. Uschia fiss per exempel l'entitad "infurmant", ch'è definida da las caracteristicas "vegliadetgna", "schlattaina", "lieu da naschientscha" e "domicil", colliada logicamain cun l'entitad "lieus" da tala moda che las valurs da las caracteristicas "lieu da naschientscha" e "domicil" hajan correspundenzas en l'entitad "lieus". Relaziuns tranter members da questas duas entitads resultan da las accordanzas da las valurs dad ina u pliras caracteristicas ch'èn congruentas en lur essenza. En il cas dà pudess resultar teoreticamain in'attribuziun da valurs identicas da las caracteristicas "lieu da naschientscha" e "domicil", tras las qualas pon vegnir attribuidas indirectamain ad in infurmant las geocoordinatas da ses lieu da naschientscha. Igl è facilmain d'enconuscher ch'en quest exempel pon sa manifestar problems en consequenza dad omonims. Per evitar problems sumegliants, èsi usità da duvrar dumbers entirs sco identificaturs (curtamain: "ID") che designan univocamain ils members dad in'entitad.
Il sistem skizzà da las entitads e da lur relaziuns logicas vegn denominà sco entitad-relaziun. Igl effektiv da datas collectà en ina banca da datas relaziunala è senza in'explicaziun da questas dependenzas existentas là be grevamain da chapir ed utilisar. Usualmain succeda l'illustraziun da l'entitad-relaziun en furma dad in schema grafic.
L'entitad-relaziun succumba durant las fasas da svilup ciclicas da VerbaAlpina (v. Gestiun da la versiun ad adattaziuns e cun quai midaments. A mintga versiun archivada da VerbaAlpina vegn agiuntà il model d'entitad-relaziun da la versiun da la banca da datas ch'è mintgamai a la basa en furma dad in diagram ER. Quest diagram vegn creà cun il program yEd e memorisà sco datoteca (GraphML-) e datoteca pdf. La grafica suandanta sa basa sin las entitads e relaziuns da la banca da datas VA_XXX en ses stadi actual (20.3.2015), na la represchenta dentant betg cumplettamain ed è da chapir be sco exempel d'illustraziun.





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia d'infurmaziun



Georeferenziaziun  (Citar)

La georeferenziaziun è in criteri d'ordinaziun da las datas administradas in VerbaAlpina substanzial; i vegnan applitads grads da longhituda e da ladezza. L'exactadad da questa referenziaziun variescha tut tenor il tip da datas, i vegn visada dentant ina referenziaziun uschè exacta sco pussaivel, cun precisiun dad in meter. En il cas da las datas linguisticas d'atlas e dicziunaris è normalmain mo ina referenziaziun approximativa tenor il toponim pussaivel, en il cas da datas p.ex. archeologicas percunter èn pussaivlas georeferenziaziuns exactas enfin il meter. I pon vegnir memorisads puncts, lingias (sco vias, flums e.s.) e surfatschas. Per la georeferenziaziun vegn duvrà surtut l'uschenumnà format WKT (https://en.wikipedia.org/wiki/Well-known_text) che vegn transferì en in format MySQL specific en la banca da datas da VerbaAlpina tras la funcziun geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html e vegn memorisà uschia. La sortida en format WKT succeda tras la funcziun MySQL astext().
Il retagl da referenza da la georeferenziaziun è la rait da las vischnancas en il territori alpin che pon vegnir edidas u sco surfatscha u sco punct, tut tenor basegn. La basa per la georeferenziaziun èn las lingias da cunfin da las vischnancas che VerbaAlpina ha survegnì da siu partenari Convenziun da las Alps; las datas correspundan circa al stadi da 2014. In'actualisaziun permanenta da questas datas, che sa midan mintgatant pervia da refurmas da l'administraziun betg raras, è nunnecessaria perquai ch'i sa tracta be d'in rom da referenza geografic tenor l'opiniun da VerbaAlpina. La preschentaziun da punct dal retagl da vischnancas vegn deducì cun agid dad algoritmus dals cunfins da vischnancas ed è pia secundara. Ils puncts da vischnancas eruids rapreschentan ils puncts centrals geometrics da las surfatschas da vischnancas e marcheschan maximalmain per cas la chapitala u schizunt il center da la vischnanca. En il cas da basegn pon tut las datas vegnir projectadas separadamain u cumulativamain sin il punct da vischnanca eruì. Quai è il cas per exempel per las datas linguisticas d'atlas e dicziunaris.
Ultra dal retagl da referenza dals cunfins da vischnancas georeferenzià exactamain vegn preschentà in retagl quasi georeferenzià en furma cun structuras da patgnas (a partir da versiun 16/1) che reproducescha bain la posiziun approximativa da las vischnancas ina cun l'autra, che assegna dentant a medem temp ina surfatscha idealisada a mintga territori communal cun mintgamai la medema furma e dimensiun.

Cun quai vegnan purschidas metodas da cartaziun alternativas che han omaduas lur avantatgs e dischavantatgs e ch'offreschan er omaduas in tschert potenzial sugestiv grazia a lur potenza figurativa: la preschentaziun topografica porscha ina meglra idea da la spazialitad concreta cun ses profils da territoris, traversadas da val, sortidas da val nunaccessiblas euv. savens fetg spezials. La charta da patgna pussibilitescha encunter ina visualisaziun pli abstrahada da las datas perquai ch'ella gulivescha las extensiuns da las surfatschas da vischnanc sco er aglomeraziuns resp. abitadis sparpagliads. Quai è particularmain util per las chartas quantitativas pertge che la dimensiun da la surfatscha crea involuntarmain l'impressiun da da paisa quantitativa gia tar la percepziun.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia d'infurmaziun Context extralinguistic



Gestiun da la versiun  (Citar)

VerbaAlpina consista dals moduls suandants:

-VA_DB: effectiv da datas da la banca da datas (MySQL) dal project (va_xxx)
-VA_WEB: code da program da l'interfatscha web dal portal da project www.verba-alpina.gwi.uni-muenchen.de cumprais la banca da datas Wordpress respectiva (va_wp)
-VA_MT: datotecas da medias (fotos, films, texts e documents sonors) che sa chattan en la biblioteca da medias da l'interfatscha web

Tut ils trais moduls furman in'unitad consistenta cun colliaziuns e dependenzas vicendaivlas e na pon betg esser distatgads in da l'auter per consequenza. Durant la durada dal project vegn "schelà en" (per uschia dir) il status mintgamai actual dals moduls VA_DB e VA_WEB simultanamain en furma dad ina copia electronica en intervals periodics. Questas copias scheladas survegnan numers da versiun tenor il schema [onn chalendar]/[numer current] (p.ex. 15/1). La versiun VA mintgamai productiva survegn la denominaziun XXX.

La creaziun da copias da la mediateca VA (VA_MT) è impedida pervia da la dimensiun usualmain enorma da datotecas da medias. Per quest motiv na vegn betg creada ina copia da quest modul en connex cun il process da la gestiun da la versiun. Elements ch'ein vegnids archivads ina giada en la mediateca VA na pon perquai betg vegnids eliminads ordlonder, apaina che era mo ina suletta versiun VA è colliada ad els.  

En il portal da project datti la pussaivladad da midar tranter la versiun VA mintgamai "productiva", e perquai suttamessa a modificaziuns cuntinuantas, e las versiuns archivadas, "scheladas en". I vegn visualisà en il portal da project tras ina coluraziun adattada dal fund davos resp. da tscherts elements da cumond, sch'ins sa chatta en la versiun productiva u en ina versiun archivada da VA. *Unicamain* las versiuns archivadas da VA dastgan vegnir citadas.

Illustraziuns da cuverta da versiuns precedents da VerbaAlpina:

15/1

15/2

16/1

16/2

17/1

17/2

18/1

18/2

19/1

19/2



(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia d'infurmaziun



Modellaziun da las datas  (Citar)

v. model da datas relaziunal

Tags: Linguistica Tecnologia d'infurmaziun



Moduls  (Citar)

v. gestiun da la versiun

Tags: Tecnologia d'infurmaziun



Pagina da codes  (Citar)

VerbaAlpina unescha datas da differents tips da funtaunas: datas d'atlas linguistics e pledaris stampads, che ston anc vegnir digitalisadas, sco er datas ch'existan gia en furma electronica d'ina retscha da projects da partners. Mintgina da questas funtaunas differentas utilisescha sistems pli u main individuals per la transcripziun. Per realisar l'unificaziun indispensabla han ins basegn da glistas, en las qualas è determinà tge caracter en il sistem da transcripziun d'ina funtauna ha tge equivalent en il sistem da transcripziun d'in autra funtauna. I sa tracta principalmain da represchentar ils sistems da transcripziuns differents en l'Alfabet Fonetic Internaziunal (IPA) che fa da transcripziun da referenza a l'intern da VerbaAlpina. Per il transferiment d'in sistem da transcripziun specific a la funtauna en il sistem d'IPA è necessari endrizzar ina glista cumpletta en furma da tabella cun ils equivalents da caracters. Tala tabella sa numna "pagina da codes". Qua in extract da la pagina da codes fundamentala per la conversiun dal sistem da transcripziun da l'AIS a l'IPA. En tut cumprenda questa pagina da codes var 4500 lingias/attribuziuns:



La columna `BETA` cuntegn ils caracters duvrads en l'AIS en furma transcritta tenor il princip dal code beta, la columna `IPA` cuntegn il caracter IPA mintgamai correspundent e la columna `HEX` la valur numerica/las valurs numericas da la tabella Unicode che correspunda(n) al caracter IPA correspundent.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia d'infurmaziun



Scienzas umanas digitalas  (Citar)

Il project VerbaAlpina è vegnì concepì da bell'entschatta en consideraziun da l'abilitad al web, pertge ch'el vul contribuir cleramain al transferiment da las tradiziuns umanisticas etablidas, pli exactamain da la geolinguistica, a las scienzas umanas digitalas.

Quai signifitgescha:
(1) La basa empirica da la perscrutaziun consista en datas (cfr. Schöch 2013), qvd. en unitads codadas e structuradas u silmain structurablas digitalmain); i sa tracta per part da datas gia publitgadas e digitalisadas secundaramain (sco p.ex. ils materials dals atlas pli vegls), per part dentant er da datas ch'èn da rilevar danovamain. Areguard ils concepts relevants aspiran ins a dumbers da datas uschè vasts sco pussaivel. La metoda è pia quantitativa e per gronda part inductiva.
(2) La communicaziun da perscrutaziun succeda sut las condiziuns medialas da l'internet. Quai porscha en emprima lingia la pussaivladad d'entretschar medias differentas (scrittira, fotografias, video e sun) ipertextualmain; vinavant pon las persunas che sa participan al project sco perscrutaders (surtut sco partenaris da project) e/u sco infurmants communitgar e cooperar cuntinuadamain tranter pèr.
(3) Cun quai fan ins l'offerta a perscrutaders interessads da participar al svilup da questa plattafurma scientifica e collavurativa. Questa perspectiva è nizzaivel e mana vinavant en almain dubel resguard: ella lubescha d'integrar plazzas differentas e – oravant tut – da far avanzar l'encruschament constructiv da tecnologia d'infurmaziun e geografia linguistica cun resursas publicas senza stuair recurrer al support (problematic dal punct da vista giuridic ed economic) da firmas dad IT privatas.
(4) La savida relevanta per il project po vegnir accumulada e modifitgada cuntinuadamain er per spazis da temp pli lungs, schebain che la garanzia dad ina disponibilitad duraivla è anc greva da realisar (cfr. latiers l'infrastructura da perscrutaziun impurtanta CLARIN-D http://de.clarin.eu/de/home.html). En mintga cass n'è la publicaziun dals resultats sin mediums da support concrets (cudeschs, DCs u DVDs) betg pli in in intent central; tuttina vegn stgaffida in'opziun da stampa secundara uschia sco la lexicografia online la porscha mintgatant, uschia p.ex. il Tesoro della Lingua Italiana delle Origini exemplaric.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Tecnologia d'infurmaziun



Transcripziun  (Citar)

Ils materials linguistics vegnan reproducids graficamain en moda dubla per ademplir ils dus princips cuntracurrents da la fidaivladad a la funtauna e da la cumparegliabladad facila:

(1) Versiun d'entrada en la transcripziun originala
En il portal da VerbaAlpina vegnan reunidas funtaunas che derivan da tradiziuns da rom differentas (romanistica, germanistica, slavistica) e che represchentan las fasas istoricamain differentas da la perscrutaziun dialectologica; inqualas datas lexicograficas èn vegnidas relevadas a l'entschatta dal tschientaner passà (GPSR) ed autras pir avant paucs onns (ALD). Perquai èsi necessari dal punct da vista istoric ed epistemic da respectar la transcripziun originala per la pli gronda part. Per raschuns tecnicas èsi dentant nunpussaivel da mantegnair tschertas convenziuns en furma nunmidada. Quai vala en particular per la cumbinaziun da caracters da basa ('bustabs') e segns diacritics, sco p.ex. cura ch'in segn per l'accentuaziun è posiziunà sur in segn per lunghezza sur in vocal sur in segn per armonia (beta code). Questas convenziuns vegnan transformadas en sequenzas linearas da caracters tras transcripziuns tecnicas mintgamai definidas duvrond exclusivamain segns ASCII (uschenumnà Code beta). Faschond la codaziun beta pon ins nizzegiar fin in tschert grad sumeglientschas graficas intuitivamain chapiblas tranter diacritics originals e las currespundenzas ASCII; ellas èn mnemotenicamain favuraivlas.

(2) Versiun output en IPA
Confurm a la cumparegliabladad ed èra a la favuraivladad per ils utilisaders è plinavant giavischaivla la sortida en ina transcripziun unitara. Tut ils beta codes vegnan a vegnir transferids en segns IPA tras rutinas da substituziun specificas. Intginas paucas incumpatibilitads ch'èn dentant inevitablas resultan oravant tut, cura ch'en la transcripziun d'entrada en IPA correspundan dus caracters da basa differents ad in caracter da basa specifitgà cun diacritics. Quai vala surtut areguard il grad d'avertura dals vocals, nua che p.ex. ils caracters da basa <i> e <e> en colliaziun cun il punct d'armonia ed in u dus crutschets d'avertura pussibiliteschan da represchentar sis grads d'avertura en la seria palatala; en la codaziun beta èn quai ils suandants: i – i( – i((– e?-- e – e(– e((. Per reproducir quels stattan en IPA mo quatter caracters da basa a disposiziun: i – ɪ – e – ɛ.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia d'infurmaziun



Uniform Resource Name (URN)  (Citar)

v. Digital Object Identifier

Tags: Tecnologia d'infurmaziun