Metodologia

Zavrada

Alle Einträge anzeigen(!!!)

A   B  C   D   E   F   G   H  I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


Terminologia  (Citar)



(auct. David Englmeier | Filip Hristov | Thomas Krefeld | Stephan Lücke | Christina Mutter | Florian Zacherl)

Tags: Tecnologia d'infurmaziun



Territori da perscrutaziun  (Citar)

In'istorgia cumplessiva e coerenta da las Alps n'è anc betg vegnida preschentada fin qua ("Eine umfassende und kohärente Geschichte der Alpen wurde bisher noch nicht vorgelegt", http://www.hls-dhs-dss.ch/textes/d/D8569.php); plitost concurran differentas definiziuns da las Alps pertutgant il spazi natiral, l'economia e la politica ("naturräumliche" und "wirtschaftlich-politische Alpendefinitionen", Bätzing 1997, 23 f.). Confurm ad ina confinaziun transparenta e pragmatica è il territori da perscrutaziun da quest project vegnì mess a pèr cun il champ d'applicaziun cleramain circumscrit da la Convenziun da las Alps. Las inconsistenzas tranter ils stadis commembers ("Inkonsistenzen zwischen den Mitgliedstaaten", Bätzing 1997, 31) ch'èn definidas là èn vegnidas acceptadas; ellas pertutgan la regiun prealpina bavaraisa (ch'è inclusa), territoris pli gronds a l'ur da las Alps sco l'Emmental u la Part Sura Turitgaisa ch'èn exclus ("größere randalpine Gebiete wie das Emmental oder das Zürcher Oberland", Bätzing 1997, 32) sco era la manipulaziun cun intginas citads pli impurtantas a l'ur da las Alps: Lucerna e Salzburg èn inclusas, Graz e Biella dentant exclusas. Il perimeter da la Convenziun da las Alps pò vegnir chargià giu qua. La vaira finamira dal project è dentant quella da registrar las Alps en quest rom definì formalmain sco spazi linguistic-cultural e da represchentar la sumeglientscha dals lieus appartegnents.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Context extralinguistic



Tipisaziun  (Citar)

La carta interactiva pussiblitescha a l'utilisader da tschertgar trais differents 'tips' linguistics. Mintga 'tip' è d'interpretar sco ina classa d'expressiuns linguisticas; cun quai duai la varietad nunsurvesaivla da las variantas linguisticas numerusas vegnir structurada en maniera survesaivla. I vegnan duvrads criteris fonetics, morfologics e – en il cass dal 'tip da basa' – criteris da l'istorgia da la lingua. La tipisaziun da las datas linguisticas georeferenziadas fa part da las pretaisas fundamentalas da VerbaAlpina. Per quai vegnan, nua ch'igl è pussaivel, extratgs en in emprim pass sunter la transcripziun tokens ('pleds singuls') da las datas d'entrada che vegnan lura registrads en il champ da la banca da datas da medem num.

El center dagl interess da VerbaAlpina stat la tipisaziun morfologica dal material linguistic collectà. In tip morfologic vegn definì da la congruenza da las caracteristicas suandantas: famiglia da linguas – spezia da pled – pled simpel vs. pled affixà – genus – tip da basa lexicala. La furma numinala dal tip morfologic s'orientescha finalmain als lemmas correspundents da lexicons da referenza tschernids (v. sut).

Tras l'assegnaziun ad in tip da basa lexical cuminaivel vegn clera la parentella da tut ils tips morfolexicals unids – era sur ils cunfins linguistics ora. Uschia sa laschan assegnar ils nomens e verbs suandants (che n'èn betg descrits qua en detagl) ad in tip da basa unic: malga (ALP, MUVEL), malgaro (SIGNUN), malghese (PASTUR), immalgare (CHARGIAR L'ALP), dismalgare (STGARGIAR). Il tip da basa lexical na palaisa dentant nagut sin l'istorgia da pled d'in tip morfolexical singul: i sto mintgamai vegnir elavurà separadamain sch'in tip cun etimon latin-neolatin ch'oz è cumprovà en il territori linguistic german ni sloven, sco p.ex. sloven bajta 'chasa simpla', deriva da substrat anteriur local u plitost da contact linguistic neolatin pli recent. Per questa raschun vegn evitada la designaziun "etimon" en quest context cunquai ch'ella sa referescha per princip al prestadi istoric immediat d'in pled; tuttina è il tip da basa lexical en blers cas per propi era l'etimon d'in tip morfolexical.

Ils tips morfolexicals furman la categoria dirigenta en l'administraziun da las datas linguisticas. Els èn cumparegliabels als lemmas da la lexicografia. Tras ils criteris surmenziunads, solids e bain operaziunalisabels pon ins reducir p.ex. ils quatter tips fonetics barga, bark, margun, bargun cun la significaziun TEGIA D'ALP, STALLA D'ALP a trais tips morfolexicals.

L'appartegnientscha dals tips morfolexicals a las famiglias da linguas (gem., roa., sla.) dependa da la funtauna respectiva; ella resulta automaticamain tras ils infurmants e vegn notada correspondentamain en la banca da datas en il cas da datas d'atlas u dicziunaris ch'èn stadas registradas tradiziunalmain. En il cas da las datas che VerbaAlpina releva sez tras crowdsourcing inditgeschan ils infurmants lur appartegnientscha linguistica resp. dialectala che vegn cumprovada en il cas ideal quantitativamain; il dumber dals infurmants confermativs daventa uschia in instrument per la validaziun da datas.

Tips morfolexicals èn limitads ad ina famiglia da linguas. Quai caschuna la dumonda suandanta: tgei furma vegn duvrada per represchentar in tip morfolexical en la funcziun da retschertga da la charta interactiva? Pertutgant la famiglia da linguas germana e la famiglia da linguas slava è la resposta plitost simpla; omaduas èn represchentadas be d'ina lingua standardisada ('Deutsch' [deu] resp. 'Slowenisch' [slo]). Ils tips morfolexicals pon vegnir represchentads en furma da lur variantas da la lingua da standard, evidentamain sut la cundiziun ch'i dat equivalents dal tip en la lingua da standard. Uschia pon p.ex. ils tips fonetics correspundents da l'aleman e dal bavarais ch'èn variantas da la furma da standard vegnir clamads tranter questa furma da standard. Sch'i na dat betg variantas da standard per in tip, vegni fatg diever dals lemmas dals gronds dicziunaris da referenza dialectals (Idiotikon, WBÖ).

En il cas da la famiglia da linguas neolatina è la situaziun zunt pli cumplexa pervia da las linguas minoritaras numerusas, parzialmain betg avunda standardisadas. Per raschuns pragmaticas è vegnida tschernida la soluziun suandanta: tut ils tips morfolexicals vegnan, sche existents, represchentads da furmas da standard franzosas e talianas. Uschia pon p.ex. tut ils tips fonetics ch'èn variantas da beurre/burro 'paintg' vegnir clamads tranter questas duas furmas; TLF e Treccani fan da dicziunaris da referenza. Sche be ina da questas duas linguas da standard ha ina varianta correspundenta, cumpara mo questa, sco en il cas da ricotta (l'appartegnientscha al talian vegn inditgada da la convenziun da notaziun -/ricotta). Sch'i na dat betg ina varianta dal tip en nagina da las duas linguas da referenza neolatinas, vegni fatg diever dal lemma d'in diciziunari da referenza dialectal, sco p.ex. LSI. En cas ch'i na dat nagins lemmas vardaivels en dicziunaris dialectals, propona VerbaAlpina in tip da basa che vegn represchentà graficamain da la sigla 'VA'.

Igl è previs da tipisar il material linguistic era foneticamain. Quest pass è dentant periferic e na vegn betg realisà consequentamain. La categoria correspundenta è indispensabla surtut perquai ch'atlas linguistics (p.ex. SDS e VALTS) e dicziunaris documenteschan mintgatant mo tips fonetics. Tar la tipisaziun fonetica vegnan ils tokens classifitgads tenor criteris da la fonetica istorica (champ da la banca da datas 'phon_typ'). In exempel tipic (da l'AIS 1204 LA PANNA | RAHM | CRÈME):




I fa segn tenor la fonetica da distinguer las variantas da sun inizial [kr-] e [gr-] sco er las variantas da vocal accentuà [a], [e] e [o] davant [m].


In'automatisaziun da la tipisaziun fonetica sin basa dad algoritmus Levenshtein e soundex vegn examinada e sche pussaivel realisada.

Tras la tipisaziun (furmaziun da classas) daventa la varietad da datas pli e pli survesaivla; i vala pia la regla: dumber dals tokens > dumber dals tips fonetics > dumber dals tips morfolexicals > tip da basa. Ins remartgia dentant il cas extrem d'ina cumprova suletta (hapax) che correspunda ad in token, in tip fonetic ed in tip morfolexical sco unic represchentant d'in tip da basa. Eventualmain èsi raschunaivel da filtrar ora talas furmas da hapax da la preschentaziun.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica



Transcripziun  (Citar)

Ils materials linguistics vegnan reproducids graficamain en moda dubla per ademplir ils dus princips cuntracurrents da la fidaivladad a la funtauna e da la cumparegliabladad facila:

(1) Versiun d'entrada en la transcripziun originala
En il portal da VerbaAlpina vegnan reunidas funtaunas che derivan da tradiziuns da rom differentas (romanistica, germanistica, slavistica) e che represchentan las fasas istoricamain differentas da la perscrutaziun dialectologica; inqualas datas lexicograficas èn vegnidas relevadas a l'entschatta dal tschientaner passà (GPSR) ed autras pir avant paucs onns (ALD). Perquai èsi necessari dal punct da vista istoric ed epistemic da respectar la transcripziun originala per la pli gronda part. Per raschuns tecnicas èsi dentant nunpussaivel da mantegnair tschertas convenziuns en furma nunmidada. Quai vala en particular per la cumbinaziun da caracters da basa ('bustabs') e segns diacritics, sco p.ex. cura ch'in segn per l'accentuaziun è posiziunà sur in segn per lunghezza sur in vocal sur in segn per armonia (Code beta). Questas convenziuns vegnan transformadas en sequenzas linearas da caracters tras transcripziuns tecnicas mintgamai definidas duvrond exclusivamain segns ASCII (uschenumnà Code beta). Faschond la codaziun beta pon ins nizzegiar fin in tschert grad sumeglientschas graficas intuitivamain chapiblas tranter diacritics originals e las currespundenzas ASCII; ellas èn mnemotenicamain favuraivlas.

(2) Versiun output en IPA
Confurm a la cumparegliabladad ed èra a la favuraivladad per ils utilisaders è plinavant giavischaivla la sortida en ina transcripziun unitara. Tut ils beta codes vegnan a vegnir transferids en segns IPA tras rutinas da substituziun specificas. Intginas paucas incumpatibilitads ch'èn dentant inevitablas resultan oravant tut, cura ch'en la transcripziun d'entrada en IPA correspundan dus caracters da basa differents ad in caracter da basa specifitgà cun diacritics. Quai vala surtut areguard il grad d'avertura dals vocals, nua che p.ex. ils caracters da basa <i> e <e> en colliaziun cun il punct d'armonia ed in u dus crutschets d'avertura pussibiliteschan da represchentar sis grads d'avertura en la seria palatala; en la codaziun beta èn quai ils suandants: i – i( – i((– e?-- e – e(– e((. Per reproducir quels stattan en IPA mo quatter caracters da basa a disposiziun: i – ɪ – e – ɛ.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia d'infurmaziun