Metodologia

Selezione

Mostrare tutti i contributi

A   B  C   D   E   F   G   H  I   J  K  L   M   N   O   P   Q  R   S   T   U   V   W   X  Y  Z 


Partecipa!  (Citazione)

VerbaAlpina è lieta di ricevere qualsiasi tipo di appoggio e offre diverse modalità di partecipazione attiva al progetto.

La partecipazione può riguardare ad esempio la trascrizione di dati presenti in fonti scritte come in atlanti linguistici e dizionari, di organizzare i dati in banche dati e di controllare la correttezza delle trascrizioni già effettuate, oppure di tipizzare materiale già trascritto e di associare dei lemma lessicali.

Siamo interessati a ricevere materiale linguistico attuale, non ancora pubblicato in fonti scritte come atlanti linguistici o dizionari. Coloro i quali possiedono conoscenze di un dialetto parlato in territorio alpino, sono invitati a inserire parole ed espressioni nella banca dati di VerbaAlpina. Questa funzionalità rende possibile l'ampliamento dei dati già presenti in fonti scritte e, di conseguenza, permette di poter riconoscere e osservare i processi dinamici del mutamento linguistico. La qualità del riconoscimento e l'osservazione di tali fenomeni sarà direttamente proporzionale al numero di persone che prendono parte al progetto. -Siete in possesso di immagini raffiguranti elementi tipicamente alpini? Per esempio foto di alpeggi, baite, flora, fauna, montagne e paesaggi? Potete caricarle all'interno della nostra mediateca indicando a quando data la foto, cosa rappresenta e – qualora ne siate a conoscenza- indicate un'espressione dialettale specifica per la denominazione di ciò è che raffigurato in foto.

Parallelamente alla partecipazione diretta al progetto VerbaAlpina, ogni utente può usufruire della possibilità di creare un proprio ambiente di ricerca, utile per la raccolta di dati in primo luogo linguistici, ma ampliabile anche a altri tipi di dati. L'unico requisito richiesto è che i dati siano georeferenziati. Esiste inoltre la possibilità di raccogliere tali dati esclusivamente per un utilizzo personale attraverso una chiave di accesso, ma anche di aprire l'accesso ad altri utenti ad esempio al fine di discutere o commentare. Vi invitiamo comunque a rendere disponibili in libero accesso il numero massimo di dati a vostra disposizione. Solo in questo modo è possibile ampliare il potenziale delle tecnologie di condivisione attraverso banche dati o reti.

Per sostenere VerbaAlpina, e/o per utilizzare il sistema per i propri interessi, è necessario effettuare una registrazione sul nostro portale: https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register

(auct. Stephan Lücke – trad. Beatrice Colcuc)



Polirematiche  (Citazione)

Il termine"polirematiche" indica per VerbaAlpina una sequenza specifica di singole parole (tokens) che insieme rimandano ad un concetto preciso o anche a concetti diversi. Così, per esempio, in val Gardena (AIS 1192_1, 312) il concetto Concetto ALMHÜTTE viene chiamato casa da fuoco (ʧˌaz dɑ fˈuɑk); in altri dialetti (nell'Engadina, in Ticino ed altri) questa composizione denomina il concetto KÜCHE.

Dal punto di vista informatico sorge qui il problema di un'associazione di concetti a più strati da illustrare in un modello relazionale di dati: oltre al significato delle parole polirematiche, le parole singole possiedono significati propri che permettono di vedere la motivazione della produzione delle polirematiche. Per considerare questa particolarità nella banca dati di VerbaAlpina vengono usati i cosiddetti gruppi di token. Qui un'attestazione che consiste in più parole singole viene separata e i suoi componenti vengono deposti nella tabella 'tokens'. Ciascuno di questi fa riferimento ad una stessa voce nella tabella 'gruppi token' e in più memorizza la sua posizione nel gruppo token (primo, secondo posto ecc.): è possibile ricostruire, così, le polirematiche tramite i token singoli. Di conseguenza una memorizzazione esplicita delle polirematiche non è necessaria; nella tabella 'gruppi token' vengono collocate solo ulteriori informazioni (a parte il ID del gruppo token), che non sono ricostruibili in base ai singoli token, come per esempio il genere del gruppo.

Un'associazione di concetti viene effettuata sia a livello dei singoli token che a livello dei gruppi di token. In base all'esempio sopra riportato esistono, così, tre stesure nella tabella token alle quali sono assegnati diversi concetti concetto:



L'assegnazione di concetti alle componenti avviene con l'aiuto dei dizionari. Ad ogni concetto subordinato viene connessa l'annotazione più frequente del dizionario. Dato che i concetti subordinati non sono stati consultati, è possibile che essi, in parte, non corrispondono alla realtà.

Esiste, inoltre, un'indicazione nella tabella 'gruppi token' con una propria connessione al concetto:



Nell'illustrazione cartografica, sulla superficie di VerbaAlpina i tokens e i gruppi token vengono considerati di pari livello, così la ricerca del concetto ALMHÜTTE mostra sia gruppi di token che tokens collegati a questo concetto. Le singole parole attestate solo come una parte di una parola polirematica vengono conformemente indicate.

(auct. Stephan Lücke | Florian Zacherl – trad. Monika Hausmann)

Tags: Linguistica



Principi FAIR  (Citazione)

Nel 2016, un grande numero di scienziati provenienti da diversi Paesi ha pubblicato sulla rivista Nature un articolo sulla formulazione di linee guida per la gestione dei dati di ricerca (Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/dati.2016.18 (2016). ?). Le idee presentate in questa pubblicazione si riferiscono a un workshop svoltosi nel gennaio 2014 presso il Lorentz Center dell'Università di Leiden nei Paesi Bassi. Il titolo del workshop era: Jointly designing a data FAIRPORT

Nel frattempo, le idee riassunte nell'acronimo FAIR si sono affermate come punto di orientamento nell'attuale dibattito sul corretto trattamento dei dati di ricerca. Questa tendenza è emersa chiaramente durante l'incontro del progetto GeRDI di ottobre 2018; cfr. anche FAIRGROUP della Community FORCE11).

L'acronimo FAIR riassume quattro postulati centrali, in parte interdipendenti, su cui dovrebbero basarsi il trattamento dei dati di ricerca (?):

  • F — Findable
  • A — Accessible
  • I — Interoperable
  • R — Reusable

Queste quattro parole centrali comportano implicitamente una serie di conseguenze per la gestione dei dati digitali di ricerca.

Affinché i dati siano ritrovabili, dovrebbe esistere almeno un portale centrale attraverso il quale è possibile far partire la ricerca. Sarebbe utile incorporare la documentazione dei dati di ricerca all'interno dei cataloghi delle biblioteche già creati da lungo tempo (si tratta essenzialmente del loro contenuto e del loro luogo di conservazione). I concetti che implicherebbero una ricerca in luoghi diversi sarebbero invece da evitare.

Per essere trovati, i dati devono essere fisicamente esistenti. Non si tratta tanto di una questione di realizzazione tecnica, che può essere realizzata ad esempio dai centri informatici esistenti, quanto piuttosto di una responsabilità istituzionale. Le biblioteche che, per la loro storia, il loro ruolo di custodi del sapere così come per la loro prospettiva di conservazione a lungo termine, possono essere considerate candidati ineguagliabili a questo compito. Queste dovrebbero assumersi la responsabilità per la conservazione sostenibile dei dati digitali. In quale forma avvenga questo, sia che le biblioteche costituiscano propri repositori oppure che amministrino quelli forniti dai centri informativi, non è di vitale importanza e può essere gestito singolarmente per ogni caso.

Un ruolo di grande importanza, ricoprono invece l'ideazione e l'assegnazione dei metadati attraverso i quali devono essere resi disponibili i dati della ricerca vera e propria. Risulta indispensabile utilizzare almeno uno schema di metadati gerarchicamente strutturato e vincolante che permetta una categorizzazione dei contenuti dei dati di ricerca memorizzati con l'integrazione di vocabolari controllati. Per il momento, VerbaAlpina ha deciso di orientarsi al Datacite-Schema, un sistema ampiamente utilizzato e scelto anche dalla biblioteca universitaria della LMU. L'utilizzo di diversi schemi di metadati concorrenti sarebbe possibile, ma significativo solo se vengono creati in modo coerente per tutti i dati di ricerca raccolti. Gli schemi di metadati specifici subordinati possono rappresentare un'integrazione significativa per gli schemi di metadati di livello superiore.

Il termine "accessible" indica la possibilità di accedere ai dati senza limitazioni di tipo legale come è il Copyright. Questo punto è meno influenzato da coloro che raccolgono o producono i dati. Oltre al diritto d'autore, durante la raccolta dei dati deve essere spesso osservata la protezione dei diritti personali. La domanda di accessibilità punta a garantire che tutti i dati generalmente non soggetti a restrizioni legali, non siano resi protetti da tali restrizioni da parte dei produttori stessi dei dati. Concretamente, ciò significa innanzitutto rinunciare al diritto d'autore e utilizzare un modello di licenza conforme alle condizioni del libero accesso. L'utilizzo delle licenze Creative Commons (CC) è molto diffuso in ambito scientifico, anche se non tutte soddisfano i criteri per il libero accesso. In particolare, il divieto di uso per scopi commerciali, che può far parte di una licenza CC, viola il concetto di libero accesso. Il motivo è che quasi tutti gli usi dei dati possono essere considerati come "uso commerciale" in determinate circostanze, e, dal punto di vista giuridico, è praticamente impossibile tracciare una linea di demarcazione chiara a riguardo (si veda anche l'articolo "Licenze").

Così come la "trovabilità" dei dati, anche l'interoperabilità consiste in due aspetti, uno tecnico e uno teorico-organizzativo. Spesso è necessaria una granulazione logica e libera dei dati al fine di poter collegare con successo gli stock dei dati tra loro e per consentire le relazioni tra gli stessi. In tale contesto, i cosiddetti "Dati standard" ricoprono un ruolo centrale: essi rappresentano categorie concettuali ben definite e, idealmente standardizzate le cui singole istanze (oggetti digitali) sono distinte in relazione a un tipo e a un numero di proprietà chiaramente definite. L'assegnazione di identificatori numerici o alfanumerici ("ID"s) ai singoli oggetti di una categoria concettuale, consente il riferimento univoco agli oggetti. La granualzione degli stock di dati lungo i confini delle categorie e delle loro singole istanze/dei loro singoli oggetti, in combinazione con l'uso di identificatori specifici, consente quindi di collegare insiemi di dati separati con contenuto congruente. Tuttavia, il vero valore aggiunto si ottiene solamente quando è anche tecnicamente possibile fare riferimento direttamente ai singoli oggetti e quindi spostarsi da un database a un altro in un solo click. Questo è possibile solo se a ogni singolo dato ("Granum") viene assegnato un proprio URL. Ai fini della sostenibilità, ad ogni singolo URL deve essere assegnato anche un DOI.

Il riutilizzo degli stock di dati è il risultato finale dell'attenta osservazione e dell'attuazione dei tre postulati precedenti.

VerbaAlpina si impegna a conformare tutte le procedure e i regolamenti relativi ai dati con i principi FAIR. Thomas Krefeld considera questo impegno come la base fondamentale dell'etica nella ricerca all'interno dell'informatica umanistica (Thomas Krefeld [2018]: Linguistische Theorien im Rahmen der digital humanities. Korpus im Text. Version 2 (05.11.2018, 11:35). Absatz 4. url: http://www.kit.gwi.uni-muenchen.de/?p=28010&v=2#p:4.). La cooperazione con la biblioteca universitaria della LMU e con il progetto finanziato dal DFG GeRDI, attualmente realizzato nell'ambito del progetto e-humanities – interdisziplinär, permette la trovabilità dei dati. In particolare, il database centrale del Modulo VA_DB è dotato dei metadati di quella versione e trasferito alla biblioteca universitaria della LMU in varie forme, dove è memorizzato nell'Open-Data-Repositorium. I metadati, per lo meno, sono poi incorporati nell'indice attualmente in fase di creazione nell'ambito del progetto GeRDI. L'obiettivo è quello di rendere accessibili i dati raccolti ed elaborati da VerbaAlpina attraverso il catalogo della biblioteca universitaria e anche attraverso il portale di ricerca del progetto GeRDI, ancora in fase di sviluppo. Tutti i dati gestiti da VerbaAlpina saranno, per quanto possibile, inseriti in una licenza Creative Commons in libero accesso (fino alla versione 18/1 CC BY SA 3.0, dalla versione 18/2 CC BY SA 4.0). L'interoperabilità si ottiene da un lato attraverso la granulazione dello stock di dati, che si basa anche sul concetto di norme standard, collegando i dati standard esistenti con il materiale di VerbaAlpina. Questo è possibile, ad esempio, con dati geografici come le unità politiche, che rappresentano il sistema di riferimento geografico centrale di VerbaAlpina. Per le categorie di dati "Tipi morfolessicali" e "concetto", centrali per VerbaAlina, sono esistenti solo in parte, dati standard ai quali i dati VerbaAlpina potrebbero essere correlati. In questi casi, VerbaAlpina si sforza di creare, in collaborazione con istituzioni predestinate come la Biblioteca Nazionale Tedesca (DNB), dati standard o categorie di dati standard corrispondenti. Al fine di soddisfare i requisiti tecnici per un'efficiente interoperabilità, il materiale centrale dei dati lessicali viene memorizzato in un gran numero di piccoli file, ai quali è possibile accedere tramite DOI individuali su Open Data LMU. Inoltre, ad ogni singolo file è allegato un file di metadati in formato Datacite, che nella sua interezza permette di trovare i singoli file attraverso il catalogo della biblioteca.



(auct. Stephan Lücke – trad. Beatrice Colcuc)

Tags: Tecnologia dell'informazione



Profilo di similarità etnolinguistica  (Citazione)

Dal punto di vista etnolinguistico di questo progetto i tipi di base formano il fondamento dello spazio alpino plurilingue. Al fine di realizzare una raffigurazione sintetica, sono previste due funzioni diverse di mappatura quantitativa:
  1. Innanzitutto le voci alpine sono di interesse particolare; il loro insieme forma – per così dire – un tipo astratto ideale a cui si avvicinano più o meno i singoli dialetti locali. A questo corrisponde la mappatura della similarità graduale ispirata dalla raffigurazione del champ gradient de la gasconité nel ALG 6.
  2. Quindi verrà mappato (secondo il modello dell'ASD) il grado di similarità relativa di tutte le località di rilevamento, comparando e visualizzando i tipi di base che una qualsiasi località di rilevamento e una qualsiasi altra località hanno come punto di riferimento in comune.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistica Contesto extralinguistico



Pubblicazione  (Citazione)

La pubblicazione diretta di risultati, indipendente da case editrici, è parte integrante di VerbaAlpina. Non tutto quello che è chiamato pubblicazione serve alla PUBBLICAZIONE. Il mezzo tradizionale della stampa causa il contrario dello scopo per il quale è stato inventato: sottrae infatti informazioni al pubblico. Informazioni, queste, che dovrebbero essere offerte su larga scala visto il sostegno che la ricerca riceve attraverso i fondi pubblici. Tali informazioni potrebbero inoltre essere fornite facilmente al pubblico utilizzando i nuovi media. Le tirature di carta di 200 o 300 copie, solite nelle scienze non creano un 'pubblico' inclusivo, bensì una sfera privata esclusiva. In considerazione delle tecnologie dell'informazione facilmente disponibili, non esiste dunque nessuna ragione plausibile di preferire la stampa come mezzo di diffusione del sapere o, addirittura, di considerare quest'ultima come soluzione assoluta. Inoltre viene da credersi – al contrario – perché gli scienziati dovrebbero appoggiare la creazione di media sistematicamente limitanti la diffusione dei propri dati di ricerca.
In certe discipline (a quanto ci risulta questo vale tra l'altro per l'informatica) si sta facendo avanti persino una tendenza che rende assurde le possibilità tecniche create proprio dai nuovi media: nonostante sarebbe molto più facile concedere un accesso aperto a informazioni e testi, succede ormai il puro contrario, ovvero concedendo un accesso puramente tramite un pagamento. Tale consuetudine rappresenta addirittura un passo indietro rispetto alla pubblicazione su carta tradizionale, messa in discussione da noi stessi. A questo proposito vogliamo insistere sull'urgenza di evitare tali sviluppi che possono già essere osservati pure nelle scienze umane.
Bisogna aggiungere però che è anche cambiato il senso dell'espressione 'pubblicazione'.
In senso stretto, la documentazione di dati su internet può già essere considerata come una forma di pubblicazione. Oltre a ciò, VerbaAlpina è pensato anche come strumento per la pubblicazione di testi relativi al progetto. A questo scopo sono previsti essenzialmente tre formati:
  1. Termini e problemi centrali dai punti di vista teorico e/o metodologico sono descritti in modo conciso sotto il tab Metodologia.
  2. Studi che analizzano risultati del progetto in dettaglio o discussioni teoriche o metodologiche possono essere inserite nella sezione Pubblicazioni .
  3. I commenti a singoli tipi linguistici vengono aperti attraverso un button 'i' nella legenda della carta. Possono essere inseriti anche molto facilmente da collaboratori del progetto o persone esterne.


Funzione di commento accessibile tramite la legenda della carta

(auct. Thomas Krefeld – trad. Beatrice Colcuc | Susanne Oberholzer)

Tags: Ambiti di funzione



Pubblico  (Citazione)

La pubblicazione diretta di risultati, indipendente da case editrici è parte integrale di VerbaAlpina. Non tutto quello che è chiamato pubblicazione serve alla PUBBLICAZIONE. Così il mezzo tradizionale dell'impressione causa l'assoluto contrario: sottrae delle informazioni al pubblico, informazioni che, considerando il sostegno di ricerca tramite fondi pubblici, gli dovrebbero essere offerte, per quanto possibile. Queste informazioni potrebbero inoltre essere fornite facilmente al pubblico utilizzando i nuovi media. Le tirature di carta di 200 o 300 copie, usuali nelle scienze, non creano un 'pubblico' inclusivo, bensì una sfera privata esclusiva. In considerazione delle tecnologie dell'informazione facilmente disponibili, non esiste dunque nessuna ragione plausibile di preferire la stampa come mezzo della diffusione del sapere, o di considerare la stampa come soluzione assoluta.
In certe discipline (a quanto ci risulta questo vale tra l'altro per l'informatica) c'è persino una tendenza che rende assurde le possibilità tecniche create con i nuovi media: mentre sarebbe cosa facile concedere un accesso comodo e aperto a informazioni e testi, succede ormai il puro contrario aprendo l'accesso corrispondente soltanto su pagamento. Questo rappresenta persino un passo indietro rispetto alla pubblicazione su carta tradizionale, da noi criticata. In questo contesto vogliamo insistere sull'urgenza di evitare tali sviluppi che possono già essere osservati pure nelle scienze umane.




(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Pagina Web



Punti di rilevamento  (Citazione)

I nomi dei punti di rilevamento vengono assunti secondo la fonte anche se nella scrittura originale sono presenti errori di ortografia. Qualora due punti di rilevamento diversi dovessero portare lo stesso nome, si procede aggiungendo la denominazione aggiuntiva locale (se presente e necessaria), come nei seguenti esempi: Brixen im Thale, St. Johann in Tirol. Le specificazioni sono presenti soprattutto in Austria e risultano essere molto utili nella distinzione dei diversi punti di rilevamento.
Molto spesso, però, i piccoli borghi non dispongono di denominazioni aggiuntive locali. In questi casi, dopo il nome del punto di rilevamento si inserisce il nome del comune al quale la località in questione appartiene come ad esempio in St. Magdalena (Gries), St. Magdalena (Villnöss).

(auct. Mona Neumeier – trad. Beatrice Colcuc)

Tags: Linguistica