Metodologia

Selezione

Mostrare tutti i contributi

(no Tag)   Contesto extralinguistico   Ambiti di funzione   Tecnologia dell'informazione   Linguistica   Pagina Web  


Archiviazione a lungo termine (CITAZIONE)

Tutti i dati del progetto VerbaAlpina vengono gestiti in modo tale che rimangano leggibili e utilizzabili per un periodo il più lungo possibile. La prospettiva temporale presa in considerazione dal progetto comprende diversi decenni, sebbene il concetto che sta alla base sia orientato ad una conservazione dei dati senza limite temporale.

Vengono considerati i seguenti aspetti:
1. Quale istituzione viene incaricata/quali istituzioni vengono incaricate della conservazione dei dati e rispettivamente dei supporti in questione?
2. Documentazione della strutturazione dei dati così come delle relazioni logiche tra dati e categorie di dati (entità-relazione);
3. Documentazione delle codifiche di carattere impiegate.

Più copie dei dati del progetto dovranno essere archiviate presso più istituzioni diverse. Tale compito è attualmente affidato all'IT-Gruppe Geisteswissenschaften della LMU (vale a dire il gruppo di tecnologia dell'informazione del dipartimento di scienze umane dell'Università di Monaco di Baviera, ITG). Questo gruppo è legato ai server di archiviazione del Leibniz-Rechenzentrum, così come al BAS Clarin Repository.
Il progetto prevede il deposito di ulteriori copie di backup presso altre istituzioni appropriate. L'archiviazione segue il ciclo previsto per il controllo versione. Il database viene archiviato con tutti i dati del progetto (modulo VA_DB insieme al modello entità-relazione); lo stesso vale per il framework web (VA_WEB), responsabile per la presentazione dei dati nel web (inclusa la rispettiva funzionalità): in questo modo è possibile (almeno in teoria) effettuare un "richiamo" di ogni singola versione in rispettivi ambienti di sistema operativo o di software emulati. Soggetta ad archiviazione è, inoltre, la mediateca che contiene soprattutto foto, film, testi e documenti audio (modulo VA_MT).

Il sito di VerbaAlpina (VA_WEB) viene salvato ad intervalli irregolari nell'archivio internet https://archive.org. All'indirizzo https://web.archive.org/web/*/http://verba-alpina.gwi.uni-muenchen.de/ è possibile recuperare le versioni precedenti di VerbaAlpina. La versione più vecchia ivi inserita risale al 10 novembre del 2014. Le archiviazioni si effettuano in parte in automatico tramite "Wayback"-Crawler fornito da archive.org, e in parte attivamente tramite VerbaAlpina, che dal 2018 si prefigge una revisione del sito da compiere a scadenze regolari (ogni 6 mesi).

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Codepage (CITAZIONE)

In VerbaAlpina sono riuniti dati provenienti da fonti di carattere diverso: dati da atlanti linguistici e dizionari cartacei che devono in un primo tempo essere digitalizzati, così come dati già esistenti in forma elettronica e messi a disposizione da alcuni partner di cooperazione. Ognuna di queste fonti utilizza un sistema di trascrizione più o meno individuale. Per attuare una standardizzazione sono necessarie delle liste in cui si stabilisce quale corrispondenza trovino determinati caratteri, propri di un sistema di trascrizione di una specifica fonte, nel sistema di trascrizione di un'altra fonte. Si tratta essenzialmente di rappresentare i diversi sistemi di trascrizione nell'alfabeto fonetico internazionale (IPA) che funge da trascrizione di referenza per VerbaAlpina. Per adattare un sistema di trascrizione specifico di una fonte al sistema IPA è necessaria la costruzione di una lista completa in forma di tabella contenente tutte le corrispondenze dei caratteri. Tale tabella viene chiamata "codepage". Di seguito viene presentato un estratto dalla codepage, basilare per la conversione del sistema di trascrizione dell'AIS in IPA. Questa codepage contiene intorno alle 4500 righe/associazioni in totale:

erhebung Beta IPA HEX
AIS a1{a} ɑ̆ x0251;x0306;
AIS a1{e} ɜ x025c;
AIS a1{i} ɑĭ x0251;x0069;x0306;
AIS a1{o} ɞ x025e;
AIS a1{u} ɤ x0264;
AIS a1| ɐ x0250;
AIS a1|- ɐː x0250;x02d0;
AIS a1|0 ɐ̆ x0250;x0306;
AIS a1~ ɑ̃ x0251;x0303;
AIS a1~- ɑ̃ː x0251;x0303;x02d0;

La colonna 'BETA' contiene i caratteri utilizzati nell'AIS nella forma trascritta secondo il principio del codice beta; la colonna 'IPA' contiene il carattere IPA corrispondente, e la colonna 'HEX' contiene il valore numerico specifico (/i valori numerici specifici) della tabella Unicode che corrisponde(/corrispondono) al rispettivo carattere IPA.

Per una panoramica completa delle codepage di tutte le fonti di VerbaAlpina si veda qui.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia dell'informazione



Codice beta (CITAZIONE)

Seguendo la terminologia del Thesaurus Linguae Graecae (TLG), nell'ambito di VerbaAlpina la trascrizione di sistemi di scrittura complessi con l'impiego esclusivo di caratteri ASCII viene denominata come "codice beta". Il TLG ha sviluppato il concetto corrispondente all'inizio degli anni settanta del Novecento per il rilevamento di testi greci antichi con i mezzi digitali allora disponibili. La grafica seguente illustra la tecnica in base all'esempio dell'Atlante italo-svizzero (AIS):





In un primo tempo viene fatta una semplice distinzione tra carattere di base e segni diacritici nel momento in cui si trasferisce la trascrizione fonetica secondo Böhmer-Ascoli, utilizzata nell'atlante linguistico, in sequenze che consistono in caratteri ASCII. Se un carattere di base è presente nel codice ASCII, questo segno rappresenterà se stesso (cosa possibile nell'esempio presentato). Direttamente dopo il carattere di base seguono tutti i diacritici legati ad esso; ogni diacritico viene sostituito da un carattere ASCII speciale. L'attribuzione dei diacritici a caratteri ASCII è univoca all'interno di VerbaAlpina e viene documentata in tabelle speciali nel database di VerbaAlpina. La scelta dell'attribuzione è guidata, per quanto possibile, dal principio della somiglianza ottica. Nell'esempio menzionato, l'uncino sotto la u nella parola tu viene rappresentato da una parentesi tonda aperta: tu(. I diacritici vengono scritti seguendo l'ordine della loro disposizione rispetto al carattere di base: si scrivono nell'ordine dal basso all'alto e da sinistra a destra dopo il carattere di base. I segni diacritici vengono attribuiti a caratteri ASCII indipendentemente dalla semantica specifica della fonte corrispondente a causa del principio della somiglianza ottica. Ciò significa che: anche se un uncino sotto un carattere di base ha un significato fonetico completamente diverso in una certa fonte rispetto a un'altra fonte, in VerbaAlpina entrambi gli uncini vengono rappresentati da una parentesi posposta. Le differenze semantiche vengono documentate nelle tabelle di trascrizione che sono specifiche per ogni fonte: regolano la conversione del codice beta alla trascrizione output secondo IPA (una stessa codifica beta può dunque essere presente in codifiche IPA completamente diverse a seconda della fonte).
Il procedimento descritto è vantaggioso da diversi punti di vista:
- Il rilevamento dei dati avviene sulle tastiere standard in una velocità comparativamente alta ed è indipendente dal sistema operativo.
- Le persone che trascrivono non hanno bisogno di conoscenze di sistemi di trascrizione fonetici.
- Si può rilevare qualsiasi carattere rispettivamente diacritico, indipendentemente dal fatto che siano cifrate in Unicode o meno
- Il rilevamento dei dati elettronico avviene senza perdita d'informazione.
Attraverso la routine di sostituzione, il codice beta può essere trasferito in quasi qualsiasi altro sistema di trascrizione. Sull'onda di queste conversioni si può incorrere eventualmente in una perdita d'informazioni, perdita che però è causata dalla natura dei sistemi di trascrizione stessi. La trascrizione fonetica secondo Böhmer-Ascoli fa una distinzione tra i diversi gradi di apertura in modo molto più dettagliato di quanto sia previsto dal sistema IPA.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia dell'informazione



Concessione di licenze (CITAZIONE)

I moduli di VerbaAlpina (VA_DB, VA_WEB e VA_MT) e i dati contenuti in questi sono soggetti alle seguenti licenze Creative Commons:




CC BY-SA 3.0 DE (http://creativecommons.org/licenses/by-sa/3.0/it/; "Attribuzione, StessaLicenza") (dipendente dall'oggetto) rispettivamente




CC BY-NC-SA 3.0 DE (http://creativecommons.org/licenses/by-nc-sa/3.0/it/; "Attribuzione, NonCommerciale, StessaLicenza").

Singoli file nel modulo VA_MT che VA ha ricevuto o comprato da fonti di dati esterne possono essere soggette al Copyright. Gli oggetti nel modula VA_MT vengono marcati individualmente con segni caratteristici corrispondenti.

Il sistema di concessione di licenze così come anche i diritti d'accesso dei diversi gruppi di utenti VA è documentato dalla grafica seguente:





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione Pagina Web



Controllo versione (CITAZIONE)

VerbaAlpina consiste nei moduli seguenti:

-VA_DB: file di dati nel database del progetto (MySQL) (va_xxx)
-VA_WEB: codice di programma dell'interfaccia web del portale www.verba-alpina.gwi.uni-muenchen.de insieme al database Wordpress (va_wp) che ci appartiene
-VA_MT: file media (foto, film, testi e documenti audio) che si trovano nella mediateca dell'interfaccia web

Tutti e tre i moduli formano un'unità consistente, con connessioni e dipendenze corrispettive, e non possono perciò essere separati l'uno dall'altro. Durante la durata del progetto lo stato attuale dei moduli VA_DB e VA_WEB viene "congelato" ogni sei mesi, il 15 giugno e il 15 dicembre di ciascun anno, e in modo simultaneo sotto forma di una copia elettronica. A queste copie congelate sono attribuite dei numeri di versione secondo lo schema [anno civile]/[numero di serie] (per esempio 15/1). Alla versione VA alla volta produttiva è attribuita la denominazione XXX (cfr. modo di citare).

La produzione di copie della mediateca VA (VA_MT) è impedita a causa della dimensione molto grande dei file media. Per questa ragione non si fanno delle copie di questo modulo sull'onda del processo di controllo versione. Gli elementi una volta deposti nella mediateca VA non possono più essere eliminati, quando una versione VA è connessa a essi.

Nel portale del progetto esiste la possibilità di passare da una versione all'altra, ovvero l'utente ha la possibilità di passare dalla versione "produttiva", mutevole in continuazione, e le versioni archiviate, "congelate". Attraverso la cromaticità del fondo rispettivamente di certi elementi di comando l'utente può comprendere se si trova nella versione produttiva o in una delle versioni archiviate di VA. Devono essere citate *solo* le versioni archiviate di VA .

Frontespizi di versioni precedenti di VerbaAlpina:

15/1

15/2

16/1

16/2

17/1

17/2

18/1



(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Descrizione di concetto (CITAZIONE)

I concetti vengono rilevati nella tabella KONZEPTE del database nel modo seguente: nel caso in cui esista una denominazione lessicalizzata di un concetto, questa denominazione viene iscritta nella casella di database 'Name_I' (denominazione italiana). Quando la lessicalizzazione manca, la casella rimane vuota. Indipendentemente dall'esistenza di una denominazione viene specificato o definito il concetto nella casella 'Beschreibung_I' (descrizione italiana). Questo avviene seguendo un modo di procedere definito illustrato dall'esempio del concetto 'BRENTINA' (ID_Konzept 137; identificatore del concetto nel database): il concetto menzionato viene denominato con un lessema specifico, per questo viene iscritta brentina in 'Name_I'. La descrizione prevede l'ordine gerarchico seguente: attrezzo, scopo, materiale, forma (eventualmente). Applicato al concetto del esempio ne risulta la descrizione seguente: RECIPIENTE, PER IL TRASPORTO DEL LATTE SULLE SPALLE, DI LEGNO. Ove possibile/necessario dovranno inoltre essere osservate queste regole: i numeri 1-10 vengono scritti in lettere; nella descrizione di un processo, di un'attività ecc. è utilizzata la costruzione 'per+infinito' oppure 'per+articolo+sostantivo'. Osservando questo modello traduzioni analoghe, la formazione di categorie indipendenti da lingue particolari a diversi livelli di astrazione (->RECIPIENTI ->RECIPIENTI PER IL TRASPORTO ->RECIPIENTI DI LEGNO ecc.), correzioni automatizzate o modifiche, e una ricerca trasparente sono rese possibili. Tutti i concetti vengono rilevati in questo modo nelle lingue tedesca, italiana, francese, slovena e romancia.

(auct. Giorgia Grimaldi | Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Digital Object Identifier (DOI) (CITAZIONE)

Il Digital Object Identifier (DOI) è un indirizzo universalmente univoco e invariabile sotto il quale risorse elettroniche, come per esempio i siti web, possono essere raggiunte. L'accessibilità è garantita anche nei casi in cui cambia ad esempio il cosiddetto "Uniform Resource Locator" (URL) di una risorsa. Questo si fa attraverso un semplice mapping: la fondazione DOI ha un registro in cui è associato l'URL attuale di una risorsa a ogni DOI. Se cambia un URL, cambia corrispondentemente l'entrata nel registro della fondazione DOI. I cambi devono essere comunicati alla fondazione DOI dalle organizzazioni associate (per esempio dalle biblioteche) che avevano fatto registrare i DOI in questione. La registrazione di VerbaAlpina nel registro DOI ha luogo attraverso il "Referat Elektronisches Publizieren" della biblioteca universitaria della LMU. Tale centro non si occupa della registrazione direttamente presso fondazione DOI, bensì presso DataCite, membro della fondazione DOI.

Il vantaggio del sistema DOI consiste nella possibilità di citare di modo durevole le risorse elettroniche. Una citazione DOI guida anche alla risorsa giusta se l'indirizzo in rete, l'URL, è cambiato. Il DOI di VerbaAlpina è doi:10.5282/verba-alpina; il numero 10.5282 appartiene all'organizzazione che ha effettuato la registrazione, ovvero la biblioteca universitaria della LMU. Affinché una citazione in un testo scientifico porti direttamente al portale di VerbaAlpina, il DOI deve essere inserito nell'URL della fondazione DOI: http://dx.doi.org/10.5282/verba-alpina. Non è però possibile accedere direttamente a risorse parziali specifiche sul portale VerbaAlpina (per esempio a singoli file della mediateca di VerbaAlpina [VA_MT]) attraverso il DOI. Per fare questo sarebbe necessario un DOI aggiuntivo per ogni risorsa parziale di VerbaAlpina.

Quasi allo stesso scopo serve il cosiddetto Uniform Resource Name (URN), e anche le modalità di funzionamento sono più o meno le stesse. Diversamente rispetto al DOI, l'URN permette la registrazione di diversi URL per una stessa risorsa. Tale opzione può essere interessante se le risorse vengono deposte da server differenti con corrispondenti URL diversi al fine della prevenzione di guasti o della durata. Un certo svantaggio di URN rispetto a DOI consiste nel fatto che il registro URN non è condotto da un'unica istituzione, bensì da diverse organizzazioni nazionali decentralizzate. In Germania è la Deutsche Nationalbibliothek (DNB) ad assumersi questo compito. Per questo per le risorse che sono registrate attraverso la DNB, deve essere aperto il server della DNB che gestisce gli URN (un cosidetto resolver). L'URN di VerbaAlpina è urn:nbn:de:bvb:19-verba-alpina-8, l'URL corrispondente con il resolver DNB che porta al portale di VerbaAlpina è http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8. Come anche per il DOI, non è possibile accedere direttamente a risorse parziali specifiche sul portale di VerbaAlpina attraverso l'URN.

(auct. Stephan Lücke | Julian Schulz [ITG] – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Digitalizzazione (CITAZIONE)

Nel contesto di VerbaAlpina, con il termine digitalizzazione non si intende il semplice impiego dei computer per la memorizzazione di dati elettronici, bensì la profonda elaborazione digitale del materiale attraverso la *strutturazione* e la categorizzazione sistematiche e trasparenti.



Nel progetto, si utilizza quasi esclusivamente il modello relazionale in cui i dati vengono organizzati da principio in forma di tabella. Le tabelle consistono di righe (= record, tupla) e colonne (= attributi, caselle, campi dato); ogni tabella può essere ampliata in ogni direzione aggiungendo ulteriori righe e colonne. Tra le tabelle esistono relazioni logiche che permettono concatenamenti sensati e corrispondenti raffigurazioni sinottiche (i cosiddetti "joins") di due o più tabelle. Per l'amministrazione delle tabelle, VerbaAlpina impiega attualmente il sistema di gestione di banca-dati MySQL. Le tabelle però non sono legate a questo sistema, ma possono essere esportate in qualsiasi momento, per esempio in forma di testo con delimitatori univocamente definibili per limiti di casella oppure di record (i cosiddetti separatori), insieme con i nomi di colonna e la documentazione delle relazioni logiche (modello entità-relazione). Non viene invece impiegata nel campo operativo di VerbaAlpina la struttura XML che è usata al momento molto spesso in altri ambiti. XML è però compreso come formato di esportazione nell'ambito del concetto di interfaccia.

Oltre alla strutturazione logica dei dati, il secondo concetto importante nel contesto del lemma "digitalizzazione" concerne la codifica dei caratteri. La tematica ha grande importanza proprio riguardo all'archiviazione a lungo termine dei dati e deve essere gestita in maniera previdente. Per quanto sia possibile, VerbaAlpina si richiama in questo contesto alla tabella di codifica e alle direttive del cosiddetto Unicode Consortium. Nel caso della digitalizzazione di caratteri che finora non sono entrati nella tabella Unicode il rilevamento digitale del carattere è effettuato di preferenza attraverso serializzazione sottoforma di una serie di caratteri dell'intervallo x21 fino x7E di Unicode (all'interno del repertorio ASCII). Le associazioni corrispondenti vengono documentate in tabelle speciali per cui una conversione posteriore in valori Unicode poi possibilmente esistenti è sempre possibile.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia dell'informazione



Entità-relazione (CITAZIONE)

In linea di massima, i dati possono essere riuniti in cosiddette "entità". Si tratta di classi di dati che presentano una certa natura e un certo numero di caratteristiche specifiche. Così, le città di Trento, Innsbruck e Lucerna possono formare per esempio la classe "luoghi" alla quale appartengono le caratteristiche "nome di luogo", "grado di longitudine", "grado di latitudine", "stato" e "numero di abitanti". I singoli membri di una tale classe si distinguono tra di loro per i diversi valori delle caratteristiche che formano questa classe.

In una banca dati relazionale, ciascuna entità viene idealmente salvata in una tabella separata. Le colonne di queste tabelle separate comprendono i valori di una caratteristica specifica. Le righe comprendono i membri individuali della classe dei dati (entità), tali membri si distinguono tra di loro per i valori della caratteristica. In quasi tutti i casi – così anche in VerbaAlpina – una banca dati relazionale rappresenta una raccolta di entità diverse (e con questo tabelle diverse) tra le quali esistono delle relazioni logiche. Così l'entità "informante", definita attraverso le caratteristiche "età", "sesso", "luogo di nascita" e "luogo di residenza", è legata all'entità "luoghi" in maniera logica, cosicché i valori della caratteristica "luogo di nascita" e "luogo di residenza" hanno delle corrispondenze nell'entità "luoghi". Le relazioni tra i membri di queste due entità nascono dalla corrispondenza del valore di una o più caratteristiche (congruenti nella loro natura) della rispettiva entità. In questo caso, teoricamente, potrebbe risultare un'associazione tra valori identici delle caratteristiche "luogo di nascita" e "nome di luogo" attraverso la quale si possono assegnare attraverso un informante le coordinate geografiche del suo luogo di nascita. È apparente che in questo esempio si possono presentare dei problemi dovuti a omonimi. Per evitare problemi di questo genere è consuetudine utilizzare numeri interi come identificatori (abbreviazione: "ID") in modo da definire univocamente i membri di un'entità.

Il sistema descritto delle entità e delle loro relazioni logiche viene chiamato "entità-relazione". I dati raccolti in una banca dati relazionale sono difficilmente intellegibili e utilizzabili senza una spiegazione delle dipendenze che vi sono comprese. L'entità-relazione viene rappresentata normalmente in forma di uno schema grafico.

L'entità-relazione è soggetta ad adattamenti continui e dunque, a cambiamenti durante le fasi di sviluppo cicliche di VerbaAlpina (v. controllo versione). A ogni versione archiviata di VerbaAlpina viene aggiunto il modello entità-relazione della versione della banca dati che ne è alla base in forma di un diagramma ER che è creato con il programma yEd e salvato come documento GraphML- e PDF. La grafica seguente si basa sulle entità e le relazioni del database VA_XXX nel suo stato attuale (20.3.2015), non la rappresenta però completamente ed è solo da intendere come esempio illustrativo:





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Formato dei dati (CITAZIONE)

Si veda Modellazione dei dati

Tags: Tecnologia dell'informazione



Georeferenziazione (CITAZIONE)

La georeferenziazione (utilizzando gradi di latitudine e di longitudine) è un criterio di ordine essenziale per la gestione dei dati di VerbaAlpina. L'esattezza di questa referenziazione varia a seconda del tipo di dati. Il progetto aspira però a una referenziazione più esatta possibile, precisa al metro. Di norma, nel caso di dati linguistici provenienti da atlanti e dizionari, è possibile solo una referenziazione approssimativa secondo il toponimo; nel caso di dati archeologici sono però possibili georeferenziazioni precise al metro. Possono essere salvati punti, linee (come strade, fiumi ecc.) e superfici. Dalla prospettiva tecnica viene utilizzato soprattutto il cosiddetto formato WKT (https://en.wikipedia.org/wiki/Well-known_text) che viene trasferito nel database di VerbaAlpina in un formato MySQL specifico attraverso la funzione geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html. L'output nel formato WKT avviene attraverso la funzione MySQL astext().

Il retino di referenza della georeferenziazione forma la rete dei comuni politici nello spazio alpino che possono essere rappresentate o come superficie o come punti. Ne formano la base le demarcazioni del confine dei comuni che VerbaAlpina ha ricevuto dal suo partner Convenzione delle Alpi; tali dati sono aggiornati circa al 2014. Un aggiornamento di questi dati, spesso mutanti a causa di riforme amministrative, è superfluo perché, dal punto di vista di VerbaAlpina, si tratta di un mero quadro di referenza geografico. La raffigurazione di punto del retino di comune viene dedotta attraverso gli algoritmi relativi ai confini del comune e risulta quindi essere secondaria. I punti di comune stabiliti rappresentano i centri geometrici delle superfici di comune e marcano soltanto per caso il capoluogo o il punto centrale del comune. Se necessario, tutti i dati possono essere proiettati sul punto di comune stabilito o singolarmente o cumulativamente. Questo è il caso per esempio per i dati linguistici di atlanti e dizionari.
#Passus über Polygonkarte in Method_Kartographie übertragen#


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia dell'informazione Contesto extralinguistico



illustrazione quantificata (CITAZIONE)

[premessa: Il seguente articolo si riferisce in parte ad alcune funzionalità di VA_WEB ancora in via di sviluppo e non accessibili al pubblico.]

La mappa online interattiva di Verba Alpina permette sia la mappatura qualitativa sia la visualizzazione di dati comulativi in un'illustrazione di dati locali. L'accumulazione si orienta sempre a regioni geografiche. Qui l'utente ha la scelta fra l'aggregazione in base al territorio comunale (territorio più circoscritto), le cosiddette regioni- NUTS-3 (territorio di mezzo) e, infine, la regione di distribuzione delle tre grandi famiglie linguistiche germano- romano- slavo (territorio a più ampio raggio). Inoltre esiste la possibilità di definire territori comunali facoltativi come regioni individuali che poi fungano da grandezza di riferimento per il raggruppamento. Questa ultima opzione può evitare effetti forzati che risultino dalla prospettiva dell'aggregazione attraverso superfici amministrative – e così, dal punto di vista linguistico, non concernente la materia- di territori comunali o delle regioni-NUTS-3. Nel caso specifico il procedimento corrispondente può essere ovviamente solo di tipo euristico, l'utente ha però la possibilità di accumulare coerenze regionali sensate, di commentare, riutilizzarle e metterle a disposizione del pubblico.

Riguardo le regioni o superfici selezionate, vengono poi aggregati tutti i dati qualitativi scelti fino all'attivazione della presentazione quantificata. La grandezza e la colorazione di singoli simboli cartografici sono correlate con il numero di ciascun dato singolo qualitativo rilegato in un simbolo. Il valore massimo aritmetico che sta alla base, al raggiungimento del quale un simbolo ottiene la propria massima grandezza e colorazione, corrisponde di serie al numero più alto di dati aggregati che appare in una delle superfici ossia regioni selezionate. Tale valore massimo di referenza può essere convertito nel numero totale dei dati singoli aggregati, operazione che porta a un cambiamento dell'illustrazione cartografica .

In una quantificazione attivata possono essere utilizzati dati qualitativi corrispondenti al calcolo delle quantità attraverso una deattivazione di singoli appunti di lista in una interpretazione cartografica. Inoltre è possibile aggiungerne altri attraverso una ulteriore selezione.

Accanto alla quantificazione sullo sfondo di una carta georeferenziata che mostri il corso di frontiera, VerbaAlpina permette anche la presentazione di dati quantificati su una cosiddetta carta web. L'esempio è una grafica di Wikipedia che visualizza i risultati delle elezioni generali della Gran Bretagna del 2015. In seguito viene mostrata la carta esatta al punto, la lunghezza e l'angolo (in seguito denominata "carta geografica") con i risultati dell'elezione nelle singole circoscrizioni. Segue l'illustrazione della carta web su cui appare ogni circoscrizione tramite un esagono con la sua propria identica grandezza.




fonte: https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (visitato il 03.11.2016)




fonte: https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (visitato il 03.11.2016)

Il confronto dei due tipi cartografici evidenzia i vantaggi e gli svantaggi relativi. La carta a nido d'ape contiene inesattezze geografiche o, addirittura, informazioni sbagliate. Così, si riconosce per esempio nel distretto Greater London un favo isolato rosso circondato da tanti favi blu – cosa apparente non riscontrabile nella carta geografica. La carta a nido d'ape ha però il vantaggio di visualizzare meglio le proporzioni numeriche reali tra i singoli colori, in quanto, un grande numero di sezioni elettorali con una misura di superficie molto piccola viene percepito dall'osservazione sulla carta geografica come subordinato, nonostante il valore politico sia allo stesso livello delle sezioni elettorali con una misura di superficie grande. Così i due tipi cartografici si completano a vicenda e il valore aggiunto consiste effettivamente nella possibilità di poter consultare entrambe le carte e di confrontare le loro visualizzazioni.

La carta di fave di VerbaAlpina si distingue per la possibilità di illustrare tutte le comunità politiche del territorio alpino attraverso Hexagone identiche nella loro grandezza . Cosí si cerca di mantenere almeno approssimativamente la logica geografica. Il calcolo della colorazione delle singole Hexagone avviene nello stesso modo come descritto sopra per la carta punto- simbolo. Il vantaggio di una tale carta di fave rispetto ad una semplice colorazione di territori comunali su una carta geografica, consiste nel fatto che effetti suggestivi vengono repressi dalla grandzza die territori comunali che sono molto differenti.


(auct. Stephan Lücke – trad. Monika Hausmann)

Tags: Tecnologia dell'informazione Pagina Web



Modellazione dei dati (CITAZIONE)

Si veda il modello relazionale

(auct. Stephan Lücke)

Tags: Tecnologia dell'informazione



Moduli (CITAZIONE)

v. Controllo versione

Tags: Tecnologia dell'informazione



Terminologia (CITAZIONE)

Tedesco Francese Italiano romancio sloveno
(Beleg)Raster la grille la griglia la griglia raster jazikovnih dokazov
Almwesen l'alpage l'alpeggio l'economia d'alp planinstvo
Alpenraum la région alpine la regione alpina la regiun alpina alpska pokrajina
ASCII-Bereich le bloc ASCII il repertorio ASCII il sectur ASCII območje ASCII
ASCII-Zeichen le caractère ASCII il carattere ASCII il segn ASCII znak ASCII
Attribut l'attribut l'attributo l'attribut atribut
Beta-Kodierung l'encodage beta la codifica beta la codaziun beta kodiranje beta
Betacode le beta code il codice beta il code beta kod beta
Betriebssystem le système d'exploitation il sistema operativo il sistem operativ operacijski sistem
chronoreferenziert chronoréférencé cronoreferenziato cronoreferenzià kronološko referenciran
Codepage la page de code il codepage la pagina da codes kodna stran
Crowdsourcing le crowdsourcing il crowdsourcing il crowdsourcing crowdsourcing
Daten les données i dati las datas podatki
Datenbank la base de données il database la banca da datas podatkovna zbirka
Datenbankmanagementsystem le système de gestion de base de données il sistema di gestione di banca-dati il sistem d'administraziun da la banca da datas sistem za upravljanje zbirk podatkov
Datenerhebung l'enquête des données il rilevamento dati la relevaziun da datas raziskava podatkov
Datensatz l'enregistrement il record l'acta podatkovni zapis
Digital Humanities les humanités numériques l'informatica umanistica las scienzas umanas digitalas digitalna humanistika
digitale Datenerfassung la saisie digitale de données il rilevamento digitale la registraziun da datas digitala digitalno zbiranje podatkov
digitale Tiefenerschliessung l'exploitation digitale en profondeur l'esplorazione digitale a fondo l'accessibladad digitala a fund digitalno globinsko urejanje
Digitalisierung la numérisation la digitalizzazione la digitalisaziun digitalizacija
dingliches Trägermedium le support d'information matériel il supporto analogico o digitale il medium da support concret stvarni nosilec
dokumentieren témoigner documentare documentar dokumentirati
Eigenschaft proprieté il campo dato la caracteristica lastnost
eindeutig univoquement univocamente univocamain nedvoumno
elektronische Datenverarbeitung le traitement électronique des données l'elaborazione dati elettronica l'elavuraziun da datas electronica elektronska obdelava podatkov
Entity-Relationship-Modell le modèle entité-association il modello entità-relazione il model entitad-relaziun entitetni-odnosni model
Erhebung l'enquête il rilevamento la relevaziun raziskava
Erhebungsort le lieu de l'enquête il punto d'inchiesta il lieu da relevaziun kraj raziskave
Exportformat le format d'exportation il formato di esportazione il format d'export format eksporta
Feld la case la casella il champ polje
Ganzzahl l'entier relatif il numero intero il dumber entir celo število
Geokoordinate les coordonnées géographiques la coordinata geografica la geocoordinata geografska koordinata
Geolinguistik la géolinguistique la geolinguistica la geolinguistica geolingvistika
georeferenzierbar géoréférenciable georeferenziabile georeferenziabel ki ga je mogoče georeferencirati
georeferenziert géoréférencé georeferenziato georeferenzià georeferenciran
Georeferenzierung le géoréférencement la georeferenziazione la georeferenziaziun georeferenciranje
Identifikator l'identifiant l'identificatore l'identificatur identifikator
Informant l'informateur l'informante l'infurmant informator
Informationstechnologie la technologie de l'information la tecnologia dell'informazione la tecnologia d'infurmaziun informacijska tehnologija
Internet l'internet (m) l'internet (m) l'internet internet
IT-Firma des sociétés d'informatique imprese che si occupano di tecnologia dell'informazione la firma IT IT-podjetje
Kategorisierung la catégorisation la categorizzazione la categorisaziun kategorizacija
Kodierung le codage la codifica la codaziun kodifikacija
Kodierungstabelle le tableau de codage la tabella di codifica la tabella da codaziun kodirna tabela
Konvertierung une conversion una conversione la conversiun konvertiranje
Konzept le concept il concetto il concept osnutek
Kooperationspartner le partenaire de coopération il partner di cooperazione il partenari da collavuraziun kooperacijski partnerji
Langzeitarchivierung l'archivage de longue durée l'archiviazione a lungo termine l'archivaziun a lunga durada dolgoročno arhiviranje
Medien les médias (m.) i media las medias mediji
Nutzer l'utilisateur l'utente l'utilisader uporabnik
Oberfläche l'interface la superficie la surfatscha površina
operativer Bereich le plan opérationnel il campo operativo il champ operativ operativno območje
Portal le portail un portale il portal portal
relationales Datenmodell le modèle relationnel il modello relazione il model (da datas) relaziunal relacijski model podatkov
Sachgebiet le domaine il campo il champ strokovno področje
Schnittstellenkonzept la conception d'interface il concetto di interfaccia il concept d'interfatschas osnutek vmesnika
Schriftzeichen le caractère il carattere il caracter črka
Separator le séparateur il separatore il separatur separator
Serialisierung la sérialisation la serializzazione la serialisaziun serializacija
Sicherheitskopie la copie de sûreté la copia di backup la copia da segirezza varnostna kopija
Social media les médias sociaux i media sociali las social media družabni mediji
social software le logiciel social il social software la software sociala družabna programska oprema
Software le logiciel il software la software programska oprema
Spalte (Tabelle) la colonne la colonna la colonna stolpec
Sprachdaten les données linguistiques i dati linguistici las datas linguisticas jezikovni podatki
Sprachfamilie la famille linguistique la famiglia linguistica la famiglia da linguas jezikovna družina
Sprachkontakt le contact linguistique il contatto linguistico il contact linguistic jezikovni kontakt
Sprecher le locuteur il parlante il pledader govorec
Strukturierung la structuration la strutturazione la structuraziun strukturiranost
Support le service d'assistance l'assistenza il support pomoč
Trennzeichen le délimiteur il delimitatore il segn da separaziun separator
Tupel le tuple la tupla il tupel terka
Umgebung (inform.) l'environnement l'ambiente il conturn okolje
Unicode-Bereich le bloc Unicode l'intervallo …. fino … di Unicode il sectur Unicode območje unicode
Unicode-Konsortium le Consortium Unicode lo Unicode Consortium il consorzi Unicode konzorcij unicode
Unicodetabelle le tableau Unicode la tabella Unicode la tabella Unicode tabela unicode
Unicodewert la valeur Unicode il valore Unicode la valur Unicode vrednost unicode
Varietätenkontakt le contact des variétés linguistiques il contatto di varietà linguistiche il contact da varietads linguisticas kontakt jezikovnih varjacij
Vermehrung (der Informanten) l'accroissement (des informateurs) l'aumento (degli informanti) l'augment (d'infurmants) pomnožitev (informatorjev)
Versionierung la gestion de versions il controllo versione la gestiun da la versiun spremljanje različic
Verwaltung la gestion l'amministrazione l'administraziun administracija
virtuelle Forschungsumgebung l'environnement de recherche virtuel l'ambiente di ricerca virtuale il conturn da perscrutaziun virtual virtualno raziskovalno okolje
Web le web il web il web splet
Web-Framework le framework d'application web il framework il framework per applicaziuns-web web framework
XML-Struktur la structure XML la struttura XML la structura XML struktura XML
Zeichenkodierung le codage de caractère la codifica di carattere la codaziun da caracter kodiranje znaka
Zeile (Tabelle) la ligne la riga la lingia vrsta
Zuordnung (in Tabellen) l'affectation l'associazione l'attribuziun razvrstitev


Tags: Linguistica Tecnologia dell'informazione Pagina Web



Trascrizione (CITAZIONE)

I materiali linguistici vengono resi in doppia forma grafica per fare fronte a due principi: la fedeltà alle fonti e una facile comparabilità.

(1) Versione input nella trascrizione originale
Nel portale di VerbaAlpina vengono riunite delle fonti che derivano da diverse tradizioni scientifiche (romanistica, germanistica, slavistica) e rappresentano delle fasi storicamente diverse della ricerca dialettologica; alcuni dati lessicografici sono stati rilevati all'inizio del secolo scorso (GPSR) e altri solo pochi anni fa (ALD). Per questo, dal punto di vista storico e epistemologico, è necessario rispettare la trascrizione originale nel miglior modo possibile. Per ragioni tecniche è però impossibile mantenere certe convenzioni in modo invariato. Questo vale soprattutto per le combinazioni verticali di carattere di base ('lettera') e segni diacritici, come per esempio quando un segno per l'accento è posizionato sopra un carattere di lunghezza sopra una vocale sopra un diacritico di chiusura (Codice beta). Queste convenzioni vengono trasferite in sequenze lineari di caratteri secondo trascrizioni tecniche definite in maniera particolare per ogni convenzione utilizzando esclusivamente caratteri ASCII (il cosiddetto codice beta). Utilizzando la codifica beta si può approfittare, almeno in parte, delle somiglianze grafiche intuitivamente comprensibili tra diacritici originali e le corrispondenze ASCII da noi scelte in quanto mnemonicamente vantaggiose.

(2) Versione output in IPA
Pensando alla comparabilità e anche alla facilità d'uso, in una trascrizione unificata, è inoltre auspicabile l'output dei dati. Tutti i codici beta saranno per questo trasferiti in segni IPA attraverso routine di sostituzione specifiche. Alcuni problemi inevitabili nascono per i casi dove a un carattere di base specificato attraverso diacritici nella trascrizione input, corrispondono due caratteri di base diversi in IPA. Questo vale soprattutto per il grado di apertura delle vocali dove per esempio i due caratteri di base <i> e <e>, in combinazione con il punto di chiusura e uno o due uncini di apertura, permettono di rappresentare sei diversi gradi di apertura nella serie palatale; nella codifica beta sono i seguenti: i – i( – i((– e?-- e – e(– e((. Per rendere caratteri, IPA dispone soltanto di quattro caratteri di base: i – ɪ – e – ɛ.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistica Tecnologia dell'informazione



Umanistica digitale (CITAZIONE)

Il progetto VerbaAlpina è stato pensato fin da principio tenendo presente la sua necessaria conformità al web. Questo perché il progetto vuole contribuire significativamente al trasferimento delle solide tradizioni umanistiche, più precisamente della geolinguistica, nelle cosiddette Digital Humanities (informatica umanistica). Questa espressione è pienamente accreditata, ma i termini che la compongono non risultano auto-esplicativi e meritano, dunque, un'ulteriore osservazione di tipo metodologico.

(1) Digital comporta una serie di complesse implicazioni:

  • La base empirica della ricerca consiste di dati (cfr. Schöch 2013), ovvero unità digitalmente codificate e strutturate, o almeno strutturabili. Spesso si tratta di dati parzialmente già pubblicati e successivamente digitalizzati (come ad esempio i dati di atlanti più antichi); in parte, però, anche di dati da rilevare nell'immediato . Per quanto riguarda i concetti rilevanti, il progetto aspira a raccogliere il più vasto numero di dati possibile. Il metodo è quindi quantitativo e ampiamente induttivo.
  • La comunicazione nella ricerca ha luogo sotto le condizioni mediali dell'internet. Ciò offre in primo luogo la possibilità di intrecciare ipertestualmente media diversi (scrittura, illustrazione, contenuti video e audio); inoltre, i ricercatori, i partner di cooperazione del progetto e/o gli informanti hanno la possibilità di comunicare e cooperare costantemente tra loro.
  • Agli studiosi interessati al progetto si presenta la possibilità di partecipare attivamente allo sviluppo di questa piattaforma scientifica progettuale e collaborativa. Questa prospettiva è utile e produttiva sotto almeno due aspetti: essa permette, infatti, di collegare diverse sedi e – soprattutto – di promuovere la combinazione costruttiva di tecnologia dell'informazione e geografia linguistica con delle risorse pubbliche, senza dover necessariamente ricorrere all'assistenza di imprese private che si occupino di TI (assistenza che, per altro, potrebbe creare complicazioni di natura giuridica ed economica).
  • Il sapere rilevante per il progetto può essere raccolto e modificato continuamente anche a lungo termine, sebbene non si possa dare garanzia di una disponibilità durevole dal punto di vista tecnico (si confronti, a questo proposito, l'infrastruttura scientifica CLARIN-D http://de.clarin.eu/de/home.html, sito fruibile solo in tedesco e inglese). In questa prospettiva, la pubblicazione dei risultati sotto forma di libri, CD, DVD non rappresenta l'obiettivo centrale del progetto. Tuttavia si provvederà ad installare un'opzione di stampa posticipata, come offerta, talvolta, anche dalla lessicografia online Tesoro della Lingua Italiana delle Origini.
(2) Con Humanities si intende una specifica concezione dell'oggetto di ricerca, il quale, se preso in esame esclusivamente secondo la visione filologica tradizionale, non risulterebbe adeguatamente e pienamente analizzato. La tradizione filologica incentrata sul testo è stata difatti sorpassata dalle aree della linguistica che si occupano della lingua parlata. In relazione al progetto VerbaAlpina, tuttavia, il solo parlare di digital linguistics risulterebbe troppo restrittivo in quanto, sebbene al centro della ricerca vi siano i dati linguistici, è chiaro che vengano inclusi anche dati extra-linguistici, indispensabili per la comprensione storica delle relazioni geolinguistiche.

(auct. Thomas Krefeld – trad. Alessia Brancatelli | Susanne Oberholzer)

Tags: Tecnologia dell'informazione



Uniform Resource Name (URN) (CITAZIONE)

v. Digital Object Identifier

Tags: Tecnologia dell'informazione