Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


 (Citer)



(auct. Stephan Lücke)

Tags: Contexte extralinguistique



 (Citer)



(auct. Stephan Lücke)

Tags: Contexte extralinguistique



 (Citer)


Caractères de base


Caractère Description Beta Code Commentaire
α
alpha greca1
ɒ
a en miroira2
æ
ligature aea3
β
bêta grecb1
ƀ
b barréb2
χ
chi grecc1
ҁ
signe pour coup de glottec2
c
c barréc3
ɕ
c latin minuscule avec boucle rétrofléchéec4
δ
delta grecd1
đ
d barréd2
ð
ethd3
ə
schwae1
crochet à gauche du ee2
ε
epsilon grece3
φ
phi grecf1
ƒ
fortis labiodentalef2
ɣ
gamma grecg1
g avec ouverture à droiteg2
g avec trait inférieurg3
ʔ
coup de glotteg4
ɥ
h latin minuscule réfléchi et à l'enversh1
i avec trait obliquei1
ı
i sans pointi2
ɨ
i avec trait horizontali3
ɪ
i latin en petite capitalei4
ɟ
j latin minuscule avec tiretj1
ł
l barrél1
l avec trait fortement courbél2
l avec deux traits courbésl3
λ
lambdal4
ʎ
y latin minuscule en miroir diagonall5
ɱ
m latin minuscule avec crochet vers le bas à droitem1
ɳ
signe pour "n" vélaire (allem. kling)n1
ŋ
consonne nasale vélairen2
ɲ
n latin minuscule avec crochet en bas à gauchen3
œ
ligature oeo1
ɔ
o avec ouverture à gaucheo2
ơ
o avec crochet sur le bord supérieur droito3
ǫ
o avec ogoneko4
ø
o avec trait diagonalo5
ω
oméga greco6
π
pi (constante mathématique)p1
þ
thornp2
q avec trait horizontalq1
ʀ
R majuscule en position des minusculesr1
ɹ
r latin minuscule en miroir diagonalr2
ɾ
r latin minuscule sans la partie en haut à gaucher3
ʃ
ech (angl. esh)s1
s avec trait diagonal à gauches2
ʂ
s latin minuscule avec crochet rétrofléché en bas à gauches3
ϑ
thêta grect1
u plus fortement courbéu1
ʊ
upsilon latin minusculeu2
ʒ
ej (angl. ezh)z1
ʑ
z latin minuscule avec boucle rétrofléchéez2

Diacritiques


Caractère Description Beta Code Commentaire Exemple
point au-dessous de caractère de base?s?
ė
point au-dessus de caractère de base?1e?1
ä
deux points au-dessus d'un caractère de base:a:
deux points au-dessous de caractère de base:1u:1
crochet ouvert vers la droite au-dessous de caractère de base(o(
deux crochets ouverts vers la droite au-dessous de caractère de base(1e(1
demi-cercle ouvert vers la gauche (spiritus lensis) au-dessus de caractère de base)r)
demi-cercle ouvert vers la gauche au-dessous de caractère de base)1o)1
ç
cédille)2c(2
ó
accent aigu sur caractère de base/o/
accent aigu double sur caractère de base/2o/2
à
accent grave sur caractère de base</td>a</td>
accent grave double sur caractère de base\2a\2
accent grave avec point à l'extrémité supérieure sur caractère de base\3u\3
ā
trait horizontal au-dessus de caractère de base-a-
ā̄
deux traits horizontaux au-dessus de caractère de base-2a-2
trait horizontal au-dessous de caractère de base_n_
trait horizontal double au-dessous de caractère de base_1n_1
tilde AU-DESSUS de caractère de base~e~
tilde plus fortement courbé AU-DESSUS de caractère de base~1
tilde AU-DESSOUS de caractère de base+e+
demi-cercle ouvert vers le HAUT AU-DESSUS de caractère de base!a!
demi-cercle ouvert vers le BAS AU-DESSUS de caractère de base%a%
demi-cercle ouvert vers le BAS AU-DESSOUS de caractère de base@a@
demi-cercle ouvert vers le HAUT AU-DESSOUS de caractère de base@1k@1
cercle AU-DESSUS de caractère de base|u|
cercle AU-DESSOUS de caractère de base&s&
trait vertical au-dessous de caractère de base$e$
hacek (hatchek)^g^
ĝ
circonflexe^1g^1
"circonflexe" au-dessous de caractère de base^2o^2
"hacek" au-dessous de caractère de base^3d^3
u
symbole de l'infini au-dessus de caractère de base"u"
symbole "est-plus-grand-que" au-dessus de caractère de base>n>
croix au-dessous de caractère de base*a*
croix au-dessus de caractère de base*1a*1
g’
apostrophe après caractère de base'g'
apostrophe à l'envers après caractère de base'1a'1
trait vertical élevé après caractère de base'2g'2
coche après caractère de base=k=
exposant (chiffre placée en haut) après caractère de base \<n>0c\20
marque IPA d'allongement:2a:2
marque IPA d'allongement demi:3a:3
ᵃb
caractère de base en position supérieure par rapport à la ligne de base0a0b
caractère de base sur la ligne de base, plus petit que tous les autres caractères8n8d
ᵢn
caractère de base en position inférieure par rapport à la ligne de base9i9n
signes diacritiques supérieurs ou inférieurs entre paranthèses[<d>]u[:] bzw. e[?]
caractère de base au dessus de caractère de base{<z>}a{o}
caractère de base au-dessous de caractère de base{1<z>}a{1o}

Caractères spéciaux

En principe, ces caractères représentent des caractères de base, mais ils ne peuvent pas être complétés avec des diacritiques.

Caractère Description Beta Code Exemple
·e̜kọ́ɳ
Un point avant ou après le caractère de base; en position supérieure par rapport à la ligne de base..1.1e(ko?/n1

Espaces spéciaux
(Dans ce tableau, les espaces normaux sont représentés par le symbole ␣)

Caractère Description Beta Code Exemple
w‿d
espace avec arc{␣}w{␣}d


(auct. Stephan Lücke | Florian Zacherl)

Tags: Technologie de l'information



Abréviations  (Citer)

Les textes présents dans les rubriques “méthodologie” et “lexicon alpinum” contiennent souvent des abréviations qui ne sont pas toujours intuitivement compréhensibles. Pour cette raison, afin de permettre une meilleure compréhension des contenus, l'équipe de VerbaAlpina a créé une liste contenant toutes les abréviations présentes dans les textes. Cette liste a été faite pour l’allemand et pour les autres langues de VerbaAlpina, à savoir l’italien, le français et le slovène. Les abréviations issues de citations ne figurent pas dans la liste en question.

Par ailleurs, les abréviations utilisées pour les dénominations des langues ont été adaptées aux normes ISO-639-3 (langues) et ISO-639-5 (familles linguistiques) dans tous les textes, ces abréviations ont ensuite été saisies dans la liste ci-dessous.

Abréviations bibliographiques


Concernant les ouvrages de référence en plusieurs volumes, un sigle (par exemple AIS) leur est attribué. Les autres titres, enregistrés avec toutes les informations bibliographiques, sont cités de manière abrégée : nom d'auteur et année de parution (par exemple Baer 2000). S'il y a deux noms, ils sont séparés par une barre oblique (par exemple Jaberg/Jud 1929), à partir de trois noms l'abréviation "et al." est utilisée.






(auct. Beatrice Colcuc | Thomas Krefeld | Stephan Lücke – trad. Beatrice Colcuc | Christina Mutter)

Tags: Page Web



API  (Citer)

L'abréviation API signifie en anglais "application programming interface", en français 'interface de programmation'. VerbaAlpina fournit une telle interface à l'adresse https://www.verba-alpina.gwi.uni-muenchen.de/?api=1. Une documentation détaillée de la syntaxe à utiliser se trouve dans l'article suivant: Documentation API. L'API permet de repérer des contenus spécifiques de la base de données VA (VA_DB) dans des formats définis à travers un navigateur web. La sélection des données et le format de sortie sont contrôlés par des paramètres URL.

(auct. Stephan Lücke – trad. Beatrice Colcuc)

Tags: Technologie de l'information



Approche inductive à l'espace culturel  (Citer)

Le projet se focalise sur les Alpes prises en tant que complexe d'espace culturel seulement, VerbaAlpina s'attendant à des techniques culturelles communes à toute la région alpine. En effet, on note une adaptation à des conditions de vie identiques, ou au moins très semblables, en haute montagne et une diffusion toute naturelle d'aptitudes et de traditions associées à ces conditions de vie communes. Ces points communs se manifestant clairement dans la langue par des désignations correspondantes, il ne convient pas de décrire la culture spécifiquement alpine dans une approche trop étroite de communautés linguistiques séparées, pour ainsi dire "top-down", c.-à-d. par une grille de points d'enquête dans des régions linguistiques ou dialectales fixées à priori; cela correspondrait aux intentions de la dialectologie, qui vise à la description la plus complète possible de régions isolées et idéalement de variétés particulières. Dans la perspective adoptée par le projet, celle d'une géolinguistique plurilingue allant au-delà des frontières linguistiques, les zones de diffusion de traditions culturelles et de leurs désignations doivent par contre être dégagées de manière inductive par une approche "bottom-up", c.-à-d. en accumulant le plus grand nombre de résultats locaux possibles.

Le principe de base consiste à utiliser exclusivement des données géoréférenciables et à ne présupposer aucune macro-région, à part celle de la Convention alpine à laquelle doivent appartenir toutes les localités prises en considération. Les données complémentaires, qui fournissent des informations actuelles ou historiques sur l'organisation sociale des habitants et/ou sur le développement des infrastructures de base et la gestion de l'espace, peuvent contribuer au profilage de la région alpine comme espace culturel. À l'égard de la reconstruction historique de l'espace culturel alpin, il est souhaitable de comparer les régions de persistance archéologique à des zones de vestiges linguistiques, et de visualiser cette comparaison de manière quantitative sous forme d'une cartographie combinant stratigraphie linguistique et ethnographique; cf. à ce sujet du point de vue archéologique en général Häuber/Schütz 2004a et plus spécifiquement l'atlas des strates urbaines de Cologne (cf. Häuber/Schütz/Spiegel 1999 et Häuber u.a. 2004).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Archivage de longue durée  (Citer)

Toutes les données du projet VerbaAlpina sont gérées de telle sorte qu'elles restent lisibles et utilisables pendant une période la plus longue possible. La perspective temporale envisagée du projet comprend au moins plusieurs décennies, le concept sur lequel le projet se base est lui orienté sur une conservation sans limitation de durée. Les aspects suivants sont pris en considération :
1. A quelle institution/à quelles institutions est confiée la conservation des données et des des supports d'information en question ?
2. Documentation de la structuration des données ainsi que des relations logiques entre données et catégories de données (entité-association)
3. Documentation des codages de caractère utilisés
4. Sur quel type de support d'information sont conservées les données

Plusieurs copies des données du projet devront être archivées chez différentes institutions . Actuellement, l'IT-Gruppe Geisteswissenschaften de la LMU (c'est-à-dire le groupe de technologie de l'information des sciences humaines de l'Université de Munich, ITG) lié aux serveurs d'archivage du Leibniz-Rechenzentrum et le BAS Clarin Repository s'en chargent. La mise en dépôt de copies de sûreté supplémentaires chez d'autres institutions y étant aptes est prévue. L'archivage a lieu au rythme de la gestion de versions. Chaque fois, la base de données est archivée avec toutes les données du projet ainsi que le framework d'application web qui est responsable pour la présentation des données au web (y compris la fonctionnalité respective), de telle façon qu'il est possible (au moins en théorie) de "réveiller de nouveau" chaque version isolément dans les correspondants environnements de système d'exploitation respectivement de logiciel émulés.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Atlas linguistiques et dictionnaires des Alpes  (Citer)

Les atlas linguistiques suivants envisagent la zone alpine:
  • Romania alpina: ALF, AIS, ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
  • Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAÖ;
  • Slavia alpina: SLA.
Le grand nombre d'atlas ne doit pas dissimuler les divergences considérables, parfois tout à fait inattendues entre les différents atlas. Ce sont seulement certains atlas régionaux, comme par ex. l'ALD-II ou le BSA, qui ne s'intéressent pas particulièrement aux données ethnolinguistiques. L'alpage – qui représente un système économique fondamental de la région alpine – n'est presque pas du tout thème de discussion. Dans l'ALD-II, certes il y a (à la différence du BSA) un stimulus 869 l'alpeggio 'Alm'/ la baita 'Sennhütte'. Mais des concepts fondamentaux du traitement de lait, comme VACHER (ita. casaro, caciaio), TRAIRE (ita. mungere), PRÉSURE (ita. caglio), ÉCRÉMER (ita. scremare) et de l'élevage de bétail comme ÉTABLE (ita. stalla), BERGER (ita pastore), PÂTURAGE (ita. pascolo) etc. manquent (cf. le questionnaire.

De plus, il y a aussi beaucoup de dictionnaires concernant les idiomes de l'aire alpin. Les dictionnaires utilisés par VerbaAlpina son les suivants:
  • Romania alpina: DRG (Dicziunari Rumantsch Grischun), LSI (Lessico dialettale della Svizzera italiana), GPSR (Glossaire des patois de la Suisse romande), ALTR (Archivio lessicale dei dialetti trentini)
  • Germania alpina: Idiotikon (Schweizerisches Idiotikon), BWB (Bayerisches Wörterbuch), WBÖ (Wörterbuch der bairischen Mundarten in Österreich).






(auct. Beatrice Colcuc | Thomas Krefeld – trad. Beatrice Colcuc | Thomas Krefeld | Susanne Oberholzer)

Tags: Linguistique



Beta code  (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) (qui a développé au début des années soixante-dix, avec les moyens de technique informatique d'alors, un concept similaire pour la saisie électronique de textes en grec ancien), la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est appelée "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Pour permettre la retranscription en caractères ASCII des transcriptions phonétiques selon Böhmer-Ascoli utilisées dans les atlas, il faut tout d'abord distinguer caractères de base et diacritiques. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté tel quel lors de la transmission (ce cas se retrouve dans l'exemple). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII dédié. L'attribution des diacritiques à des caractères ASCII est sans équivoque au sein de VerbaAlpina et des tableaux dédiés de la base de données VerbaAlpina consignent le processus. Autant que possible, le choix de l'attribution est guidé par le principe de la ressemblance optique. Ainsi dans l'exemple mentionné, le point sous le e dans le mot tega est rendue par un point d`interrogation: te?. Les diacritiques sont retranscrits en partant de leur position par rapport au caractère de base dans l'ordre suivant : de bas en haut et de gauche à droite, après le caractère de base. En raison du principe de la ressemblance optique, l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d. que même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche sera rendue dans les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques à chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d. que le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a nombre d'avantages:
- la saisie des données peut être faite sur des claviers standard traditionnels, à relativement grande vitesse, et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissance des systèmes de transcription phonétique;
- n'importe quel caractère ou diacritique peut être saisi, qu'ils soit codés dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque tout autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent éventuellement se passer; mais c'est là le caractère même des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée, qui n'est pas prévue dans le système API.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Cadre onomasiologique  (Citer)





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Carte synoptique  (Citer)

Cette fonction permet à l'utilisateur de faire apparaître une sélection de cartes sur une carte synoptique. De cette manière on peut visualiser les zones de diffusion de n'importe quelle caractéristique linguistique et extralinguistique et les comparer. Par ailleurs on a la possibilité de fixer ces cartes synoptiques à des niveaux de zoom différents si l'on veut montrer un contexte local, comme par ex. le massif des Karwendel ou le continuum dialectal occitan-franco-provençal-piémontais des Alpes occidentales.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Cartographie  (Citer)

La cartographie est un instrument de la géolinguistique, certes prêtant à discussion mais ayant aussi fait ses preuves : elle sert tout autant à la documentation qu'à la visualisation des relations spatiales (cf. les contributions dans Lameli 2010). Deux techniques traditionnelles de cartographie se distinguent nettement de par leur concision. Dans le cas de cartes 'analytiques', les énonciations linguistiques (partielles) sont rendues de telle façon que c'est la documentation qui est mise en relief, l'interprétation des relations spatiales devant, elle, être faite par l'utilisateur. Dans le cas de cartes 'synthétiques', les relations spatiales entre les phonèmes énoncés sont exprimées directement par la symbolisation. Les cartes quantitatives sont obligatoirement synthétiques. La cartographie en ligne propose une combinaison des deux procédures en présentant à première vue des cartes 'synthétiques', mais en offrant aussi l'accès aux énonciations (partielles) avec un clic sur le symbole.
Le potentiel heuristique de ce type de cartographie est considérable : on offre à l'utilisateur de VerbaAlpina l'option de combiner et cumuler des classes de données différentes, soit d'une seule catégorie (par ex. plusieurs types de base), soit de plusieurs catégories (par ex. des données linguistiques et extralinguistiques) au moyen des cartes synoptiques.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web Contexte extralinguistique



Chrono-référencement  (Citer)

En plus du principe de géoréférencement, qui est fondamental pour VerbaAlpina, la conception globale prévoit aussi la possibilité d'un chrono-référencement, une dimension supplémentaire permettant l'analyse de données diachroniques. Le chrono-référencement est applicable aussi bien aux matériaux linguistiques rassemblés par VerbaAlpina qu'aux matériaux extralinguistiques. La précision du chrono-référencement varie. Dans le cas de données linguistiques issues d'atlas et de dictionnaires, le chrono-référencement est implicite, connu par la date de l'enquête ou bien de la publication. Dans le cas de données issues du crowdsourcing, on peut, sous certaines conditions, les déterminer au jour même. Le chrono-référencement est pertinent dans les cas où des données de différentes générations d'atlas sont disponibles, par ex. de l'AIS (1928–1940) ou encore de l'ALD (1998–2012). Le chrono-référencement n'est pas encore implémenté comme filtre de recherche sur l'interface utilisateur. Dans la mesure du possible, le chrono-référencement se réfère aux normes et standards existants, par exemple ISO 8601 ou TimeML. Dans la base de données VA_DB, il est mis en place en tant qu'attribut de données à part.

(auct. Katharina Knapp | Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Page Web



Communication scientifique sur le web  (Citer)

VerbaAlpina peut se décrire comme un environnement de recherche sur le web, orienté sur l'espace géographique. Ce format est déterminé par les conditions générales actuelles qui se distinguent considérablement de la communication scientifique traditionnelle. Au sein de toutes les disciplines qui travaillent de manière 'classique' avec des données empiriques, on peut distinguer trois phases successives:
  1. Le scientifique cherche des informateurs.
  2. Les informateurs fournissent des données primaires au scientifique.
  3. Le scientifique fait passer une certaine quantité des données relevées qui ont été sélectionnées et modelées selon des hypothèses théoriques à un public essentiellement scientifique.
La communication au cours de ces trois phases se déroule de manière unidirectionnelle et vise à une publication terminée, conclue sous forme de livres imprimés.

Les trois pas de la communication scientifique traditionnelle

Les nouveaux médias ont révolutionné les conditions générales de la communication scientifique: l'unidirectionalité ébauchée de la circulation de l'information est tout aussi abolie que l'attachement d'un rôle (INFORMATEUR, AUTEUR, LECTEUR) à des personnes différentes; de principe, la même personne peut participer à la communication dans des fonctions rapidement changeantes. La fonction INFORMATEUR est fondamentalement changée compte tenu des personnes communicantes, en effet la gestion des données fournies reste transparente et peut être suivie de façon continue. L'INFORMATEUR devient ainsi LECTEUR de ses propres DONNÉES – indépendamment de s'il comprend l'intention scientifique ou pas. En même temps, il lui est possible de prendre position sur ses propres données comme AUTEUR. Le statut des données mêmes se change au moins aussi radicalement dans ces conditions car elles sont déposées dans une base de données fondamentalement dynamique dont le volume et la structure restent soumis à des changements.


Communication scientifique dans les conditions de l'Internet

Dans ce sens, VerbaAlpina s'établit comme environnement de recherche avec des domaines de fonction différents, mais étroitement liés entre eux.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Concept  (Citer)

Le domaine des concepts (ou de l'onomasiologie) est varié. Trois domaines thématiques sont prédéfinis :
- la vie quotidienne traditionnelle
- l'environnement naturel
- la vie quotidienne moderne
Ces domaines n'ont pourtant pas de pertinence pour l'organisation des données au niveau de la base de données. A ce niveau, ce sont plutôt les champs conceptuels spécifiques qui sont pertinents, comme par exemple l'alpage dans la vie quotidienne traditionnelle. Tout d'abord, les catégories de la vie quotidienne se laissent saisir par des concepts de degré d'abstraction ou de spécification très différents ainsi que par les hiérarchies taxonomiques en résultent. Entre les concepts de niveaux hiérarchiques différents existent des :
(1) Relations d'inclusion
rigoureuses. Les relations d'inclusion raccordent des hyperonymes et des hyponymes de telle manière que chaque définition d'un hyponyme contient son hyperonyme et le spécifie. Pour cela un exemple d'une catégorie conceptuelle:
  • hyperonyme : BÂTIMENT
  • hyponyme de premier niveau : CHALET, ÉTABLE, CAVE DE FROMAGE etc.
  • hyponyme de deuxième niveau: CHALET DE PIERRE, CHALET DE BOIS, CHALET DE BOIS AVEC FONDATIONS DE PIERRE etc.
Chaque chalet etc. est aussi un bâtiment, mais l'inverse n'est pas valable. Le concept inclus est plus abstrait et sur ce point supérieur dans la représentation en forme d'arbre (graphe).

Entre les concepts qui sont sur le même niveau hiérarchique existent par contre toujours des
(2) Relations d'exclusion
Un chalet n'est ni une étable ni une cave de fromage.

Par contre, une hiérarchie très différente est celle résultant de concepts complémentaires, lesquels forment une relation de fonction complexe devant aussi être comprise comme concept. Ici on parle de
(3) Relations tout/partie
Il y a des sections différentes qui appartiennent au champs de l'ALPAGE (tout): le TERRAIN, le BÉTAIL, le PERSONNEL et les ACTIVITÉS, spécialement le TRAITEMENT DU LAIT (parties).





Les relations tout/partie sont d'un côté hiérarchiques (comme les relations d'inclusion), d'un autre côté elles ne reposent pas sur l'inclusion définitoire, mais sur l'exclusion. Le schéma du champs ALPAGE montre un exemple d'une telle classification conceptuelle.





Dans le domaine des sections on peut reconnaître encore une fois un tout et ses parties constitutives. Ainsi, les ACTIVITÉS, PROCESSUS, OUTILS, RÉCIPIENTS, PERSONNES et BÂTIMENTS (parties) différents appartiennent à la PRODUCTION DU FROMAGE (tout). Les relations ébauchées entre les concepts se reflètent dans la signification de leur désignation linguistique (sémantique) et aussi dans les changements de signification : les désignations d'hyponymes peuvent être transmises à des hyperonymes et inversement. De la même manière, des transmissions de désignation peuvent se passer entre des concepts qui s'excluent, mais qui vont ensemble (métonymie) ou pour des relations tout/partie (méronymie). Les concepts liés au type de base malg- dans des variétés romanes différentes ne représentent un cas exemplaire.





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Concession d'une licence  (Citer)

Les modules de VerbaAlpina (VA_DB, VA_WEB et VA_MT) et les données y étant contenues sont soumis aux licences Creative Commons suivantes:




CC BY-SA 3.0 DE (http://creativecommons.org/licenses/by-sa/3.0/fr/; "Attribution, Partage dans les Mêmes Conditions") (dépendant de l'objet)




CC BY-NC-SA 3.0 DE (http://creativecommons.org/licenses/by-nc-sa/3.0/fr/; "Attribution, Pas d'Utilisation Commerciale, Partage dans les Mêmes Conditions").

Certains des fichiers média du module VA_MT que VA a reçus ou achetés peuvent aussi être soumis au copyright. Les objets dans le module VA_MT sont chaque fois marqués des signes correspondants.

Le système de concession d'une licence ainsi que les droits d'accès des groupes d'utilisateurs de VA différents sont montrés dans le graphique suivant:





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information Page Web



Contact linguistique  (Citer)

Concernant le contact linguistique – le contact des variétés linguistiques en fait aussi partie – on doit différencier deux modèles radicalement différents: ou bien il s'agit d'intégrats stables, indépendants du locuteur ('emprunts') – sur le niveau du système linguistique – ou bien il s'agit de phénomènes individuels – au niveau du locuteur. Ces derniers, d'autre part, peuvent correspondre à des emplois habituels ou alors complètement occasionnels, dits switchings. Cette réserve doit toujours être faite, même quand on interprète des matériaux issus d'atlas anciens et dès qu'un informateur exprime une forme proche du standard ou, dans les régions bilingues, une forme de la seconde langue. La différence, théoriquement fondamentale, est plus ou moins probable face aux données linguistiques, pourtant, elle n'est en fait jamais évidente. Seulement l'accroissement des informateurs, ce qui devient tout à fait réaliste grâce aux médias sociaux, promet des informations fiables dans ce domaine.



(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Continuité  (Citer)

Il est extrêmement important de prendre en compte la continuité de tradition lorsque l'on reconstitue des espaces de communication plurilingues; elle doit être travaillée de manière pluridisciplinaire dans le sens d'une procédure dirigée par les données, inductive. On peut difficilement s'attendre à trouver des réponses en ce qui concerne les substrats pré-romains, même en réunissant des forces de plusieurs disciplines. En revanche, la situation vis-à-vis du substrat romain dans les régions germaniques et slaves est bien meilleure. Le changement de langue du roman à l'allemand constitue tout simplement une constante historique que l'on peut observer même aujourd'hui dans les Grisons. #Karte der Germanisierungsphasen des ganzen Alpengebiets?# Le processus a commencé dès l'effondrement de l'infrastructure romaine (en 476). La période qui suit immédiatement est très intéressante pour l'histoire linguistique, elle est pourtant très mal documentée par écrit, de sorte que la coopération avec d'autres matières historiques, spécialement avec l'archéologie, est indispensable. Il est vrai qu'il y a encore de grandes lacunes de recherche, mais grâce à Weindauer 2014 une remise à jour des sources archéologiques et onomastiques (du 6ème au 8ème siècle) de Haute Bavière, de la région de Salzbourg et de la vallée de l'Inn tyrolienne a eu lieu. Il en ressort qu'on peut exclure "eine längere, grundlegende Siedlungsunterbrechung zwischen Römer- und Bajuwarenzeit" (traduction: une interruption d'habitat plus longue et fondamentale entre l'époque romaine et l'époque des Bavarii) parce que tout plaide en faveur d'un "fließenden Übergang der Besiedlungsstruktur von der Spätantike zum Frühmittelalter" (traduction: transition graduelle de la structure de population de l'Antiquité tardive au haut Moyen Âge) (Weindauer 2014, 248). Néanmoins une différence graduelle entre les régions mentionnées eu égard à la consolidation scientifique: "Was bezüglich des Zusammenhangs spätantiker und frühmittelalterlicher Fundstellen für das oberbayerische Alpenvorland noch überwiegend theoretisch galt {...}, findet in den österreichischen Gebieten seine nachweisliche Bestätigung: Die frühmittelalterlichen Ortsgründungen des 6. Jhs. orientieren sich fast ausschließlich an spätrömischer Infrastruktur bzw. – soweit noch vorhanden – an der romanischen Siedlungsstruktur" (traduction: ce qui était valable encore dans l'ensemble de manière théorique eu égard au rapport entre les lieux de la découverte de l'Antiquité tardive et du haut Moyen Âge pour les Préalpes de la Haute Bavière {...}, est avéré dans les régions autrichiennes: les fondations de lieu du haut Moyen Âge du 6ème siècle s'orientent presque exclusivement à l'infrastructure de l'antiquité tardive respectivement – dans la mesure où elles sont encore existantes – à la structure d'habitat romaine) (Weindauer 2014, 257).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Convention Alpine  (Citer)

La Convention Alpine est un traité juridiquement contraignant de droit international, conclu en 1991 entre les États riverains de la région alpine (la Slovénie constitue une exception, ayant seulement adhéré à l'accord deux ans plus tard, en raison de bouleversements politiques). Essentiellement, il s'agit du développement de la région alpine au-delà des frontières dans un nombre de secteurs définis et, simultanément, de la protection des espaces naturels. Au sein de la Convention Alpine, il y a un protocole d'application pour chaque secteur défini, de par lequel on planifie les mesures à prendre dans ce secteur. À l'heure actuelle (2018), il y a une petite dizaine de protocoles d'application, par exemple pour les domaines tourisme et loisirs, agriculture de montagne ou encore protection de la nature et entretien des paysages. Chaque protocole doit être ratifié séparément par les États membres de la Convention Alpine. Jusqu'ici, l'ensemble des protocoles d'application n'a pas été ratifié par tous les États membres. La Conférence alpine est l'organe décisionnel de la Convention Alpine, celle-ci se réunit tous les deux ans en moyenne.
La présidence de la Convention Alpine, toujours assurée par l'un des États membres, change également tous les deux ans. Un "Secrétariat permanent" est chargé de la coordination de la Convention Alpine, son siège principal se trouve à Innsbruck et il dispose d'un bureau à Bolzano/Bozen.
La Convention Alpine est l'un des partenaires de VerbaAlpina officiels. D'un point de vue méthodologique, la Convention Alpine est importante pour VerbaAlpina, car sa définition de la région alpine, basée sur les frontières géographiques et administratives ("périmètre de la Convention Alpine"), a été adoptée et fixée comme zone de recherche par VerbaAlpina. Cette délimitation bureaucratique est inévitable d'un point de vue méthodologique, bien qu'elle ne reflète pas suffisamment les réalités culturelles et linguistiques, aux transitions floues. Prenons par exemple la région de l'Emmental (vallée de l'Emme) en Suisse. Elle se situe tout juste hors des limites de la Convention Alpine. De ce fait, elle n'est pas prise en compte par VerbaAlpina, bien qu'elle soit, avec son industrie laitière, comparable aux économies correspondantes de la région alpine. D'un autre côté, le domaine de la Convention Alpine s'étend largement dans la zone péri-alpine bavaroise, une zone de plaine, et donc dans des régions ayant des conditions bien moins comparables aux régions montagneuses des Alpes que l'Emmental.

(auct. Stephan Lücke – trad. Julie Defert)



Coopération  (Citer)

La coopération avec d'autres projets est fondamentale pour la conception de VerbaAlpina. Elle se reflète dans de nombreux contrats de coopération avec des partenaires de projet. Son application n'est pourtant pas toujours facile; elle est gênée par des problèmes pratiques, c.-à-d. des problèmes dus aux techniques de l'information, et corrélativement des problèmes relatifs au droit. Marginalement, l'application est aussi gênée par des réserves idéologiques à l'égard de l'orientation open source. Chaque coopération est basée sur un accord formel assurant les partenaires (PVA) d'une base de données exclusivement utilisable à la télétransmission. Chaque base de données d'un partenaire est à la disposition de tous les partenaires en téléchargement. Mais la coopération ne doit bien évidemment pas être limitée à l'échange des données; au contraire, tous les partenaires sont invités (et incités) à utiliser toutes les fonctions du projet.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Crowdsourcing  (Citer)

Même si beaucoup de données linguistiques concernant les domaines d'enquête de VerbaAlpina sont déjà disponibles (en particulier dans les atlas et les dictionnaires), il est prévu de relever de nouvelles données. Ainsi il sera possible de (1) niveller les inconsistances entre les sources déjà existantes, (2) écarter lacunes et imprécisions et (3) signaler les dénominations ou les ustensiles transmis de génération en génération. Les nouvelles enquêtes ne seront pas faites en utilisant la méthode classique de l'analyse scientifique sur place, mais avec les moyens qui nous sont offerts par les médias sociaux. De telles procédures sont souvent regroupées sous l'expression crowdsourcing. Le renvoi à la crowd est ambigu sous beaucoup d'aspects, la crowd étant associée par beaucoup de gens au choix arbitraire, à l'absence de professionnalisme et à la fiabilité insuffisante; cette méfiance n'est pas complètement injustifiée, de telles méthodes s'adressent effectivement à une foule indéfinie et anonyme de personnes potentiellement intéressées. Des problèmes notables apparaissent non seulement pour les responsables du projet scientifique, mais aussi pour les destinataires (profanes ou non) : l'offre doit être suffisamment 'visible' et intéressante, et le destinataire doit avoir une compétence pratique et linguistique suffisante. Il y a des stratégies différentes pour gérer ces défis. On peut essayer de rendre l'offre attrayante via des aspects ludiques, en concevant une interface web qui ressemble à un jeu. Le groupement de projet play4science a expérimenté de pareilles offres. Après ces expériences, pourtant, il semble plus prometteur de faire comprendre à l'informateur, dans le cas de VerbaAlpina au locuteur, qu'il peut contribuer essentiellement et directement à la recherche par son savoir spécifique et linguistique personnel (cf. la liste des projets citizen science). La compétence des informateurs peut être évaluée par des questions de savoir spécifiques, mais il est sans doute plus digne de foi de se faire confirmer et valider les données fournies par d'autres locuteurs des mêmes localités.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Description de concept  (Citer)

Les concepts sont saisis comme suit dans le tableau KONZEPTE (concepts) de la base de données : existe une dénomination lexicalisée pour un concept, alors cette dénomination s'inscrit dans la case 'Name_F' (dénomination française) de la base de données. Si la lexicalisation manque, la case reste blanche. Indépendamment de l'existence ou non d'une dénomination, le concept sera décrit dans la case 'Beschreibung_F' (description française) en suivant une procédure fixe. La voici présentée à l'aide de l'exemple du concept 'ÉCRÉMOIR' (ID_Konzept 142; identifiant du concept dans la base de données): le concept mentionné est désigné par un lexème spécifique, on inscrit donc ÉCRÉMOIR dans 'Name_F'. La description prévoit l'ordre hiérarchique suivant: ustensile, fonction, matériau, (éventuellement) forme. Appliqué au concept de l'exemple, il en résulte la description suivante: USTENSILE, POUR ÉCRÉMER, LOUCHE.
Si possible ou si c'est nécessaire, il faut suivre ces règles supplémentaires: les nombres 1-10 sont écrits en toutes lettres; dans la description d'un processus, d'une activité etc. on peut ou utiliser "pour+infinitif" ou "pour+article+substantif". L'observation de ces modèles permet des traductions analogues, la formation de catégories indépendantes de langues particulières à des niveaux différents d'abstraction (->RÉCIPIENTS ->RÉCIPIENTS POUR LE TRANSPORT ->RÉCIPIENTS DE BOIS etc.), des corrections automatisées et une recherche transparente. Tous les concepts sont saisis de cette manière dans les langues allemande, italienne, française, slovène et romanche.

(auct. Giorgia Grimaldi | Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Désignation  (Citer)

Par 'désignation', VerbaAlpina entend l'instance idéalisée d'un mot, écrit, parlé ou pensé, qui dénomme un ou plusieurs concepts et, renvoie le cas échéant à des choses concrètes. Une séquence spécifique de plusieurs mots, pas nécessairement un mot seul, peut aussi assumer ces fonctions (séquence appelée lexie plurilexicale). Concernant la catégorie 'concept' il y a une relation m:n, en termes informatiques : une désignation polysémique peut désigner plusieurs concepts; et vice versa, un concept peut être désigné par une multitude de désignations synonymes.





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Dictionnaires de référence  (Citer)

Dans le cadre de la typisation (réduction à types), centrale pour le projet VerbaAlpina, les dictionnaires de référence ont une grande importance. Pour garantir la comparabilité du matériel, toutes les données qui sont extraites des sources – aussi bien des types phonétiques que des types morpho-lexicaux – se réfèrent à un cadre de référence lexicographique. Le travail de réduction à types est fait par les employés de VerbaAlpina et s'appuie sur leur expertise linguistique. Ce travail est donc un travail interprétatif et ne prétend pas à la validité incontestable. Les données extraites des sources sont liées aux lemmes des dictionnaires de référence mentionnés ci-dessous. Dans une famille linguistique, les données linguistiques qui doivent être réduites à types sont liées aux lemmes appropriés des dictionnaires de références spécifiques pour la région linguistique. Vice-versa il est donc possible de trouver toutes les données classées de VerbaAlpina en partant des lemmes des dictionnaires de référence. Sur ce point, VerbaAlpina représente un élargissement organique des dictionnaires de référence utilisés, élargissement techniquement réalisable sans grands problème au moyen de mises en relation.
Si aucun des dictionnaires de référence définis ne présente de lemme approprié, VerbaAlpina fixe un type morpho-lexical orthographique qui prend dorénavant le statut de référence et auquel toutes les autres données linguistiques de cette catégorie morpho-lexicale peuvent être référées. Par cet auto-référencement, VerbaAlpina obtient aussi le statut de dictionnaire de référence.
Comme cette attribution aux dictionnaires de référence correspond à un travail demandant interprétation, VerbaAlpina permet aux scientifiques et aux profanes de commenter de façon controversée des attributions de lemme. Cela permet aux personnes externes de faire des réductions à types alternatives qui peuvent à leur tour être commentées et discutées.

Les mors des régions germaniques sont liés si possible aux lemmes de :

  • Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch
  • Grimm, Jacob und Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm, 16 volumes subdivisés en 32 tomes, Leipzig (Quellenverzeichnis Leipzig 1971) (DWB)
  • Duden (pris en considération à cause de son importance effective et de l'abondance de matériel- malgré la pauvreté des informations lexicographiques présentées)

Les mots des régions romanes sont liés si possible aux lemmes de:

Les mots des régions slaves sont liés si possible aux lemmes de :
  • Slovar slovenskega knjižnega jezika (SSKJ)

Si nécessaire (spécialement en vue des étymons), le dictionnaire de référence pour la langue latine est :
  • Georges, Karl Ernst (1913-1916, Reprint 1998): Ausführliches lateinisch-deutsches Handwörterbuch. Aus den Quellen zusammengetragen und mit besonderer Bezugnahme auf Synonymik und Antiquitäten unter Berücksichtigung der besten Hilfsmittel ausgearbeitet, 2 Bände, Darmstadt.
Pour la détermination de l'étymologie des types de base, ce sont les dictionnaires suivants qui servent de référence :
  • Wartburg, Walther von (1922-1967): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel (FEW), avec ses commentaires (qui ferment les articles) souvent fondamentaux au-delà du français ou même du roman.
  • Kluge
  • DELI
  • Bezlaj et sous l'édition la plus récente Snoj. Cf. généralement pour les étymologies slaves Berneker
  • Si possible, les lemmes de l'AWB servent de forme de référence pour les types de base germaniques, car ils représentent les formes documentées les plus anciennes.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Digital Object Identifier (DOI)  (Citer)

Le Digital Object Identifier (DOI) est une adresse mondiale unique et inchangeable, grâce à laquelle les ressources électroniques, comme par exemple les sites web, sont accessibles. L’accessibilité reste garantie même lorsque l'"Uniform Resource Locator" (URL) d’une ressource change. L'avantage principal du système DOI est donc de pouvoir citer pérennement les ressources électroniques. On peut y accéder par un simple mapping : la fondation DOI tient un registre dans lequel l’actuelle URL d’une ressource est systématiquement associée à un DOI. Lors de la modification d’une URL s’ensuit la modification correspondante dans le registre de la fondation DOI. Les modifications doivent être communiquées à la fondation DOI par l’intermédiaire des organisations associées (par exemple les bibliothèques) qui ont fait enregistrer les DOI en question. La saisie dans le registre DOI par VerbaAlpina se fait en passant par le "Referat Elektronisches Publizieren" de la bibliothèque universitaire de la LMU qui effectue quant à elle l’enregistrement non pas directement auprès de la fondation DOI, mais auprès de DataCite, lui-même une composante de la fondation DOI.

Le DOI de VerbaAlpina est le suivant : 10.5282/verba-alpina. Le préfixe, les chiffres (10.5282), se rapporte à l’organisation enregistreuse, dans ce cas la bibliothèque universitaire de la LMU. Pour qu’une citation, par exemple dans une dissertation scientifique, renvoie directement au portail de VerbaAlpina, il faut que le DOI soit intégré dans l’URL de la fondation DOI : http://dx.dopai.org/10.5282/verba-alpina.
La convocation immédiate de données spécifiques partielles sur le portail VerbaAlpina (par exemple de données singulières dans le module médiathèque de VerbaAlpina [VA_MT]) par l’intermédiaire du DOI n’est pas possible. Il faudrait un DOI supplémentaire pour chaque donnée partielle de VerbaAlpina.

Le Uniform Resource Name (URN) a presque le même objectif que le DOI, et son mode de fonctionnement est à peu près le même. A la différence du DOI, on peut cependant enregistrer de multiples URL pour une ressource. Cela peut être intéressant si les ressources, afin de garantir pérennité ou cas de défaillance, sont déposées dans différents serveurs avec des URL différents leur correspondant. Un certain inconvénient des URN par rapport aux DOI réside dans le fait que le registre URN n’est pas administré par une institution unique, mais par différentes organisations nationales décentralisées. Pour l’Allemagne, c’est la Bibliothèque Nationale Allemande (Deutsche Nationalbibliothek) qui prend en charge cette mission, c’est pourquoi le serveur régissant les URN (le Resolver) doit être convoqué pour les ressources qui sont enregistrées sur la DNB. L’URN de VerbaAlpina est la suivante : urn:nbn:de:bvb:19-verba-alpina-8, l’URL correspondante au resolver DNB menant au portail de VerbaAlpina est http://nbn-resolving.de/urn:nbn:de:bvb:19-verba-alpina-8.
De même que dans le cas des DOI, la convocation immédiate de données spécifiques partielles sur le portail de VerbaAlpina par l’intermédiaire de l’URN n’est pas possible.



(auct. Stephan Lücke | Julian Schulz [ITG])

Tags: Technologie de l'information



Documentation  (Citer)

VerbaAlpina documente la variation dialectale au sein d'un espace ethnographique défini. Le cadre onomasiologique est délimité par des techniques culturelles et des modes de vie devenus conventionnels, ce dans des conditions environnementales spécifiques et indépendantes des différentes cultures en place. De tels espaces, desquels les Alpes représentent un prototype, n'ont pas pu être saisis dans toute leur mesure par les traditions de recherche linguistiques, parce que les disciplines partielles qui concernent la constitution d'espaces – la géographie linguistique, la dialectologie ou encore la géo-linguistique – s'orientent presque sans exception à des frontières politiques et/ou linguistiques déjà tracées. On arrive certainement à comprendre l'orientation spatiale des études centrales, à maints égards toujours déterminantes (cf. par ex. l'AIS et le FEW), mais on n'est souvent pas du même avis. Justement, ce sont les régions culturelles plurilingues qui sont les plus particulièrement fascinantes, comme par ex. la région entre la côte adriatique monténégrino-albanaise et le Danube, et qui ne sont pourtant pas prises en considération par la recherche établie, dirigée selon des présuppositions philologiques pensées nationalement. L'Atlante linguistico mediterraneo, qui a été planifié de manière ambitieuse, aurait pu devenir un grand projet novateur, malheureusement il n'a jamais dépassé la phase initiale.
VerbaAlpina vise la région alpine.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Données complémentaires  (Citer)

Dans le cadre d'une approche inductive à l'espace culturel les données démographiques et institutionnelles sont intéressantes dès qu'elles se révèlent être géo-référenciables. A ce type de données appartiennent les informations concernant l'histoire de l'habitat, en particulier par rapport aux institutions ecclésiastiques ou étatiques. Les voies de communication aussi, en particulier les cols de montagne, sont extrêmement importantes (cf.). Les données écologiques et géophysiques sont importantes à partir du moment où elles sont en rapport avec l'histoire de l'habitat. Cela est le cas par exemple des zones de végétation, qui permettent ou exigent certaines utilisations (par ex. l'alpage suppose une altitude au-dessus de la limite de celle des forêts et des arbres).(http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_FR)

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Données d'autorité  (Citer)

L'origine de la notion des données d'autorité se trouve dans le système de bibliotèques. En catalogisant des publications, par exemple, l'identificaton sans équivoque des auteurs est indispensable pour assurer l'attribution correcte des œuvres, indépendemment de variantes graphiques ou de changements de noms. Cette exigence porte également sur l'indexage des titres de publications où il s'agit par exemple d'identifier sans équivoque et de relier des termes géographiques pouvant faire l'objet d'ouvrages diverses. Ces contraintes on mené au développement de listes onomasiologiques, individuelles dans un premier temps selon les différentes bibliothèques.

Avec les nouvelles techniques d'interconnexion d'ensembles de données, nées dans les années 1970, il fallut bientôt concorder les indexes jusqu'alors individuels des différentes bibliothèques. Par conséquent, les bibliothèques commencèrent au cours des années 1980, au plus tard – les premières conceptions eurent lieu vers la fin des années 1970 – à harmoniser les indexes individuels pour obtenir une consistence englobant toutes les bibliothèques. Au début, des registres séparés pour les personnes (allem. Personennamendatei, PND) et les collectivités publiques (allem. Körperschaftsdatei, GKD) ainsi qu'une nomenclature de mots-clés (allem. Schlagwortnormdatei, SWD) furent établis. Après un moment, la séparation thématique résultante s'avéra inappropriée, d'autant que les personnes et les collectivités peuvent figurer non seulement commes des auteurs ou des éditeurs mais à aussi comme l'objet de publications à leur tour, devant également se considérer lors des indexations sur la base du fichier d'autorité des mots-clés. C'est pour cette raison qu'entre 2008 et 2012, les trois fichiers d'autorité individuels (y compris le fichier d'autorité des titres uniformes des archives de musique allemandes) s'unifièrent dans un effort commun de la Bibliothèque nationale allemande et des associations de bibliothèques germanophones pour former un type d'autorité s'appelant GND (allem. Gemeinsame Normdatei, GND). Ce dernier est à disposition du public depuis 2012 dans des formats divers (MARC 21 Authority, MARC21-xml et RDFxml) et s'utilise de plus en plus pour des buts d'indexage en dehors du système de bibliothèques. Les projets en humanités numériques BMLO (Bayerisches Musiker-Lexikon online) et Kaiserhof réalisés par l'ITG (allem. IT-Gruppe Geisteswissenschaften), notamment, s'en servent pour assurer l'identification sans équivoque des personnes.

Sous l'adresse http://ognd.bsz-bw.de/ (centre de service bibliothécaire de Bade-Wurtemberg) on a accès à un outil de recherche compfortable pour consulter le GND. Dans le monde, il existe des types d'autorité comparables au GND, gérés dans la plupart des cas par des bibliothèques. Depuis 2003, le projet VIAF (Virtual International Authority File), mis sur pied dans une collaboration entre la Bibliothèque nationale allemande et la Bibliothèque du Congrès, poursuit le but de réunir et rendre accessibles ces ensembles de données au sein d'un seul système.
Cependant, si en théorie le système des tyes d'autorité permet l'identification sans équivoque des personnes et des concepts, l'exploitation pratique dépend largement de l'implémentation technique dans les systémes électroniques des catalogues de bibliothèques. Dans les catalogues de la Bibliothèque nationale allemande et de la Bayerische Staatsbibliothek (BSB), la recherche du mot-clé "Homère" donne aussi des résultats que le système bibliothécaire a saisi sous "Homer". Inversément, en cliquant sur un nom d'auteur hyperlié dans le catalogue en ligne de la BSB on obtient actuellement (oct. 2018) non seulement les titres de l'individu en question mais aussi ceux d'autres auteurs du même nom.

Le concept des données d'autorité s'étant originé dans le contexte du système de bibliothèques son utilisation s'est cependant généralisé entretemps dans d'autres domaines. À titre exemplaire on peut citer les projets suivants: Geonames (entité geographica), Pleiades (entité geographica antiques) ou encore Glottolog (entité langues internationales).

Les données d'autorité sont particulièrement importants en vue des exigences d'interopérabilité, postulées entre autres par l'initiative FAIR. Chaque donnée d'autorité définie et dotée d'un identifiant (alpha)numérique permet non seulement l'intégration dans l'exploitation sémantique des catalogues de bibliothèques mais aussi l'interconnexion logique et technique d'entités correspondantes faisant partie d'ensembles de données indépendants.

Du point de vue de VerbaAlpina, la création des catégories de données d'autorité «type morpho-lexical» (⇒ Réduction à types et «concept» serait méthodologiquement rigoureux et, de là, souhaitable. Ainsi, on aurait la possibilité d'attribuer des identifiants aux types morpho-lexicaux et aux concepts, ce qui permettrait le référencement de données lexicales à l'échelle mondiale, même indépendemment, dans le cas des concepts, des langues individuelles. Quelques efforts dans cette direction se font remarquer: dans les ensembles de données stucturés du projet Wikidata, par exemple, on attribue des «identifiants Q» pour identifier sans équivoque des concepts extralinguistiques, fournissant ainsi une référence commune et identique pour tous les articles Wikipédia et leurs versions multilingues traitant le même sujet. Le concept du nom allemand ALMHÜTTE (chalet d'alpage), par exemple, est identifié sans équivoque sur Wikidata avec l'ID Q2649726. Dans la fiche Wikidata correspondante, on trouve des liens vers tous les articles Wikipédia, actuellement (octobre 2018) représentés en sept langues, qui sont réliés à cet identifiant. Du total des concepts saisies par VerbaAlpina se montant à 2629, 400 ont pu être reliés à un identifiant Q jusqu'à présent. D'une manière générale, les identifiants Q sont enregistrés, dans la mesure où ils existent, dans l'ensemble de données de VerbaAlpina. En revanche, ni Wikipédia ni Wikidata, respectivement, semblent disposer d'un système d'identification comparable au niveau des types morpho-lexicaux. Les identifiants L déjá en existence sont attribués à des formes langagières, mais il est peu clair s'il s'agit de types précisément définis.

A l'instar du modèle des données d'autorité, VerbaAlpina attribue leur propres identificateurs aux catégories de données (entités) «concept», «type morpho-lexical» (cf. Réduction à types) et «communauté», les identificateurs pouvant être référencés grâce au data mapping à des systèmes de données d'autorités plus établis comme p.ex. les identifiants Q de Wikidata. En outre, VerbaAlpina s'emploie à faire entrer la catégorie de données «type morpho-lexical» dans la systématique du Gemeinsame Normdatei (GND). Cet objectif prend appui sur la prémisse que le GND doit s'élargir structurellemnt mais aussi au niveau du contenu en fonction des exigences de la science et des institutions et personnes du domaine culturel. Un échange à propos de ce sujet est prévu en décembre 2018 dans le cadre de la conférence GNDCon 2018.

Le GND distingue actuellement les entités suivants: collectivité publique (sigle: b), conférence (f), donnée géographique (g), personne (non individualisée) (n), personne (individualisée) (p), objet référentiel (s), œuvre (u) (http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/entitaetenSatztypen.pdf?__blob=publicationFile). Par ailleurs, dans une fiche du GND appartenant à la catégorie «Arbeitshilfen zur gemeinsamen Normdatei (GND)» on trouve l'information que le code d'entité «slz», représentant une sous-catégorie de l'entité «objets référentiels», a été réservé pour les données de la catégorie «lettres, morphèmes, mots comme objet de recherches linguistiques». Dans cette logique il serait évident de relier les données d'autorité de VerbaAlpina avec celles de cette catégorie.

Référence:
Capellaro 2003

(auct. Stephan Lücke – trad. Sonja Schwedler-Stängl)

Tags: Technologie de l'information



Données d'entrée  (Citer)

Au sein de VerbaAlpina sont utilisées exclusivement des données géoréférenciées au moins sur le territoire d'une commune, et si possible encore plus précisément (par exemple des photos d'alpages). À l'égard de données linguistiques particulièrement importantes, deux types sont à distinguer : d'un côté, les données remontant directement aux énoncés des informateurs individuels – comme par exemple les attestations de certains atlas linguistiques (spécialement les atlas romans) ou de la Bayerische Dialektdatenbank (BayDat); ces énoncés sont décomposés selon leurs éléments constitutifs, les tokens. De l'autre, des formes déjà typisées par les éditeurs – en effet certains atlas, par exemple le SDS, le VALTS ainsi que les dictionnaires, ne contiennent pas d'énoncés de locuteur, de sorte qu'il n'est pas possible de remonter jusqu'aux tokens.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Entité-association  (Citer)

Par principe, les données peuvent être regroupées en "entités". Il s'agit de classes de données, chaque classe possédant des caractéristiques spécifiques variant en nombre et en nature. Ainsi, les villes de Trente, d'Innsbruck et de Lucerne peuvent former une classe "lieux", classe à laquelle appartiendraient les caractéristiques "nom de lieu", "longitude", "latitude", "pays" et "nombre d'habitants". Les constituants individuels d'une telle classe diffèrent les uns des autres selon les données fournies par ces caractéristiques. Dans une base de données relationnelle, idéalement, chaque entité est sauvegardée dans un tableau particulier. Les colonnes de ces tableaux indiquent les valeurs d'une caractéristique spécifique. Les lignes indiquent les membres individuels d'une classe de données (entité), ces membres se distinguent par les valeurs de la caractéristique. Presque toujours – et c'est le cas chez VerbaAlpina – une base de données relationnelle représentera une collection de différentes entités (et par conséquent de tableaux) liées par des relations logiques. Ainsi, l'entité "informateur", définie par les caractéristiques "âge", "sexe", "lieu de naissance" et "domicile", sera liée logiquement à l'entité "lieux" de telle manière que les valeurs des caractéristiques "lieu de naissance" et "domicile" aient des correspondances dans l'entité "lieux". Les relations entre les membres de ces deux entités résultent des correspondances de valeurs d'une ou de plusieurs caractéristiques coïncidentes des entités respectives. Ainsi, théoriquement, si les valeurs fournies par les caractéristiques "lieu de naissance" et "nom de lieu" coïncident, une affectation pourrait se faire, par laquelle les coordonnées géographiques du lieu de naissance d’un informateur apparaîtraient automatiquement. Cet exemple démontre que l'on peut être confronté à des problèmes d'homonymes. Pour éviter cela, on utilisera généralement des entiers relatifs comme identifiants (abréviation: "ID") qui définissent de façon univoque les membres d'une entité. Le système décrivant les entités et leurs relations logiques s'appelle "entité-association".
Les données recueillies dans une base de données relationnelle sont difficilement intelligibles et utilisables sans que le système de dépendance utilisé soit expliqué. L'entité-association est représentée normalement sous la forme d'un schéma graphique. L'entité-association est soumise à des adaptations continues et par conséquent à des modifications pendant les phases de développement cycliques de VerbaAlpina (cf. gestion de versions). Chaque fois qu’une version de VerbaAlpina est archivée, est ajouté le modèle entité-association correspondant à cette version. Il se présente sous forme d’un diagramme ER, généré avec le programme yEd et enregistré sous GraphML. Les diagrammes créés à l'aide d'outils automatiques ne sont ensuite pas édités graphiquement, en raison de la charge de travail considérable que cela implique. Pour cette raison, et à cause de la grande complexité des structures représentées, ils ne sont généralement pas immédiatement compréhensibles pour des personnes extérieures. Ils contiennent néanmoins toutes les informations nécessaires pour comprendre la structure de VA_DB et représentent donc une condition préalable importante pour utiliser la base de données, même après la fin du financement du projet. Le graphique suivant est basé sur les entités et les liens de la base de données VA_XXX dans son état actuel (30.11.2017), mais il ne les représente pas complètement et doit seulement être vu comme un exemple illustratif :





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Environnement de recherche  (Citer)

Les tâches et les prestations de VerbaAlpina peuvent être classées selon les domaines suivants :
(1) documentation et analyse diachronique du vocabulaire dialectal étant estimé caractéristique conformément au cadre onomasiologique ;
(2) coopération avec les partenaires de projet pour l'échange mutuel et l'analyse des données ;
(3) publication des données, de textes analytiques et de différents matériaux concernant le projet, visant un public aussi bien scientifique que général.
Les fonctions (1), (2) et (3) ont déjà été activées avec la première version 15/1; à partir de la version 17/1 a été ajouté:
(4) enquête des données par le crowdsourcing.
Toutes les fonctions actives seront étendues continuellement. Une autre fonction est en cours de préparation:
(5) installation d'un laboratoire de recherche.






(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Ethnolinguistique  (Citer)

"On ne peut pas faire l'histoire des mots sans faire l'histoire des choses" (Jaberg 1936, 23).
Traditionnellement, en ce qui concerne la recherche en langues romanes, surtout en langue italienne, la dialectologie est depuis le début, c.-à-d. en Italie au moins depuis Giuseppe Pitré, très étroitement liée aux sciences sociales, plus précisément à la sociologie et à l'ethnologie. Dans cette perspective, toute la géo-linguistique peut être considérée comme matière partielle d'une 'ethnoscience' générique. Cette expression, utilisée ici comme traduction d'ita. etnoscienza (de l'eng. ethnoscience), ne s'est toutefois établie ni en Italie ni en Allemagne. Dans le très pertinent et très informatif Manuale di etnoscienzade Giorgio Raimondo Cardona (Cardona 1995) on peut lire les mots suivants:

"[...] il prefissoide etno- permette un'immediata 'etnologizzazione' di qualunque sottodisciplina [...]. L'inglese offre ancora un altro tipo di formazione, quella con folk- (folk-taxonomy), che ha però lo svantaggio di non essere atrettanto facilmente esportabile quanto il suo concorrente grecizzante.
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 s.; gras par TK)  

L'etnoscienza ainsi ébauchée est désignée aussi comme cultural anthropology dans la tradition des États-Unis d'Amérique. De plus, dans les pays germanophones, on distingue la Volkskunde pour l'exploration de culture(s) indigène(s) de la Völkerkunde pour l'exploration de cultures étrangères, spécialement non-européennes. Actuellement, on parle au lieu de cela le plus souvent d'Ethnologie (fra. ethnologie), comprenant le domaine spécial de l'ethnologie européenne (au sens de Volkskunde). C'est pourquoi la désignation ethnolinguistique n'est pas claire, étant souvent limitée à l'exploration linguistique de cultures non européennes (cf. Senft 2003) même si elle ne devrait pas exclure les européennes; une séparation catégorique se révélant de toutes façons de plus en plus vaine face aux flux migratoires massifs et vastes.

Un flou dans le passage cité de Cardona doit encore être résolu; il concerne le 'préfixoide' ethno- qui est d'un côté synonyme de l'anglais folk et de l'autre est utilisé en faisant référence à etnia. Par folk (eng. folk-taxonomy etc.) on renvoie à des savoirs et conventions relatifs à la culture du quotidien des non spécialistes ou bien non scientifiques et c'est à ce sens qu'ethnie (ou bien ethno-) aussi devrait faire référence à des communautés de culture de vie quotidienne, sans pourtant impliquer des idées idéalisées d'homogénéité, archaïcité, fermeture sociale etc.. La distinction de Cardona (a vs. b) renvoie de plus à deux perspectives de recherche complémentaires au sein des sciences sociales et culturelles.

En résumé, on peut désigner la recherche dialectologique selon Cardona (aussi à posteriori) comme 'ethnolinguistique' si elle relève et analyse ses données linguistiques en rapport étroit à la vie quotidienne des locuteurs. Dans la tradition de la linguistique romane, cette orientation a été établie de façon prototypique par le Sprach- und Sachatlas Italiens und der Südschweiz (AIS); elle marque sans doute la plus grande différence et le plus grand progrès à l'égard de l'ALF, comme Karl Jaberg le fait observer avec une certaine emphase. Le passage instructif relatif à l'histoire de la discipline mérite d'être mis en valeur, il montre comment les auteurs de l'AIS eux-mêmes se positionnaient:

"L'importance des «choses» n'a pas échappé à l'esprit de Gilliéron [...] Que Gilliéron ait complètement négligé ce point de vue dans la conception de l'Atlas et qu'il n'en ait tenu compte qu'en passant dans ses autres publications, c'est un fait d'autant plus étrange qu'il connaissait fort bien les «choses» et s'y intéressait passionnément. A-t-il approuvé l'enseignement que Ferdinand de Saussure a tiré de ses incursions dans les domaines limitrophes de notre science, à savoir que la «linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même», principe qui, malgré l'admiration que j'ai pour le grand savant genevois, m'a toujours semblé singulièrement rétrécir le champ d'action du linguiste." (Jaberg 1936, 27 s.)

Jaberg attire explicitement et à juste titre l'attention sur le fait que justement sur ce point précis le structuralisme saussurien garde les idées des néogrammairiens. Du point de vue de la géo-linguistique contemporaine la tentative de regarder la langue comme un 'module' pouvant être isolé n'était donc absolument pas perçue comme un paradigme nouveau, mais tout simplement comme traditionaliste:

"La conception du Petit Atlas phonétique du Valais roman [également de Gilliéron; TK] et celle de l'Atlas linguistique de la France remontent à une époque qui était encore sous l'empire des néogrammairiens, et on sait ce que les néogrammairiens doivent aux sciences naturelles. Ce n'est certes pas un hasard que le Cours de linguistique générale s'en ressente également. M. Jud et moi, nous avions pas ces attaches avec les néogrammairiens, Gilliéron lui-même nous avait aidés à les rompre. Nous étions en revanche fortement impressionnés par les brillants articles de Meringer et de Schuchardt. La réalité des choses était autour de nous. Nous avions nous-mêmes parcouru les pays romans ; nous avions recueilli sur le terrain des observations ethnographiques et folkloriques. Comment en rester aux mots ? Tout en sauvegardant le caractère essentiellement linguistique de notre ouvrage, nous croyions devoir fournir à l'historien des mots les données nécessaires pour se faire une idée des choses, afin qu'il ne bâtisse pas dans le vide." (Jaberg 1936, 28).
 

L'étude de Hugo Plomteux 1980 sur la Cultura contadina in Liguria, née de l'observation participative, est innovatrice pour la tradition ethnolinguistiquement orientée de la dialectologie italienne. Une région ethnolinguistiquement très bien analysée – en comparaison avec les autres, peut-être même la région la mieux analysée – est la Sicile. Ce sont surtout Fanciullo 1983 et plusieurs études importantes qui ont été faites dans le cadre de l'Atlante linguistico della Sicilia qui doivent être mentionnés à cette occasion. Les œuvres suivantes offrent des renseignements sur les techniques et traditions culturelles chaque fois étudiées: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 et Castiglione 1999.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Etymologie  (Citer)

Pour dégager les strates linguistiques, la stratigraphie requiert une étymologisation. Le commentaire étymologique part à chaque fois du type de base, visant un triple but :
- déterminer la langue d'origine de la base lexématique ;
- justifier l'union de tous les types liés au même type de base; pour ce faire, on recourt aux régularités de la phonétique historique et à la plausibilité sémantique des relations conceptuelles.
- reconstruire les trajets des emprunts si le type de base est répandu dans plusieurs régions linguistiques; dès que la langue de l'étymon d'un côté et de l'informateur de l'autre ne sont pas conformes, on constate automatiquement un contact linguistique.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Familles linguistiques dans les Alpes  (Citer)

Dans le territoire de la Convention alpine et donc dans la région étudiée de VerbaAlpina, des langues de trois familles linguistiques sont traditionnellement parlées. Toutes les trois sont représentées par des continua dialectaux. Le degré de différenciation de ces continua dépend manifestement aussi de l'étendue de leurs zones de diffusion. La fragmentation de la zone romane est plus grande que celle de la zone germanique et celle-ci est à son tout plus grande que la slave; les atlas linguistiques correspondants nous renseignent sur la situation dialectale. Dans VerbaAlpina, les lieux de l'enquête des différents atlas sont liés entre eux et il en résulte un réseau étendu plurilingue. Au niveau des langues nationales ainsi que des langues des minorités, régionalement implémentées, c'est seulement la Romania alpina qui a plus de subdivisions. En plus du français et de l'italien, d'autres langues sont officiellement reconnues comme langues nationales ou langues de minorité, ce sont le romanche en Suisse et l'occitan, l'arpitan (ou francoprovençal) reconnu officiellement dans la Vallée d'Aoste, le ladin et le frioulan en Italie. Dans la Slavia alpina e dans la Germania alpina, il n'existe qu'une langue standard, respectivement le slovène et l'allemand. Eu égard à la langue allemande pluricentrique, on doit différencier au moins trois variétés standard nationales coexistantes en Suisse, en Allemagne et en Autriche.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Format des données  (Citer)

voir Modélisation des données

Tags: Technologie de l'information



Géolinguistique analogique  (Citer)

Les dimensions du savoir qui font partie de l'horizon épistémique de VerbaAlpina, c.-à-d. les CHOSES, les CONCEPTS et les MOTS, sont en général unies de manière très étroite et souvent complètement indéfinie dans la présentation analogue pratiquée par la géolinguistique traditionnelle. La carte AIS 1192a LA CASCINA DI MONTAGNA en est un cas exemplaire (la carte est une partie de cette carte de VerbaAlpina). Le titre de la carte a tout d'abord le statut d'un concept, à savoir le bâtiment, "wo ein gut ausgebildeter Käser ('Senn') mit Hilfspersonal die Milch sachgemäss zu Käse, Butter, Zieger verarbeitet" (traduction: où un fromager qualifié transforme le lait en fromage, beurre, sérac de manière adéquate avec du personnel auxiliaire). En plus, on apprend qu'il s'agit d'un hyperonyme, car certains chalets servent d'entrepôts à la fois pour le lait et le fromage tandis que dans d'autres cas il y a des caves séparées pour le lait et pour le fromage; caves qui à leur tour peuvent être peuvent être soit contiguës à un édifice, soit séparées et à travers lesquelles, souvent, s'écoule un cours d'eau. En outre, le "meist massive steinerne Sennhütte" (traduction: chalet massif le plus souvent en pierre) doit être distingué de ceux en bois etc. En d'autres termes : il y a toute une typologie de concepts subalternes et spécifiques et il n'est pas toujours clair quel chalet exactement est entendu par le mot attesté sur la carte. Le concept du titre de la carte est donc souvent trop peu spécifié et l'existence d'autres désignations pour des chalets plus spécifiques ne peut être exclue pour aucune localité; les dictionnaires de dialecte confirment constamment cette impression. En même temps, deux autres concepts qui ne sont pas hyponymes de CHALET entrent en jeu: CAVE POUR LE LAIT et CAVE POUR LE FROMAGE. En outre, la même légende fait référence à la présence fréquente de bâtiments où on loge différents animaux, y compris des cochons, ce qui revient donc à un troisième concept encore. Les désignations pour ces autres concepts ne sont pas citées dans la carte topographique, mais en marge sous forme de listes, qui montrenten général des attestations pour peu de localités seulement. En même temps, il arrive souvent que des mots polysémiques apparaissent sur les listes qui désignent de tout autres concepts dans les localités particulières. A ce sujet voyons le type kort qui est attesté dans la liste se référant au concept BATÎMENT ALPIN OÙ ON LOGE DES ANIMAUX pour les localités AIS 107 et 109 bien qu'il désigne tout autre concept dans une des deux attestations (point 109), et ce LIEU DE GÎTE ET DE TRAITE POUR LE BÉTAIL PRÈS DU CHALET.




Les inconsistances de ce type doivent absolument être dissipées quand on enregistre des données numériquement; c'est une exigence essentielle de distinguer et séparer strictement les dimensions épistémiques mentionnées, pour ainsi dire la déconstruction systématique des informations offertes. 





Ceci fait, les catégories consistantes permettent de consulter et de visualiser  toutes les informations disponibles à partir de la base de données, dans n'importe quelle combinaison.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géolinguistique plurilingue  (Citer)

L'un des objectifs de ce portail est de faire ressortir la force, tout à fait marquante, du contact linguistique, en particulier le conditionnement ethnolinguistique de celui-ci au cours de l'histoire de l'espace linguistique alpin. La conception de la base de données permettra de représenter, aussi de manière quantitative, les emprunts saisis dans leur accumulation locale. Ils apparaissent automatiquement quand l'appartenance d'un informateur à une des trois familles linguistiques ne correspond pas à celle de l'étymon. Trois familles linguistiques forment la région alpine moderne, sous forme de continua dialectaux chacun avec une extension et une différenciation complètement diverses. Les zones de diffusion de ces trois familles linguistiques ne coïncident d'ailleurs pas avec les territoires des États politiques. La famille germanique est représenté par des variétés alémaniques et bavaroises, attribuées à la langue allemande pluricentrique. Toutefois la référence commune aux variétés standard suisse, allemande et autrichienne, qui fonde l'affiliation à la même communauté linguistique, n'existe plus dans certains îlots linguistiques valaisans et bavarois anciens (cimbres).
Les variétés du continuum roman peuvent être attribuées – à l'inverse des régions germaniques – à plusieurs langues; en plus du français et de l'italien il s'agit, conformément à la reconnaissance politique en Suisse et en Italie de l'occitan, du franco-provençal, du romanche, du ladin et du frioulan.
Le slave est représenté par des dialectes slovènes qui hors de la Slovénie sont parlés aussi dans plusieurs communes italiennes et autrichiennes. Toutefois, ce n'est pas l'objectif de VerbaAlpina de décrire le plus complètement possible les dialectes de la région alpine, de faire ressortir les frontières des dialectes locaux ou régionaux et de représenter l'espace en quelque sorte comme mosaïque de variétés. Il s'agit plutôt, grâce à la conception géolinguistique du projet, de faire apparaître les caractéristiques (surtout lexicales) répandues au-delà des frontières de certains dialectes ou de langues particulières et dénotent ainsi une trame ethnolinguistique commune.





Etant donné que les dialectes constituent des systèmes linguistiques complets en eux-mêmes, et qu'ils représentent trois continua 'génétiquement' différents on peut prétendre que le contact linguistique sera étudié dans la perspective d'une géolinguistique plurilingue (cf. plus en détail Krefeld 2018d).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géoréférencement  (Citer)

Le géoréférencement selon les degrés de latitude et de longitude est un critère de classement essentiel pour la gestion des données de VerbaAlpina. La précision de ce référencement varie selon le type de données; on aspire un référencement le plus exact possible, au mètre près. Dans le cas des données linguistiques issues des atlas et des dictionnaires, c'est seulement un référencement approximatif conformément à un toponyme qui est en règle générale possible. Dans le cas de données archéologiques par contre, un géoréférencement au mètre près est possible. On peut sauvegarder des points, des lignes (comme des rues, des rivières) et des surfaces. Sous l'angle technique, le format WKT (https://en.wikipedia.org/wiki/Well-known_text) est principalement utilisé, celui-ci est transféré à un format MySQL spécifique dans la base de données VA par la fonction geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html et est ainsi sauvegardé. La sortie au format WKT se produit par la fonction MySQL astext().
La grille de référence du géoréférencement est établie selon le réseau des communes de la région alpine, qui peuvent être sorties ou comme surfaces ou comme points, suivant les besoins. Les tracés des frontières de commune de 2014 que VerbaAlpina a reçus de son partenaire "Conférence Alpine" en forment la base. Une actualisation permanente de ces données est superflue, même si elles changent selon les réformes administratives, car il s'agit dans la perspective de VerbaAlpina seulement d'un cadre de référence géographique. La représentation en point des communes est calculée selon les frontières communales de façon algorithmique, elle est donc secondaire, ne marquant pas nécessairement le centre bourg.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information Contexte extralinguistique



Gestion de versions  (Citer)

VerbaAlpina se compose des modules suivants :

-VA_DB: ensemble des données de la base de données du projet (MySQL) (va_xxx)
-VA_WEB: code de programme de l'interface web du portail www.verba-alpina.gwi.uni-muenchen.de avec la base de données Wordpress (va_wp) correspondante
-VA_MT: fichiers média (photos, films, textes et documents audio) se trouvant dans la médiathèque de l'interface web

Ces trois modules forment un ensemble consistant, avec des connections et dépendances mutuelles ne pouvant par conséquent pas être séparés les uns des autres. Au cours de la durée du projet, les statuts actuels des modules VA_DB et VA_WEB sont "congelés" simultanément sous forme de copies électroniques tous les six mois, le 15 juin et le 15 décembre de chaque année. Ces copies congelées reçoivent un numéro de version selon le schéma [année civile]/[numéro de série] (par ex. 15/1). La version VA actuellement productive reçoit la désignation XXX (voir manière de citer).

La production de copies de la médiathèque VA (VA_MT) est exclue à cause de la dimension énorme des fichiers média. Pour cette raison, on ne produit pas de copie de ce module au cours du processus de gestion de versions. Les éléments une fois déposés ne peuvent plus être enlevés de la médiathèque VA, et ce dès que ne serait-ce qu'une seule version VA leur est associée.

Le portail du projet offre la possibilité d'alterner entre les versions différentes, c'est-à-dire entre la version VA "productrice" qui est soumise à des changements permanents et les versions archivées, "congelées". L'utilisateur peut reconnaître s'il se trouve dans la version productrice ou dans une des versions archivées de VA selon la couleur du fond ou de certains éléments de commande. *Seules* les versions archivées doivent être citées.



Photos de couverture des versions précédentes de VerbaAlpina:

Grange en proximité de Fex Platta, dans la Val Fex à côté de Sils Maria, Haute Engadine (Image: Thomas Krefeld)

Chalet d'alpage sur la Roßsteinalm, au-dessus de Lenggries (Image: Thomas Krefeld)

15/1

Automne dans le Tyrol du Sud en proximité de la val Passiria (Image: Susanne Oberholzer)

15/2

Élaboration du fromage Mascherpa, Lombardie (Image: Formaggio Bitto )

16/1

Alpsee, Immenstadt dans le Allgäu (Image: Christina Mutter)

16/2

Récolte du foin dans le Chiemgau (Image: collection Groth-Schmachtenberger, Freilichtmuseum Glentleiten)

17/1

Récolte du foin (Image: collection Groth-Schmachtenberger, Freilichtmuseum Glentleiten)

17/2

Récolte du foin (Image: collection Groth-Schmachtenberger, Freilichtmuseum Glentleiten)

18/1

Paysage d'hiver sur la Plose au-dessus de Brixen (I)(Image: Stephan Lücke)

18/2

Vue sur les Odle à travers le Seiseralm dans le Tyrol du Sud (Image: Stephan Lücke)

19/1

Alpes de Zillertal (Image: Thomas Krefeld)

19/2



(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Gestion des données de recherche  (Citer)

Depuis l'essor des méthodes numériques, la question du traitement de ce qu'on appelle des «données de recherche» s'impose de plus en plus. Il semble que les idées courantes à ce sujet se sont fondées en fonction des pratiques en sciences naturelles où l'on a souvent affaire à de gros volumes de données de mesure qui, après être soulevées, s'évaluent par le biais de textes interprétatifs. Cette démarche implique une bipartition apparemment nette, ne considèrant comme «données de recherche» que les résultats de mesure bruts. Quoique dans le passé, et sans doute aussi dans le présent, le fait de considérer les donnés brutes comme éphémères et peu dignes d'une conservation durable est assez courant, la gestion des données de recherche s'est fixé comme objectif la représentation ainsi que le stockage et la mise à disposition durables non seulement des textes interprétatifs, mais aussi des données dits «de recherche» formant la base de ces interprétations.

En Allemagne, le domaine de la «gestion des données de recherche» (allem. Forschungsdatenmanagement (FDM)) se voit actuellemnt doter des moyens importants au niveau national ainsi qu'au niveau des länder, quelques projets étant déjà en cours. Les activités en question se poursuivent dans le souci de créer un nuage informatique à l'échelle européenne (European Open Science , EOSC). Des contributions allemandes à citer dans ce contexte au niveau suprarégional et national sont les recommandations relatives à la mise en place d'une infrastructure nationale pour les données de recherche (allem. "Nationale Forschungsdateninfrastruktur" (NFDI)), formulées par le Conseil pour les infrastructures informatiques (allem. "Rat für Informationsinfrastrukturen" http://www.rfii.de (RfII)), le groupe de recherche de l'Union des académies des sciences allemandes NFDI-Arbeitsgruppe der Akademienunion s'y référant (représentant surtout les sciences humaines) ainsi que le projet interdisciplinaire "Generic Research Data Infrastructure" (GeRDI) pris en charge par la Fondation allemande pour la recherche depuis 2016.

Dans le champ des sciences humaines, la séparation nette en apparence entre données de recherche d'un côté et données – ou textes respectivement – interprétatifs de l'autre à l'instar des sciences naturelles (qui en gardent sans doute une certaine utilité) s'avère problématique voire intenable. Pour sa part, VerbaAlpina renonce par principe à une telle distinction, favorisant plutôt la notion d'un ensemble indivisible formé par toutes les données répertoriées au sein du projet dont les unités sont entrelacées pour former un tissage aux relations multiples. En suivant ces principes relatifs au concept de la «gestion des données de recherche», VerbaAlpina déclare l'intégralité des ses données numériques (c'est-à-dire données linguistiques, commentaires, entrées de glossaire, codes numériques, données médiatiques etc.), réparties sur les modules VA_DB, VA_WEB et VA_MT, comme une donnée de recherche à conserver conformément aux principes FAIR et en observant les conseils pertinents du RfII (RfII 2016, annexe A, p. A-13). VerbaAlpina est associé à titre pilote aux projets GeRDI et «eHumanities – interdisziplinär», cités ci-dessus.

L'un des aspects principaux de la gestion des données de recherche constiste à assurer leur interopérabilité par le biais de liens persistants entre les sous-ensembles de données appartenant à des projets ou ensembles de données divers. À cet égard, les DOI («Digital Object Identifier») sont un prérequis technique indispensable assurant que les «objets numériques» soient adressables durablement et indépendamment des URL. On peut générer des DOI pour tout contenu électronique tant qu'il est accesible par URL. Dans les systèmes de gestion des bibliothèques, on s'est servi des DOI dans un premier temps pour créer des identifiants persisants de publications électroniques (p.ex.https://doi.org/10.5282/ubm/epub.25627) ou bien de sites web entiers (p.ex. http://dx.doi.org.emedien.ub.uni-muenchen.de/10.5282/asica). Contrairement à cette pratique, l'interopérabilité d'ensembles de données établis et gérés individuellement exige une granulation beaucoup plus fine. À cet effet, VA génère une série de documents accessibles sur Internet par URL contenant le matériel linguistique collectionné et regroupé selon les catégories suivantes: type morpho-lexical, concept, commune d'origine et attestation. Chacun de ces documents est nommé selon l'ID attribué par VA à la catégorie de données correspondante: les documents appartenant à la catégorie «communauté» portent un «A» comme lettre initiale, «C» marquant les concepts et «L» les types morpho-lexicaux; le chiffre qui suit cette initiale correspond à l'ID attribué par VA. Ces données sont accessibles par l'adresse https://www.verba-alpina.gwi.uni-muenchen.de/fr/export. Les DOI sont d'abord attribués par la bibliothèque universitaire de la LMU dans le cadre du projet «eHumanities – interdisziplinär» et ensuite intégrés dans sa propre structure de stockage où leur contenu sera exploité en profondeur grâce à des procédés encore à développer utilisant des schémas de métadonnées. Outre la mise à disposition des données de recherche dans ce dépôt, il s'agit d'assurer l'intégration et la repérabilité des données finement granulées de VA dans les catalogues de bibliothèques. De plus, les données de VA sont extraites de l'entrepôt de l'UB de la LMU par le projet GeRDI, pris en charge par le DFG, qui les inclut dans son index pour permettre l'exploitation postérieure dans une visée interdisciplinaire.

v. aussi Données d'autorité

(auct. Sonja Kümmet [UB der LMU] | Stephan Lücke | Julian Schulz [ITG] | Florian Zacherl – trad. Sonja Schwedler-Stängl)

Tags: Technologie de l'information



Horizon épistémique  (Citer)

Ce portail informe de trois dimensions différentes:

(1) de la realité extralinguistique ('choses'),
(2) de concepts, ou: de catégories onomasiologiques qui ne sont pas liées à des langues ou dialectes particuliers,
(3) d'expressions linguistiques des langues et des dialectes enquêtés.

Le traitement séparé de (2) et (3) est fondamental parce que les concepts pertinents ne sont pas toujours documentés dans toute la région de l'enquête par des termes spécifiques (ils ne sont donc pas tous lexicalisés). Ainsi dans une grande partie de la région bavaroise il n'y a pas de mot pour le fromage produit à partir de petit-lait (cf. (alémanique) Ziger, ita. ricotta, fra. sérac), tandis que pour la masse de fromage fraîche pas encore modelée (bar. Topfen, alld. Quark), il manque souvent un terme dans les dialectes romans y compris en italien standard. La relation entre (1) d'un côté et (2) et (3) de l'autre côté est parfois plus problématique que cela semble à première vue: ainsi, on est confronté quelquefois à des expressions de statut sémiotique ambigu, parce qu'il ne ressort pas des données s'il s'agit de désignations de concepts ou plutôt de noms de choses; c'est le cas par ex. si un locuteur appelle un certain alpage, par exemple cet alpage-là qu'il utilise lui-même, avec un nom générique comme munt, littéralement 'montagne', ou pastüra 'pâturage'.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Humanités numériques  (Citer)

Le projet VerbaAlpina a d'emblée été conçu avec la perspective d'un usage web, devant contribuer de manière décisive à faire passer les traditions établies des sciences humaines, plus précisément de la géolinguistique, aux humanités numériques, ang. digital humanities. Ce terme est maintenant établi, cependant ses deux constituants ne sont en aucune façon explicites et méritent chacun un commentaire méthodologique.

(1) numérique possède une multitude d'implications complexes:

  • La base empirique de la recherche se trouve dans les données (cf. Schöch 2013), c.-à-d. des unités digitalement codifiées et structurées ou au moins structurables ; ici il s'agit pour une part de données déjà publiées puis numérisées (comme par ex. les matériaux des atlas les plus anciens), mais en partie aussi de données originales encore à relever. Dans les domaines conceptuels pertinents, on aspire à entrer dans la base une quantité constistante de données. La méthode est donc quantitative et dans une large mesure inductive.
  • La communication scientifique utilise les ressorts médiatiques d'internet. Cela permet tout d'abord de relier par hypertexte différents médias (écriture, image, vidéo, audio) ; de plus, les chercheurs, les partenaires de coopération et/ou les informateurs peuvent communiquer et coopérer les uns avec les autres de façon continue.
  • En procédant de cette façon, cette plate-forme scientifique et collaborative offre aux chercheurs la possibilité de participer activement à son développement. Cette perspective est utile et productive à au moins deux égards : elle permet d'inclure différents lieux de travail et surtout, de combiner constructivement technologie de l'information et géographie linguistique avec ressources publiques, ce sans devoir recourir aux services de sociétés informatiques privées (services d'assistance juridiquement et économiquement problématiques).
  • Le savoir pertinent pour le projet pourra être accumulé et modifié de façon continue sur une longue durée, bien qu'une disponibilité permanente ne puisse pas encore être techniquement garantie (cf. sur ce point l'infrastructure scientifique CLARIN-D , page Web disponible seulement en allemand et en anglais). Sous cet angle, publier les résultats du projet en support matériel (livres, CD, DVD) n'est plus une préoccupation principale. Néanmoins une option, secondaire, d'impression sera installée, option qui est parfois aussi offerte par la lexicographie en ligne, de façon exemplaire par le Tesoro della Lingua Italiana delle Origini.
(2) Derrière le terme humanités se cache une conception bien spécifique de ce domaine de recherche, que le terme désuet de philologie ne peut décrire entièrement. Les domaines de la linguistique étudiant la langue parlée ont déjà dépassé cette tradition basée sur le texte. Ainsi, au regard de VerbaAlpina, le terme de linguistique numérique serait trop étroit car bien que l'accent soit mis sur les données linguistiques, on intègre délibérément des données extra-linguistiques, indispensables à une compréhension historique des rapports géolinguistiques.

(auct. Thomas Krefeld – trad. Julie Defert | Susanne Oberholzer)

Tags: Technologie de l'information



Informateur  (Citer)

L'expression informateur est d'ordre technique dans VerbaAlpina. Elle rassemble selon la source deux choses différentes : dans les atlas, toutes les données linguistiques sont en général transparentes jusqu'au locuteur lui-même; dans la base de données, les informateurs sont identifiables par un numéro individuel. Ils sont de plus chrono-référencés selon l'année de l'enquête et géo-référencés selon le lieu de l'enquête. Dans les dictionnaires géo-référénciables par contre, il est normalement impossible d'identifier les locuteurs concrets. Pour des raisons techniques dues à la base de données, un informateur fictif est attribué à chaque source de ce type. Chaque informateur est ensuite attribué à une famille linguistique, cette attribution est transmise automatiquement à toutes les données fournies par cet informateur.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Inscriptions rhétiques  (Citer)

La répartition moderne des familles linguistiques au sein de notre zone d'étude considère la chaîne alpine comme une barrière : elle sépare grosso modo la zone germanophone (au nord) des zones romane et slave (au sud) (Link). Le Tyrol du Sud, un territoire où l'on parle une variété dialectale bavaroise, s'étend au sud de la chaîne des Alpes et constitue presque un cas particulier. Cependant, d'un point de vue historique, cette "vision" est trompeuse: même les témoignages linguistiques les plus anciens, c'est-à-dire les inscriptions pré-romaines, sont écrits dans un alphabet quasiment identique :


(Quelle)

La répartition des textes dits 'textes rhétiques' s'étend des Alpes du Nord (Steinberg am Rofan, près du lac Achensee) à Padoue; elle ne peut être comprise que dans le contexte culturel qui traverse les Alpes: rätische_inschrftn Avec cet alphabet ont été aussi écrits grossièrement des documents de la langue étrusque, de toute évidence remontant à un ancien grec occidental Schrift. Bien que la valeur phonétique des caractères soit raisonnablement claire, le sens des textes n'a pas encore été déchiffré. Il n'est pas encore clair si le nom ancien Raetii'Rhètes' doit être compris dans le sens d'une communauté culturelle et/ou linguistique spécifique ou comme un terme collectif pour des groupes ethniques alpins très différents (cf. dazu Rageth 2012). En tout état de cause, on constate que l'aire de répartition des inscriptions ci-dessus ne coïncide pas du tout avec la province romaine Raetia. Il en va de même pour la culture Fritzens-Sanzeno, identifiée par les archéologues comme étant essentiellement "rhétique", dont la poterie caractéristique n'est pas présente dans l'ouest de l'actuel canton des Grisons, bien que ces zones appartenaient à la Raetia, mais étaient protégées dans différents endroits du Norique (cf. Lang 1992, Rageth 1992, Marzatico 1992).



(auct. Thomas Krefeld – trad. Beatrice Colcuc)



Langue  (Citer)

L'interface de ce portail sera disponible en plusieurs langues standard, à savoir (par ordre alphabétique) en allemand, en anglais, en français, en italien, en romanche (rumantsch grischun) et en slovène. Dans le cas de l'allemand, il peut y avoir suivant l'auteur des variantes standard suisses ou autrichiennes. Indépendamment de la langue choisie, l'utilisateur a toujours accès à l'ensemble des matériaux linguistiques en tous les dialectes et toutes les langues relevés.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Lexie plurilexicale  (Citer)

Par lexie plurilexicale, VerbaAlpina entend une série spécifique de mots (Tokens), qui, pris ensemble, qualifient un concept précis voire plusieurs concepts précis. Ainsi, entre autres exemples, dans la vallée du Grödner (AIS 1192_1, 312), le concept d’HABITATION D’ALPAGE sera designé par la lexie plurilexicale casa da fuoco (ʧˌaz dɑ fˈuɑk), mot à mot « maison du foyer » ; dans d’autres dialectes (Engadine, Tessin entre autres), la même combinaison qualifie le concept de CUISINE.

D’un point de vue informatique en résulte le problème d’un classement conceptuel à multiples strates, dont on doit rendre compte dans la rubrique modèle relationnel. A côté de la signification de lexie plurilexicale prise en tant que tout, les mots pris un par un possèdent leurs propres significations qui mettent en lumière et motivent l’idée d’une lexie plurilexicale. Afin de prendre en compte cette particularité, on utilise dans la banque de données de VerbaAlpina les groupes dénommés Tokens. Une référence, qui se compose de plusieurs mots pris un à un, est alors décomposée selon ses éléments, eux-mêmes rangés dans le tableau « tokens ». Chacun de ces Tokens renvoie à cet égard à une seule et même entrée dans le tableau « groupe tokens » et enregistre en plus sa position dans le groupe Tokens (1ère, 2ème position, etc.), de sorte que la lexie plurilexicale puisse être reconstituée à partir des Tokens pris un à un. Une sauvegarde explicite de la lexie plurilexicale n’est de ce fait pas nécessaire ; dans le tableau « groupes Tokens », on ne range ainsi (en dehors des ID des groupes Tokens) que des informations complémentaires, qui ne peuvent pas découler des Tokens pris un à un, comme par exemple le genre des groupes Tokens.

Un classement des concepts a lieu aussi bien au niveau des Tokens qu’au niveau des groupes Tokens. Concernant l’exemple cité plus haut, il y a trois entrées dans le tableau Tokens pour lesquelles à chaque fois des concepts différents sont classés.



L'attribution des concepts aux composants se fait à l'aide de dictionnaires. Pour le sous-concept correspondant, l'entrée la plus fréquente est reprise du dictionnaire. Comme les sous-concepts n'ont pas été interrogés, il est possible que certains d'entre eux ne correspondent pas à la réalité.

Il y a de surcroît une entrée dans le tableau „groupe Tokens“ avec une classification conceptuelle qui lui est propre :



Au moment de réaliser la représentation cartographique à la surface de VerbaAlpina, les Tokens et les groupes Tokens sont traités sur le même plan, c’est-à-dire qu’une recherche du concept HABITATION D’ALPAGE fournit aussi bien les groupes Tokens que les Tokens qui sont liés à ce concept. Les mots pris un à un, n'étant référencés que comme composants d’une lexie plurilexicale, sont marqués comme tels.


(auct. Stephan Lücke | Florian Zacherl – trad. Pierre Herrmann)

Tags: Linguistique



Lexique alpin  (Citer)

Les réalias typiquement alpins (comme le CHAMOIS, le CEMBROT DES ALPES ou l'ALPAGE) sont souvent désignés par des mots de substrat préromains. Cette strate linguistique a été décrite dans ses détails tout d'abord par Jakob (voir les travaux scientifiques notoires de Jud 1911a, Jud 1911b, Jud 1924 et Stampa 1937); elle forme le fond du lexique alpin. Toutefois, l'expression "lexique alpin" n'est pas complètement univoque parce qu'elle a un sens plus vaste tant chez Otto von Greyerz 1933 qui l'a probablement forgée, que chez Johannes Hubschmid 1951 qui l'a surtout rendue publique: "Ich verstehe darunter Wörter, die Geländeformationen, Naturerscheinungen, Tiere und Pflanzen oder mit der menschlichen Tätigkeit zusammenhängende konkrete Begriffe bezeichnen, Wörter, die sich nur oder hauptsächlich in den Alpenmundarten erhalten haben, oder die zwar auf einem größeren Gebiet leben, aber in den Alpen häufig eine speziell 'alpine' Bedeutung zeigen. Alpenwörter können auch germanischen oder romanischen Ursprungs sein" (Hubschmid 1951, 7; traduction: "Par lexique alpin, j'entends des mots qui désignent des formations de terrain, des phénomènes de nature, des animaux et des plantes ou des termes concrets qui sont en rapport avec l'activité humaine, des mots qui se sont maintenus > seulement ou surtout dans les dialectes alpins ou qui certes existent dans une région plus vaste, mais qui montrent souvent un sens spécialement 'alpin' dans les Alpes. Le lexique alpin peut aussi être d'origine germanique ou romane.") (cf. pour l'histoire du terme depuis peu aussi Rampl 2011, 131 ss.)

Le terme VerbaAlpina rejoint bien consciemment cette catégorie qui s'avère être très utile à une étude du plurilinguisme. Celle-ci permet d'identifier les unités lexicales qui caractérisent l'espace culturel des Alpes et qui impliquent des emprunts lexicaux, le tout sans se focaliser sur une langue en particulier. Pour rendre le concept verba alpina (ou: lexique alpin) applicable, il doit être précisé dans le cadre du projet: on désigne comme étant 'alpins' les types lexicaux qui ont des correspondances dans plus d'une des familles linguistiques traditionnelles de la région des Alpes ainsi que ceux qui sont, certes, seulement romans mais qui, au lieu du latin, ont leur origine dans des substrats prélatins régionaux. Ainsi, on trouve sept catégories hybrides:

Correspondances possibles d'un mot alpin
Prélatin Roman Germanique Slave
x x x x ‘alpin’ au sens strict
x x x ‘alpin’ au sens large
x x x
x x
x x
x x
x x


(auct. Thomas Krefeld – trad. Julie Defert | Susanne Oberholzer)

Tags: Linguistique



Lieux d'origine des données  (Citer)

Les noms des lieux de collecte des données sont tirés de la source (y compris une orthographe différente). Si deux ou plusieurs lieux portent le même nom, un supplément local sera ajouté (si disponible et nécessaire). Par exemple: Brixen im Thale, St. Johann in Tirol. Surtout en Autriche ces suppléments sont disponibles et facilitent la différentiations des lieux de collecte des données.
Les noms des villages plus petits n'ont souvent pas de supplément local. Dans ces cas, on rajoute entre parenthèse le nom de la commune à laquelle ils sont rattachés, par exemple St. Magdalena (Gries), St. Magdalena (Villnöss).

(auct. Mona Neumeier – trad. Beatrice Colcuc)

Tags: Linguistique



Manière de citer  (Citer)

On recommande aux utilisateurs de VerbaAlpina la manière de citer suivante pour les données linguistiques mises à disposition :

  • Note de VerbaAlpina dans une bibliographie
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de,[version].

La mention de la data du dernier accès n'est pas nécessaire parce que les versions de citation (à la différence de la version de travail XXX) sont stables et ne peuvent plus être changées (cf. Gestion de versions).

Exemple:
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.

  • Citation d'une entrée de glossaire:
[Auteur/s]: s.v. “[Lemme]”, en: VA-[sigle de langue d'après ISO 639-1] [version], Méthodologie , [URL de l'entrée de glossaire].

Exemple:
Krefeld, T. / Lücke, S. / Oberholzer, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.

Comme auteur, on doit toujours mentionner les personnes citées sous l'entrée de glossaire.

  • Citation d'une attestation seule:
[citation]|[catégorie]|[lieu]|[sigle de la source]#[référence]|VA_[version]

Exemples:
Hütte|Type morphologique|Herisau|SDS#VII_244_1|VA_15/1
Chääsera|Type phonétique|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Käserei|Type de base|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1

Remarque 1: Le caractère de séparation pipe (barre verticale/tube) | peut être obtenu en appuyant la touche Alt Gr + la touche 6 si on utilise un ordinateur avec le système d'exploitation Windows. Sur les ordinateurs d'Apple, il faut appuyer la combinaison de touches suivante: Alt + Maj + L.
Remarque 2: Les abréviations suivantes selon ISO 639-1 doivent être utilisées : pour l'allemand de, pour le français fra, pour l'italien ita, pour le romanche roh, pour le slovène slv.

(auct. Stephan Lücke | Susanne Oberholzer – trad. Susanne Oberholzer)

Tags: Page Web



Métadonnées  (Citer)

Le traitement de données oblige à une distinction entre les données primaires et les métadonnées. Les métadonnées sont toutes les données décrivant les données primaires. Au lieu de "métadonnées", on peut utiliser également les deux termes "attributs" ou "caractéristiques", sémantiquement identiques. Au cours de la modélisation des données, on détermine quelles données primaires doivent ou peuvent être décrites par quelles métadonnées. Les métadonnées se décomposent en catégories de métadonnées individuelles. Pour chaque catégorie de métadonnées, on définie les valeurs autorisées.

Ce système peut être décrit à travers un exemple. Les données primaires sont des personnes. Chaque personne est décrite par son nom, prénom, lieu de naissance, date de naissance et couleur des yeux. Les valeurs autorisées peuvent être décrites de la manière suivante:

Nom: séquence de caractères composée de lettres
Prénom: séquence de caractères composée de lettres
Lieu de naissance: séquence de caractères composée de lettres
Couleur des yeux: une valeur de la liste "marron, vert, bleu".

Chaque individu doit être clairement décrit par la somme de toutes les valeurs des différentes catégories de métadonnées. Dans le cas d'une duplicité dans l'ensemble des données (c'est-à-dire deux individus ayant des valeurs complètement identiques dans toutes les catégories de métadonnées), le système de métadonnées doit être considéré comme inadéquat et, par conséquence, modifié.

(auct. Stephan Lücke – trad. Beatrice Colcuc)

Tags: Technologie de l'information



Mise à jour des données pour la visualisation  (Citer)

Afin d'assurer le bon fonctionnement du plan interactif, les tables de la couche d'accès aux données et les tables auxiliaires sont actualisées seulement une fois par jour. Ainsi, toute modification des données langagières et des données supplémentaires ne sera rendue visible sur le plan interactif que le lendemain. Pour une mise à jour immédiate, il est possible d'afficher les routines correspondantes directement dans la base de données à l'aide de requêtes SQL:

données langagières:
CALL zling();

données supplémentaires:
CALL zgeo();

(auct. Florian Zacherl – trad. Julie Defert)

Tags: Technologie de l'information



Modèle relationnel  (Citer)

Le modèle relationnel de données organise les informations sous forme d’un ou plusieurs tableaux. Sa désignation vient du fait que les tableaux sont aussi appelés « relations » dans le jargon technique. Les lignes d’un tableau sont aussi appelées « enregistrement » ou « multiplet »; au lieu de colonnes, on parle aussi de « champs », d’« attributs » ou de « qualités ». Un tableau peut, du moins théoriquement, posséder un nombre illimité de lignes et de colonnes. Un tableau donné peut à tout moment être complété aussi bien par de nouvelles lignes que par de nouvelles colonnes. Un ensemble de tableaux peut être désigné sous le nom de banque de données. Pour gérer un tel ensemble de tableaux/banques de données, on utilise des systèmes de gestion des banques de données comme par exemple MySQL ou PostgreSQL. La gestion des données tout comme leur analyse s’ensuit au moyen d’une langue formelle spécifique que l’on appelle Structured Query Language (SQL), et qui a été spécialement développée pour l’analyse des données en format relationnel, et qui est entre autres présente dans une version standardisée de la ISO (Wikipedia).
Concernant la représentation des informations dans le modèle relationnel de données, il existe des règles spécifiques qui représentent de facto une science en soi (par exemple la dénommée Normalisierung). En même temps, le choix concret de cette modélisation dépend de son emploi, et le respect de règles de modélisation existantes constitue dans certains cas plutôt un handicap sous l’angle de l’utilité et de la performance. Dans la pratique, toute modélisation de données représente un compromis entre prescriptions du règlement théorique, exigences techniques et plaisir de l’utilisateur. En outre, un modèle de données choisi une fois peut à tout moment être modifié et être adapté à des exigences changeantes.


(auct. Stephan Lücke)

Tags: Linguistique



Modélisation des données  (Citer)

voir Modèle relationnel.

(auct. Stephan Lücke)

Tags: Technologie de l'information



Modules  (Citer)

voir gestion de versions

Tags: Technologie de l'information



Notation  (Citer)

Dans les contributions de texte, les principes de notation suivants sont utilisés : les formes linguistiques (exemples d'attestations) sont écrites en italique ; la signification est marquée par des guillemets simples. Par ex. ita. formaggio 'fromage'. Les catégories extralinguistiques (concepts) sont représentées par des majuscules. La différence entre sens linguistique et concept est importante dans les cas où il n'y a pas de mot pour certains concepts dans certaines langues ou dialectes, comme par exemple FROMAGE ISSU DU LIQUIDE APRÈS LA DEUXIÈME COAGULATION DE LA PÂTE. On appelle cela ita. ricotta, fra sérac, alémanique Ziger etc.; un mot en allemand standard manque pourtant.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web



Numérisation  (Citer)

Dans le contexte de VerbaAlpina, par numérisation on n'entend pas simplement l'utilisation d'ordinateurs pour le traitement électronique des données, mais surtout et essentiellement l'exploitation numérique en profondeur par la *structuration* et la catégorisation systématiques et transparentes du matériel.



Au sein du projet, c'est presque exclusivement le modèle relationnel qui est utilisé, dans lequel les données sont organisées en forme de tableau. Les tableaux se composent de lignes (= enregistrements, tuples) et de colonnes (= attributs, cases, propriétés); chaque tableau peut être agrandi dans chaque direction en ajoutant des lignes et des colonnes. Entre les tableaux existent des relations logiques, qui permettent des associations cohérentes et les représentations synoptiques correspondantes (dites "joins") de deux ou plusieurs tableaux. Pour la gestion des tableaux, VerbaAlpina utilise actuellement le système de gestion de base de données MySQL. Les tableaux ne sont pas figés par ce système, ils peuvent être exportés à tout moment, par ex. sous forme de texte avec des délimiteurs univoquement définissables pour les limites de case et d'enregistrement (dits séparateurs) avec les noms de colonnes et la documentation des relations logiques (modèle entité-association). La structure XML, souvent employée actuellement, n'est pas utilisée au niveau du plan opérationnel de VerbaAlpin,. Dans le cadre de la conception d'interface pourtant, XML est utilisé comme format d'exportation.

Aux côtés de la structuration logique des données, c'est le codage des caractères qui tient le second rôle principal dans le contexte du mot-clé "numérisation". Ce domaine est de la plus grande importance, en particulier en vue de l'archivage longue durée des données et il doit être géré de manière prévoyante. Autant que possible, VerbaAlpina s'oriente au tableau de codage et selon les prescriptions du Consortium Unicode. Au cas où la numérisation concerne des caractères qui ne sont pas encore intégrés par le tableau Unicode, la saisie digitale de données d'un caractère isolé se fait de préférence en sérialisant le caractère sous forme d'un ordre de caractères du bloc Unicode x21 jusqu'à x7E (à l'intérieur du bloc ASCII). Les affectations correspondantes sont renseignées dans des tableaux spéciaux, une conversion future en valeurs Unicode, lorsqu'elles seront disponibles, reste alors possible.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Onomastique  (Citer)

Les résultats onomastiques, spécifiquement dans le cas de la toponomastique, sont d’une importance capitale pour évaluer la continuité géographique d’une implantation ayant survécu à un changement linguistique (comparer avec l’exemple alpin, déjà, Steub 1867 et von Greyerz 1933). Il faut ici distinguer deux types sémantiques : d’une part, les formes antiques qui sont reprises des substrats linguistiques (« ces traitres souvent peu pratiques venus d’autres temps », comme Steub le dit de manière suffisante en 1867, 142). Leur mise au jour doit tenir en compte des régularités de la phonétique historique et en même temps compter sur de multiples exceptions qui sont souvent dues à une remotivation étymologique d’origine populaire. D’autre part, il y a des noms « parlants » avec lesquels les locuteurs des substrats linguistiques sont nommés explicitement, comme par exemple dans les noms alémaniques et bavarois avec la base wal(l)-, walch-, welsch- ‘romanisch’ (comparer avec l’étude, classique, de Ernst Schwarz 1970). La manière de procéder peut se faire à partir de deux perspectives opposées, en effet, en cherchant des formes correspondantes plus récentes ou actuelles, en partant de traces antiques (dans les itinéraires, sur les bornes, entre autres) ou bien, inversement, en identifiant des étymologies pour des formes actuelles sous la forme de références antiques ou de reconstructions linguistiques.  
La première perspective évoquée est sans doute la plus simple en raison des données traitées et chiffrables, car elle fournit une base de données constituée de noms romains bien localisés la plupart du temps, et qui peut être retravaillée de manière systématique. La perspective a posteriori est bien plus exigeante et aussi considérablement plus pertinente. Il manque ici les conditions préalables pour réussir un travail à plus grande échelle ; beaucoup de régions ne sont pas fermées d’un point de vue de l’onomastique, étant donné qu’il n’y a ni variantes dialectales récentes ni références anciennes. Quoi qu’il en soit, le Suisse Ortsnamenportal a accompli un début très prometteur déjà.
Mais à côté des noms concernant les lieux d’habitat, la documentation sur les noms concernant les toponymes (par exemple les montagnes et les alpages) est justement importante, étant donné qu’elle permet de faire des déductions sur l’utilisation habituelle des terrains. A cet égard, citons l’exemple suivant, totalement provisoire : dans son importante étude sur la colonisation de la Haute Bavière du Sud au Haut Moyen- Âge ainsi que du Tirol et de la région de Salzbourg qui lui sont contigües, Franz Weindauer 2014 rédige le résultat tiré d’une évaluation globale d’une fouille archéologique, en écrivant ce qui suit : « La comparaison des résultats tirés de la toponymie et de la recherche patronymique a donné pour résultat que, de nouveau, les régions déjà peuplées dans l’antiquité tardive fournissent des références concluantes concernant la vie romane au début du Moyen- Âge. En font partie en premier lieu la région de l’Ammersee, le pays de Werdenfelser, la région est du Chiemsee et le Rupertiwinkel, mais aussi par exemple la région du Mangfallknie, autour de Rosenheim et du lac de Starnberg » (Weindauer 2014, 249). A cet égard, et ce dans la partie alpine de son champ de recherche, la répartition des lieux où ont été découverts des éléments se focalise de manière très visible sur les cols, c’est-à-dire à peu près sur la route du Brenner qui se ramifie à Innsbruck (quand on vient du Sud) vers l’Ouest (en passant par le Zirlerberg en direction de Garmisch et du piémont alpin) et vers l’Est (en-deçà de l’Inn). Il suffit de porter un bref regard d’un point de vue toponymique sur la chaîne de montagne de Karwendel, qui se trouve à l’angle de ces deux routes et qui ne connaît pas une seule implantation plus importante jusqu’à aujourd’hui, pour mettre à jour, sur une distance de quelques kilomètres, d’évidents romanismes ou des mots préromains récupérés par le roman :
* die Fereinalm < lat. veranum, vgl. spa. verano 'Sommer' tout comme le  Vereinatunnel dans l’Engadine du sud;
* die Krapfenkarspitze avec pour base le préromain *krapp- 'Fels', vgl. roh. (sursilvan) crap avec beaucoup de traces dans la toponymie des Grisons (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorröm. *blese 'steile Grashalde', vgl. roh. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 tout comme les traces toponymiques également très nombreuses dans Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu avec déplacement de l’accent sur la première syllabe; comparer avec ses équivalents suisses comme avec les lieux de la Rhétie romaine glaretsch dans Disentis (voir Schorta 1964, 164) et les lieux de la Suisse orientale alémanique Glaretsch in Pfäfers (voir ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, comparer les traces importantes dans les Grisons du type laret, avec la variante lat. larictum in Schorta 1964, 185;
* le nom de montagne Juifen < lat. iugum 'Joch', à nouveau, maints parallèles qui se sont propagés, comparer avec les noms de lieu Juferte dans la vallée du Simmen au sud de Bern, plus de Juf et de giuf, giuv dans les Grisons (tous dans le portail des toponymes de la Suisse) tout comme le Jaufenpass dans le sud du Tirol; un peu plus à l’est de Juifen, se trouve la montagne Guffert, dont le nom doit être établi pour ainsi dire comme une variante de la vallée du Simmen.
Un examen consciencieux mettrait encore davantage d’éléments à jour. Que l’on considère avec le dernier exemple la vocalisation non plus latine, mais romane (-g- > -v-, -f). Tous ces héritages présupposent un contact avec une population de langue romane qui utilisait les montagnes comme moyen de subsistance et aussi une acculturation de leurs formes de vie. Gamillscheg 1935, 306 s’est déjà prononcé dans ce sens : « le paysan alémanique et bavarois, qui tire ses fruits d’un sol nouvellement occupé, tisse un lien avec les Romanches qui travaillent eux aussi dans des conditions difficiles en contrebas. Rien ne montre davantage qu’aucun conflit national ne se soit ici jamais joué que le fait que les noms de lieux du vieux romanche et les noms allemands plus récents ont ici continué d’exister de manière tout aussi pacifique que ceux des Ladins et des Allemands-Tiroliens. L’invasion des Alémaniques et des Bavarois dans l’espace alpin rhétique et norique n’a pas eu pour conséquence une destruction culturelle ."  


(auct. Thomas Krefeld – trad. Pierre Herrmann)

Tags: Linguistique



Page de code  (Citer)

VerbaAlpina réunit des données issues de différents types de sources : des données d'atlas linguistiques et de dictionnaires imprimés, qui doivent tout d'abord être numérisées, ainsi que des données déjà numérisées, issues de projets partenaires. Chaque source utilise des systèmes de transcription plus ou moins individuels. Pour réaliser l'uniformisation nécessaire, des listes sont établies dans lesquelles il est fixé quel caractère du système de transcription d'une source X correspond à quel autre dans le système de transcription d'une source Y. Il s'agit surtout de retranscrire les différents systèmes de transcription en Alphabet phonétique international (API), qui fait office de transcription de référence dans VerbaAlpina. Pour convertir le système de transcription spécifique à une source en système API, on doit créer une liste complète sous forme de tableau indiquant les correspondances de caractère. Un tel tableau est nommé "page de code". Ci-dessous un extrait de la page de code fondamentale pour la conversion du système de transcription de l'AIS en API. Cette page de code comprend environ 4500 lignes/affectations en tout :


La colonne `BETA` comprend les caractères utilisés dans l'AIS en forme transcrite selon le principe du beta code; la colonne `IPA` le caractère API correspondant, et la colonne `HEX` la valeur ou les valeurs du tableau Unicode qui correspond(ent) au caractère API.

Un aperçu complet des pages de code de toutes les sources de VerbaAlpina se trouve ici.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Participer!  (Citer)

Chaque soutien est bénéfique à VerbaAlpina, il existe différentes possibilités pour participer activement au projet.

Par exemple, en transcrivant des données provenant de sources imprimées telles que les atlas linguistiques ou les dictionnaires, et en les structurant dans une base de données. Il est aussi possible de vérifier l'exactitude des données déjà transcrites et de relier le matériel transcrit à des lemmes lexicaux. Les commentaires sur l'origine et la distribution des mots ou des types de mots sont également les bienvenus.

Nous sommes également très intéressés par le matériel linguistique actuel, non documenté dans les publications telles que les atlas et dictionnaires de langues déjà mentionnés. Si vous connaissez un dialecte parlé dans la région alpine, nous serions heureux que vous introduisiez des expressions de ce dialecte dans la base de données de VerbaAlpina. De cette manière, il sera possible d'enrichir le stock de données des sources imprimées et, par exemple, de reconnaître et d'observer les processus dynamiques de changement linguistique. Plus grand est le nombre de participants, meilleur sera le résultat.
D'autre part, avez-vous des photos d'objets typiquement alpins ? Par exemple, des photos d'alpages, de refuges, de flore, de faune, de montagnes et de paysages ? Alors téléchargez-les dans notre médiathèque, marquez où et quand la photo a été prise, ce qu'elle montre et – si vous la connaissez – donnez l'expression dialectale spécifique pour ce qui est montré sur la photo.

A côté de la coopération avec VerbaAlpina, vous pouvez configurer votre propre environnement de recherche dans notre système, que vous pouvez utiliser principalement pour la collecte de données linguistiques, mais qui aussi est utile pour d'autres données. La seule condition requise est que les donnés soient géoréférençables. Vous avez la possibilité de garder ces données sous clé pour votre usage personnel, mais vous pouvez également les mettre à disposition d'autres utilisateurs afin qu'ils puissent en discuter et les commenter. Nous vous encourageons à mettre le plus d'informations possibles à disposition du public. De cette façon, le potentiel des technologies de bases de données et de réseaux sera pleinement exploité.

Afin de soutenir VerbaAlpina et/ou d'utiliser le système pour votre propre usage, vous êtes invités à vous inscrire sur notre portail : https://www.verba-alpina.gwi.uni-muenchen.de/wp-login.php?action=register]

(auct. Stephan Lücke – trad. Beatrice Colcuc)

Tags: Page Web



Photographies  (Citer)

La médiathèque de VerbaAlpina contient une collection riche et variée de photographies géoréférencées, s'accroîssant continuellement. Ces photographies ont deux fonctions : d'une part, elles renvoient à des référents concrets avec toutes leurs particularités idiosyncratiques, très prononcées surtout concernant les bâtiments. D'autre part, les photographies doivent illustrer un concept d'une manière la plus parlante possible et devenir ainsi une base d'enquête cherchant d'autres désignations pour le concept. L'objectif de cette fonction n'est donc pas celle de reconnaître le référent spécifique, par exemple un chalet particulier. Cela serait même plutôt gênant car dans ce cas les informateurs ont tendance à indiquer le nom propre de l'alpage et pas les désignations du concept. Ce risque est pourtant calculable: un malentendu fondamental résulte en principe seulement de situations où les informateurs reconnaissent des personnes connues. Dans un tel cas, les caractéristiques individuelles catalysent toute l'attention de l'observateur à tel point que la personne représentée est appelée spontanément et involontairement par son nom ("mais c'est le Willi !") – et pas par la fonction qu’elle exerce sur la photographie (VACHER). A proprement parler, l'emploi de dessins idéalisés à la place de photographies d'objets concrets serait plus adéquat pour l'enquête de désignations. Cela échoue pourtant à cause de l'absence de modèles correspondants. Toutes les illustrations de référents sont associées aux catégories "concept" et "désignation" par la base de données.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Principes FAIR  (Citer)


En 2016, un article rédigé par de nombreux chercheurs de diverses nationalités parut dans la revue scientifique Nature dans le souci de formuler des recommandations pour la gestion des données de recherche (Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016). 🔗), Les idées avancées dans cette publication remontent, en effet, à un workshop tenu au Centre Lorentz de l'université de Leyde aux Pays Bas en janvier 2014 ayant comme sujet Jointly designing a data FAIRPORT.

Entretemps, ces idées, condensées dans l'acronyme FAIR, se sont établies comme point de repère dans le débat actuel concernant la gestion des données de recherche (ce qui s'est affirmé p.ex. lors de la rencontre réseaux du projet GeRDI en octobre 2018; cf. aussi FAIRGROUP der FORCE11-Community).

Voici les postulats clés, partiellement corrélatifs, qui se cachent derrière l'acronyme FAIR:

  • F — Findable
  • A — Accessible
  • I — Interoperable
  • R — Reusable

Ces derniers impliquent toute une série de conséquences quand il s'agit de gérer des données de recherche numériques.

Pour assurer la repérabilité des données il faut, en principe, au moins un portail central capable de traiter des demandes de recherche. Pour référencier les données de recherche – avant tout leur contenu ainsi que leur lieu de conservation – il est indiqué d'adopter le système des catalogues de bibliothèques, établies depuis longtemps. A éviter serait toute démarche impliquant des recherches réparties sur plusieurs sites.

Bien évidemment, les données doivent exister physiquement pour être trouvées. Dans ce contexte, c'est moins la question des solutions techniques qui pose problème, grâce p. ex. à la généralisation des centres de calcul en disposant, mais plutôt celle des responsablilités institutionnelles. Ici encore, les bibliothèques s'imposent en fait vu leur histoire, leur mission fondamentale de conserver le savoir et leur perspective de longévité; ce sont elles, il faut le dire, qui devraient, a priori, prendre en charge la conservation durable des données numériques. Dans la réalisation concrète, le choix du lieu d'emmagasinage ne joue qu'un rôle secondaire: soit les bibliothèques mettent en place et gèrent leurs propres bases de données, soit elles ont recours au service des centres de calcul.

L'un des points cruciaux concerne la conception et l'attribution des métadonnées assurant la repérabilité des données de recherche en question. Il semble incontournable d'employer au moins un schéma de métadonnées contraignant et hiérarchisé permettant la catégorisation des données de recherche selon leurs contenus en intégrant des vocabulaires également contraignants et contrôlés. VerbaAlpina a opté, pour l'instant, pour le schéma de Datacite-Schema, largement pratiqué, y compris par la bibliothèque universitaire de la LMU. L'emploi de plusieurs schémas de métadonnées serait possible mais seulement judicieux en les appliquant de façon conséquente à la totalité des données de recherche saisies. Des schémas de métadonnées subordonnés concernant des champs de recherche spécifiques peuvent s'avérer utiles en tant que compléments des schémas supérieurs.

Le terme (anglais) «accessible» se réfère avant tout à la libre accessiblilité des données, notamment sans restrictions légales comme p.ex. par le droit d'auteur. L'accessibilité constitue le facteur le moins contrôlable par ceux qui produisent et rassemblent des données. Dans beaucoup de cas les recueils de données ne sont pas seulement sujets au droit d'auteur mais à ceux de la personnalité. Pour cette raison, l'exigence d'accessibilité vise surtout à une pratique du côté des producteurs de données évitant la mise en place de restricitions individuelles quand il s'agit de données autrement libres de droits. Concrètement, il s'agit surtout de renoncer au copyright et d'appliquer un modèle de licence qui répond aux conditions du libre accès (open acccess). Dans le contexte scientifique on utilise souvent des licences Creative Commons (CC), cependant, toutes ne sont pas conformes aux critères de libre accès, l'interdiction d'exploitation commerciale notamment pouvant faire partie d'une licence CC contrevient au concept du libre accès. Cela s'explique par le fait qu'en principe, presque toute utilisation de données peut être interprètée comme und «exploitation commerciale», d'autant plus qu'il est quasiment impossible d'un point de vue juridique de tracer des délimitatons nettes (v. aussi l'article de méthodologie «Concession d'une licence»).

Tout comme la repérabilité des données, leur intéropérabilité se présente sous deux aspects différents, l'un technique et l'autre théorique et organisationnel. Pour réussir des connexions relationnelles entre données satisfaisantes, il est le plus souvent nécessaire de choisir une granulation logique, suffisamment fine et conforme à des règles, normalement définies au sein d'un champ de recherche donné. Dans ce contexte, les «données normalisés» jouent un rôle primordial: il s'agit de catégories conceptuelles prédéfinies et, idéalement, standardisées dont les instances (objets numériques) se distinguent grâce à des critères qualitativement et quantitativement bien définies, comme quoi elles sont singulières ou (angl.) «distinct». Dotées d'identifiants («IDs») numériques ou alphanumériques, les différentes instances d'une catégorie conceptuelle sont référencées sans ambiguïté. Le fait de granuler des ensembles de données en suivant les délimitations de certaines catégories et de leurs instances en combinaison avec l'application d'identifiants spécifiques permet finalement d'interconnecter ensembles de données isolés et contenus concordants. En revanche, pour obtenir une véritable plus-value il faut qu'il soit techniquement possible de faire référence à des objets de façon directe, afin de permettre de bouger entre des objets de deux ensembles de données différents avec un seul clic, ce qui ne semble réalisable qu'en attribuant son propre URL à tout et chacun de ces objets (cf. «granum»). De plus, pour satisfaire au postulat de durablilité, l'attribution d'un DOI pour chaque URL est indispensable.

La réutilisabilité d'ensembles de données, enfin, résulte du respect et de la mise en œuvre des postulats cités ci-dessus.

Chez VerbaAlpina on cherche à modeler tous les procédés et conventions relatifs au traitement de données en accord avec les principes FAIR. Thomas Krefeld voit dans cette démarche le fondement principal d'une éthique de recherche en humanités numériques (Thomas Krefeld [2018]: Linguistische Theorien im Rahmen der
digital humanities. Korpus im Text. Version 2 (05.11.2018, 11:35). Absatz 4. url: http://www.kit.gwi.uni-muenchen.de/?p=28010&v=2#p:4.). La repérabilité des données est assurée grâce aux collaborations engagées dans le cadre du projet e-humanities – interdisziplinär avec la bibliothèque universitaire de la LMU et le projet GeRDI qui est pris en charge par la Fondation allemande pour la recherche (DFG). De façon prioritaire, on attribue des métadonnées propres à chaque version de l'ensemble de données central du module VA_DB pour les transmettre sous diverses formes à la BU de la LMU qui assure a minima l'archivage dans la base de données Open Data. Par la suite, les métadonnées, tout au moins, sont incorporées dans l'index qui est actuellement mis en place dans le cadre du projet GeRDI. Le but est d'assurer la repérabilité centralisée des données rassemblées et traitées par VerbaAlpina par le biais du catalogue de la bibliothèque de la BU ainsi que du portail de recherche du projet GeRDI, encore en cours de développement. L'intégralité des données gérées par VerbaAlpina sont placées, dans la mesure du possible, sous une licence Creative Commons comprenant le libre accès (jusqu'à la version 18/1 CC BY SA 3.0 de, ab 18/2 CC BY SA 4.0). Quant à l'interopérabilité des données, on y parvient en choisissant un degré de granulation suffisamment fin et conforme au concept des données normalisées grâce au fait que des données normalisées existantes sont reliées aux données fournies par VerbaAlpina, ce qui se réalise par exemple dans le cas des données geógraphiques, se référant, entre autres, aux communes, ces dernières constituant le système de référence central du travail de VerbaAlpina. Dans le cas des catégories de données «type morpho-lexical» ainsi que «concept», primordiales pour VerbaAlpina, il n'existe pas encore de données normalisées auxquelles les données de VerbaAlpina pourraient se référer. VerbaAlpina essaie de créer des (catégories de) données normalisées en collaboration avec des institutions appropriées comme p.ex. la Bibliothèque nationale allemande (DNB). Pour maîtriser les exigences techniques d'une interopérabilité efficace, l'ensemble des données lexicales, d'importance primordiale, est archivé sous forme de paquets de données dans de nombreux fichiers de petite taille pouvant être ciblés par DOI sur Open Data LMU. En plus, chacun de ces fichiers est accompagné d'un fichier contenant des métadonnées en format Datacite ce qui permet de trouver les fichiers individuelles par le biais du catalogue de la bibliothèque.

(auct. Stephan Lücke – trad. Sonja Schwedler-Stängl)

Tags: Technologie de l'information



Profil de similarité ethnolinguistique  (Citer)

Du point de vue ethnolinguistique de ce projet, les types de base fondent l'espace alpin plurilingue. Afin d'offrir une représentation synthétique, deux fonctions de cartographie quantitative différentes sont prévues :
  1. Tout d'abord viser le lexique alpin, dont l'ensemble forme pour ainsi dire un type idéal fictif duquel les dialectes locaux se rapprochent plus ou moins. La cartographie, d'une similarité graduelle, inspirée par la représentation du champ gradient de la gasconité à l'ALG 6 y correspond.
  2. Puis cartographier (selon le modèle de l'ASD) la similarité relative de tous les lieux d'enquête, en comparant et en visualisant les types de base en commun d'un lieu d'enquête x et de n'importe quel autre lieu pris comme point de référence.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Public  (Citer)

voir Publikation

Tags: Page Web



Publication  (Citer)

La publication directe des résultats, indépendamment de maisons d'édition, fait partie intégrante du projet VerbaAlpina. Car tout ce qui est appelé publication ne sert pas à la PUBLICATION. Ainsi, le média papier traditionnel provoque maintenant le contraire de ce à quoi il était destiné : il retire des informations au public, informations qui devraient lui être le plus largement offertes vis-à-vis de la subvention de la recherche par des moyens publics et qui pourraient être fournies très facilement en utilisant les nouveaux médias. Les tirages papier de 200 ou 300 exemplaires, usuels en science, ne parviennent pas à atteindre le public, seulement une sphère privée exclusive. Vu la disponibilité des technologies de l'information, il n'y a aucune raison concluante de préférer l'impression comme moyen de diffusion du savoir ou de la considérer comme la seule possible.
Dans certaines sciences (à notre connaissance cela s'applique notamment à l'informatique), on peut même observer une tendance ces dernières années qui conduit à l'absurde vis-à-vis des possibilités techniques crées par les nouveaux médias: alors qu'il serait un jeu d'enfant à présent d'offrir un accès facile à des informations et des textes dans le monde entier, c'est exactement le contraire qui arrive en accordant l'accès seulement contre paiement. C'est même une régression par rapport à la publication traditionnelle sur papier que nous avons critiquée ci-dessus. Nous tenons donc à souligner nos mises en garde appuyées quant à de tels développements qui s'observent déjà dans les sciences humaines.

Mais la notion de la publication a changé. A proprement parler, la documentation de données à l'Internet est déjà une forme de la publication; de plus VerbaAlpina se considère
aussi comme instrument de publication de textes relatifs au projet.
Trois formats sont prévus pour cela :
  1. les termes et problèmes centraux de théorie et de méthodologie sont expliqués de manière concise sous l'onglet Méthodologie abgelegt.
  2. les examens analytiques détaillés de résultats ou de discussions théoriques ou méthodologiques peuvent être placés sous l'onglet Publications du projet.
  3. A l'aide d'un i-bouton en légende peuvent s'ouvrir les commentaires concernant les données de la carte interactive en ligne (par exemple commentaires sur les réalités extra-linguistiques (les concepts) et leur appellation dialectale avec types morpho-lexical et type de base). Ces commentaires peuvent être faits très facilement par les collaborateurs du projet ou par des personnes externes.


Fonction de commentaire accessible par la légende.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Rassembler et trier  (Citer)

En sélectionnant une catégorie sur la 'carte interactive', on obtient souvent déjà de nombreuses expressions linguistiques : la recherche du 'concept' BEURRE a par exemple 1748 attestations pour résultat. Pour cette raison, la plate-forme permet de rassembler et de trier toutes les expressions pertinentes selon des critères différents: voir concept BEURRE

Un tri d'après des types de base montre des superficies de diffusion dépassant les frontières linguistiques. Voilà un exemple du type roman butyru(m) dans les régions germaniques et du type allemand Schmalz dans les régions romaines: Voir carte.

Une option correspondante s'obtient via la recherche par types morpho-lexicaux; le tri d'après le critère 'concept', montrant la polysémie de chaque expression (voir type morpho-lexical malga), est aussi intéressant indépendamment de la région linguistique considérée.
Les significations suivantes, clairement en relation métonymiques entre elles, en résultent: Voir carte Polysémie du type morpho-lexical malga.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Réduction à types  (Citer)

La réduction à types des données géoréférenciées fait partie des exigences fondamentales de VerbaAlpina. Là où c'est possible parmi les données d'entrées étant déjà passées par la retranscription, une première étape de la réduction à types sera l'extraction de tokens ('mots individuels'), ils sont alors inscrits dans la case de base de données du même nom.

Le point de mire de VerbaAlpina est la réduction à types morphologiques des matériaux linguistiques rassemblés. Un type morphologique est défini par la concordance des propriétés suivantes: famille linguistique – partie du discours – mot simple versus mot affixé – genre – type de base lexical. La forme indiquée du type morphologique s'oriente aux lemmes correspondants de certains dictionnaires sélectionnés (voir ci-dessous).

Par l'attribution à un type de base lexical commun, l'union de tous les types morpho-lexicaux associés devient claire – même au delà des frontières linguistiques. Ainsi les noms et verbes suivants (qui ne sont pas décrits en détail ici) peuvent être attribués à un seul type de base malga (ALPAGE, TROUPEAU), malgaro (VACHER), malghese (BERGER), immalgare (ENALPER), dismalgare (DÉSALPER). Toutefois, le type de base lexical en dit peu rien sur l'histoire de parole d'un seul type morpho-lexical: on doit faire ressortir chaque fois séparément si un type avec étymon latin-roman aujourd'hui attesté dans la région linguistique germanique ou slave (par exemple slovène baita 'maison simple') remonte à un substrat local ancien ou bien à un contact linguistique roman plus récent. Pour cette raison, la désignation "étymon", faisant référence au stade historique immédiatement préliminaire d'un mot, est évitée dans ce contexte, même si le type de base lexical correspond en beaucoup de cas à l'étymon d'un type morpho-lexical.

Les types morpho-lexicaux forment la catégorie directrice dans la gestion des données linguistiques; ils sont comparables aux lemmes de la lexicographie. Au moyen des critères susnommés, résistants et bien mesurables, on peut réduire par ex. les quatre types phonétiques barga, bark, margun, bargun avec le sens CHALET DE MONTAGNE, ÉTABLE D'ALPAGE à trois types morphologiques.





L'appartenance des types morpho-lexicaux à des familles linguistiques (gem., roa., sla.) dépend de la source correspondante; dans le cas des données d'enquêtes traditionnelles d'atlas ou de dictionnaires, elle résulte automatiquement des informateurs correspondants et sera notée corrélativement dans la banque de données. Dans le cas des données que VerbaAlpina relève par crowdsourcing, l'appartenance linguistique ou bien dialectale est affirmée par les informateurs et sera confirmée quantitativement dans le meilleur des cas. Le nombre d'informateurs concordants devient ainsi un instrument de la validation de données.

Les types morpho-lexicaux sont limités à une famille linguistique. La question qui se pose alors est la suivante : sous quelle forme un type morpho-lexical devrait être représenté dans la zone de recherche de la carte interactive? Eu égard à la famille linguistique germanique et slave la réponse est plutôt facile parce que les deux sont représentées chacune par une seule langue standardisée ('Deutsch' [deu] et 'Slowenisch' [slo]). Les types morpho-lexicaux peuvent être rendus sous la forme de leur variante standard, évidemment à condition que des correspondances de ce type existent dans la langue standard. Ainsi, par exemple, tous les types phonétiques correspondants de l'alémanique et du bavarois étant des variantes de la forme standard 'fromage' peuvent être appelées par cette forme standard. Si des variantes standard n'existent pas, les lemmes des grands dictionnaires de références (Idiotikon, WBÖ) seront pris à titre d'exemple.

Dans le cas de la famille linguistique romane, la situation est beaucoup plus complexe à cause des nombreuses plus petites langues qui ne sont parfois pas suffisamment standardisées. Par des raisons pragmatiques, la solution suivante a été choisie : tous les types morpho-lexicaux sont représentés par les formes standard françaises et italiennes, si existantes. Ainsi tous les types phonétiques variantes de par ex. beurre/burro peuvent être appelées par ces deux formes. Les dictionnaires TLF et Treccani font office de dictionnaires de référence. Si seulement une de ces deux langues standard présente une variante convenable, c'est celle-ci qui apparaît, comme dans le cas de ricotta (l'appartenance à l'italien est signalée par la convention de notation -/ricotta). S'il n'y a aucune variante du type dans les deux langues de références romanes, on recourt à l'entrée d'un dictionnaire de références dialectal, comme par ex. le LSI. Au cas où il n'existe aucune entrée dans les dictionnaires dialectaux, VerbaAlpina propose un type de base qui est représenté graphiquement par le sigle 'VA'.

La réduction à types phonétiques des matériaux linguistiques est aussi prévue; cette étape de travail est pourtant secondaire est n'est pas faite de façon cohérente. La catégorie correspondante est indispensable surtout à cause des atlas linguistiques et des dictionnaires qui documentent parfois exclusivement (par ex. SDS, VALTS) des types phonétiques. Lors de la réduction à types phonétiques faite par VerbaAlpina, les tokens sont classés selon les critères de la phonétique historique dans des types phonétiques (case de base de données 'phon_typ'); une automatisation de la réduction à types phonétiques sur la base d'algorithme Levenshtein et soundex sera examinée et, si possible, appliquée.

Par la réduction à types (constitution de classes) la diversité des données devient plus claire; en règle générale: nombre des tokens > nombre des types phonétiques > nombre des types morpho-lexicaux > type de base. On note le cas extrême d'une seule attestation (hapax): l'attestation correspond à un token, un type phonétique et un type morpho-lexical comme seul représentant d'un type de base. Il peut éventuellement être raisonnable de filtrer ces formes d’hapax de la représentation.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Référent  (Citer)

Au sein du triangle des catégories linguistiques reliées entre elles « Désignation » – « Concept » – « Référent », la dernière désigne la substance individuelle d’un concept, qui par essence, est toujours abstraite, en d’autres mots un élément concret et individuel. Parmi le matériau de VerbaAlpina, on rencontre la plupart du temps des référents permettant une représentation imagée (dessin ou photographie). En comparaison des désignations et des concepts, les référents jouent un rôle de moindre importance dans le programme VerbaAlpina. Dans le cadre du "Crowdsourcings" surtout, les représentations des référents, la plupart du temps des photos, sont utilisées en même temps comme « outils de travail » afin de rendre saisissables, pour ceux qui désirent s’informer, les descriptions conceptuelles de temps à autre nécessairement compliquées.

(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Linguistique



Région étudiée  (Citer)

"Une histoire globale et cohérente des Alpes n'est pas encore réalisable à l'heure actuelle" (http://www.hls-dhs-dss.ch/textes/f/F8569.php), ce sont plutôt des définitions différentes, "naturräumliche" (géophysiques) et "wirtschaftlich-politische"(politico-économiques cf. Bätzing 1997, 23 s.) qui sont en concurrence. Dans le sens d'une délimitation transparente et pragmatique, la région étudiée de ce projet correspond au domaine d'application clairement défini de la Convention alpine; on en a accepté les "Inkonsistenzen zwischen den Mitgliedstaaten" (traduction: les inconsistances entre les États membres, cf. Bätzing 1997, 31). Ces inconsistances concernent les Préalpes bavaroises (incluses), les grandes zones touchant les Alpes comme l'Emmental ou l'Oberland zurichois, (Bätzing 1997, 32), exclues) ainsi que le traitement de quelques villes importantes en périphérie des Alpes: Lucerne et Salzbourg sont incluses, par contre Graz et Biella sont exclues. Le périmètre de la Convention alpine peut être téléchargé ici. Le but d'origine du projet est pourtant de recenser les Alpes dans ce cadre formellement fixé comme espace linguistique-culturel et de représenter la similarité des lieux qui en font partie.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Repositoria  (Citer)

La notion de „Repositorium“ n’a pas été jusqu’ici suffisamment et clairement définie, la limite qui la sépare du concept d’ « archive » notamment est floue. En principe, dans le domaine numérique on entend par repositorium un système de sauvegarde pensé pour une conservation de longue durée des données. Dans le domaine scientifique, les repositoria sont administrés la plupart du temps par des institutions publiques qui, de plus en plus reçoivent la charge de sauvegarder les données liées à la recherche. Les avantages les plus notables d’un repositorium sont : la sécurité physique des données à conserver et le maintien de leur intégrité, le stockage pérenne par l’institution en charge, la documentation concernant le contenu, la structure et l’encodage des données sauvegardées tout comme le fait qu’elle soient disponibles à tout moment, quel que soit le lieu. Au niveau des sciences humaines, le Clarin D-Verbund ainsi que le Textgrid-Repositorium jouent actuellement (2016) en Allemagne un rôle particulièrement important.
VerbaAlpina s’efforce de consigner toute version VA dans un ou plusieurs repositoria.


(auct. Stephan Lücke)

Tags: Page Web



Représentation quantifiée  (Citer)

[Remarque préliminaire: l’article suivant est lié en partie aux fonctionnalités de VA_WEB qui sont encore actuellement en travaux et qui ne sont pas encore accessibles au public]

La carte interactive de VerbaAlpina permet, à côté d’une cartographie qualitative, également une visualisation de données agrégées dans le sens d’une représentation quantifiable des données dans l’espace. L’agrégation s’oriente toujours à cet égard sur des régions géographiques. L’utilisateur a le choix entre une agrégation sur la base d’une surface communale (petit espace), les soit- disant régions NUTS-3 (espace moyen) et enfin les régions de diffusion des trois grandes familles linguistiques germano-roman-slave (grand espace). En outre, il y a la possibilité de définir à volonté les surfaces communales comme des régions individuelles qui ensuite fonctionnent inversement comme des valeurs de référence de l’agrégation. Une toute dernière option peut agir contre des effets déformants qui résultent dans la perspective d’une agrégation au-delà des surfaces administratives et ainsi dans la perspective de la linguistique des régions communales ou bien des régions NUTS-3. Dans des cas particuliers, cette procédure correspondante peut bien entendu n’être qu’heuristique, l’utilisateur a cependant la possibilité de sauvegarder les cohérences régionales qu’il aura découvertes comme étant éloquentes, de les commenter, de les réutiliser et de les mettre à disposition de la communauté.
En relation avec les régions choisies, respectivement avec les surfaces, l’ensemble des données qualitatives choisies jusqu’à l’activation de la représentation quantitative sont agrégées. Grandeur et rendu des couleurs de chaque symbole cartographique sont corrélés à cet égard avec le nombre des données qualitatives singulières focalisées sur un symbole à chaque fois. La valeur maximale fondée de manière arithmétique, par l’accès duquel un symbole contient toujours une grandeur maximale et un rendu des couleurs, correspond à cet égard de manière standard la quantité la plus grande en matière de données agrégées, qui apparaît dans l’une des surfaces, respectivement des régions choisies. Cette valeur de référence maximale peut être appliquée à souhait sur l’ensemble des données agrégées prise une par une, ce qui conduit à une modification de la représentation cartographique.
Lorsque la fonction quantification est activée, on peut extraire des données quantitatives, par désactivation de chaque entrée dans une liste dans la légende de la carte, les données qualitatives correspondantes ou bien ajouter d’autres données par un autre choix.
A côté de la quantification d’une carte géo-référencée qui reproduit les tracés frontaliers en temps réel, VerbaAlpina permet également la représentation de données quantifiées sur une carte dénommée « en alvéoles ». Son modèle est un dessin Wikipedia qui visualise les résultats des élections britanniques à la Chambre des Communes de 2015. Sur celle-ci, on a d’abord restitué fidèlement la carte en ses points, distances et angles (celle-ci désigne la « carte géographique ») avec les résultats des élections dans chaque circonscription. Au final, on y représente une carte en alvéoles sur laquelle chaque circonscription est figurée par un hexagone de grandeur identique.




Source : https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Source : https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (demandées le 03.11.2016)
La confrontation des deux types de cartes montre leurs avantages et inconvénients respectifs. La carte en alvéoles renvoie à des imprécisions géographiques, respectivement même à des informations erronées. On reconnaît ainsi par exemple dans le district Greater London une alvéole rouge isolée qui se trouve entourée d’alvéoles bleues imposantes – un fait anodin mais qui ne trouve pas de preuve sur la carte géographique. D’un autre côté, la carte en alvéoles possède l’avantage de mieux visualiser les relations réelles entre les chiffres, par chaque couleur, étant donné que, sur la carte géographique, une multitude de toute petites circonscriptions du point de vue de la surface sont perçues par l’observateur comme inférieurs, bien que leur importance politique est mise sur le même plan que celle des grands districts d’un point de vue de la surface. C’est ainsi que les deux types de cartes se complètent et leur véritable plus-value réside dans la possibilité de pouvoir consulter les deux cartes et de confronter leur visualisation.
La carte alvéolaire de VerbaAlpina se distingue du fait qu’elle représente l’ensemble des communes politiques de l’espace alpin par de grands hexagones de taille identique à chaque fois. A cet égard, on cherche, à peu près, à conserver au moins la logique géographique. Le calcul du rendu des couleurs des hexagones pris un par un s’ensuit de la même manière que sur la carte à points. L’avantage d’une telle carte alvéolaire consistant, contrairement à une simple coloration des surfaces communales, en une carte géo-référencée, est que les effets suggestifs sont mis au second plan par rapport aux grandeurs variables des surfaces communales.


(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Technologie de l'information Page Web



Rhéto-roman  (Citer)

Conformément à la Constitution fédérale de la Confédération suisse, l'expression allemande 'Rätoromanisch' (version française de la Constitution fédérale : 'romanche') est utilisée dans le projet VerbaAlpina pour les variétés romanes du Canton des Grisons qui ne font traditionnellement pas partie des variétés italiennes (cf. Gross 2004 et Liver 2010). En faisant ainsi, on n'affirme absolument pas la réunion de ce romanche grison avec le ladin des Dolomites et le frioulan dans le sens d'une 'langue' commune; c'est justement pour ce concept (qui aujourd'hui n'est plus acceptable) que l'expression 'Rhéto-roman' a été forgé par la linguistique au 19ème siècle. Graziadio Isaia Ascoli a développé l'idée en tant que telle et a désigné cette langue comme 'ladino' en italien.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Rubrique onomasiologique  (Citer)

Afin de décomposer les concepts en catégories fonctionnelles, ceux-ci sont répartis en produits, processus, personnes, appareils et contenants. On peut les caractériser comme suit :

produits
Ils constituent une partie de la catégorie « produit » dans son sens le plus large, c’est-à-dire que le lait peut aussi faire partie de ce groupe. En outre, la crème, le petit-lait, tout comme les restes de fermentation sont aussi des produits, desquels on peut tirer de nouveaux produits :

processus
Par des processus, on tire d’un produit d’autres produits (par exemple petit-lait/ fromage blanc).
personnes
La plupart du temps, les personnes sont liées à des processus, comme par exemple le vacher.

appareils
Les personnes utilisent des appareils pour transformer les produits à travers un processus. L’appareil est utilisé pour porter un produit d’un état à un autre (par exemple, briser le lait caillé à l’aide d’une harpe à fromage). Lors de l’utilisation d’un appareil, une forme d’énergie, par exemple la force musculaire ou le courant électrique est toujours en jeu. La distinction avec le contenant n'est pas toujours précise. Un contenant destiné à un processus de maturation, ou bien encore à retirer le liquide d'un produit à l'aide de la pesanteur, représente ainsi également un appareil. Il en va ainsi pour les différentes formes de baratte de beurre. Elles contiennent certes la crème, or leur but n’est pas de la stocker, mais elles sont utilisées pour le processus suivant : séparer la crème en beurre et en petit-lait.

contenants







(auct. Markus Kunzmann)

Tags: Linguistique



Sémantique  (Citer)

La structuration digitale des données ('taux de numérisation D 3') permet une analyse sémantique différenciée des expressions linguistiques saisies, en effet synonymes, polysémies et homonymes se laissent représenter par ce qu'on appelle relations, grâce au lien entre « désignation » et 'concepts':


Graphique : Stephan Lücke
A la lumière des relations conceptuelles existantes, le profil sémantique synchrone d'une expression polysème peut être esquissé ; les formes de polysémie les plus importantes sont nommées comme suit :
- Taxinomique Forme de polysémie présente lorsqu’une expression désigne des concepts de manière hiérarchique, d’un point de vue aussi bien supérieur qu'inférieur.
- Méronymique Forme de polysémie présente lorsqu’une expression désigne aussi bien un fait complexe (‘le tout’) que les constituants de ce fait (‘la partie) ; c’est ainsi que l'ALPAGE, pour les paysans une partie importante de la montagne, est fréquemment désigné par le mot ‘montagne’ tout bonnement :




Désignation méronymique du concept ALPAGE comme partie de la montagne par transmission de la désignation du tout
Morpho-lex. Typ montagna 'Berg' (roa. f.) (16 Belege)
Morpho-lex. Typ monte (roa. m.) (67 Belege)
D’autre part, l’ALPAGE en tant que tout économique (avec tout ce qui lui est attaché) peut être désigné par des expressions qui ne sont normalement là que pour des composants de l’économie d’alpage :  
VA_ALM_Teil td colspan="2"> Désignation méronomique du concept d’ALPAGE comme un tout par transmission des désignations des composants
Morpho-lex. Typ cascina 'Sennhütte' (roa. f.) (1 Beleg)
Morpho-lex. Typ casera 'Sennhütte'  (roa. f.) (1 Beleg)
Morpho-lex. Typ cjampei 'Felder' (roa. m.) (2 Belege)
type morpho-lexical pascol 'Weide' (roa. m.) (1 Beleg)
type morpho-lexical pascolo 'Weide' (roa. m.) (1 trace)
- Métonymique Polysémie présente lorsqu’une expression désigne des concepts qui, à l’intérieur d’un seul et même ‘tout’, désignent différentes ‘parties’ : ainsi font partie de l'ALPAGE entre autres le BETAIL, les BATIMENTS (pour le personnel et pour le bétail), une BARRIERE, etc. Tous les composants susnommés peuvent être désignés dans différents dialectes romans par le type morpho-lexical roa. mandra : VA_mandra Significations métonymiques du type morpho-lexical roa. mandra
concept HABITATION D’ALPAGE (1 référence)
Concept ETABLE D‘ALPAGE (2 références)
concept TROUPEAU (15 références Sources)
concept ENCLOS A BOEUFS (3 références)
- Métaphorique Polysémie présente lorsqu’une expression désigne des concepts venant de différents domaines n'ayant pas de points communs entre eux. Le concept de CREME à lui seul est désigné par les métaphores ainsi que les comparaisons suivantes :
  1. en tant que 'tête': capo (roa. m.), (19 références), en outre capo di latte (roa.), mot à mot 'tête de lait'  (12 références), il capo del latte (roa.) (1 référence)
  2. en tant que ‘fleur’ : fleur / fiore (roa. m.) (15 références), fiora (roa. fem.) (17 références), dazu fiora cruda (1 référence), mot à mot  'fleure crue’, fiore di latte (roa.), mot à mot 'fleur de lait' (2 références)
  3. en tant que 'peau': Haut (gem. m.) (2 références), peau / pelle (roa. fem.) (1 référence), la pelle del latte (roa.) (1 référence)
  4. en tant que 'fourrure': pelliccia (roa. fem.) (2 références), fourrure (gem. m.) (4 références)
  5. en tant que 'brouillard': sbrumacje (roa. fem.) (2 références), sbrume (roa. m.) (11 références)
  6. en tant que 'mousse': écume / schiuma (roa. f.) (2 références), spuma (roa. fem.) (1 référence), spumacje (roa. fem.) (1 référence)
  7. en tant que 'toile': toile / tela (roa. m.) (14 références), en outre tela del latte (roa.) (1 référence) et tela di latte (roa.) (5 références), mot-à-mot  'toile de lait'
Le troisième type, 'peau', montre d’ailleurs très bien que les métaphores aussi peuvent être répandues au-delà des limites de familles linguistiques; en effet ici l'allemand Pelz et le roman pelliccia sont des représentants du même type de base, le latin pellīcia, forme féminine d’un adjectif dénominal du latin pellis 'Haut'.





 
    - Antonymique Polysémie présente lorsqu’une expression désigne des concepts qui s’opposent l’un l’autre.
Il va de soi qu’une expression peut aussi désigner plusieurs relations sémantiques différentes, comme les concepts liés dans différentes variations romanes avec le type base malg-  le montrent de manière exemplaire.





(auct. Thomas Krefeld – trad. Pierre Herrmann)

Tags: Linguistique



Signature d'auteur  (Citer)

Les règles suivantes s'appliquent aux signatures d'auteur :
- Signatures simples, par exemple SO ='en cours'.
- Sigles entre parenthèses, par exemple (SO) ='fait'.
- Sigles entre crochets, par exemple {SO} ='Modifications apportées'.

Les même règles s'appliquent pour plusieurs auteurs. Les traducteurs sont traités comme les autres auteurs : SO/SL, également avec les règles de crochets mentionnées ci-dessus. Les signatures indiquent qui est le premier auteur (= auct.) et qui est le traducteur (= trad.). Chaque traducteur devrait également améliorer les passages peu clairs dans l'original après avoir consulté l'auteur.

Les conventions de marquage mentionnées ne s'appliquent qu'à VA_XXX ; dans les versions terminées, toutes les signatures sont notés (nn) ou (nn | nn).

(auct. Thomas Krefeld | Stephan Lücke – trad. Beatrice Colcuc)

Tags: Page Web



Sources  (Citer)

Des sources très différentes sont réunies dans VerbaAlpina. Il faut distinguer les sources déjà publiées (les atlas, les dictionnaires et les monographies) d’une part, et les sources nouvelles, c’est-à-dire celles qui ont été mises à jour par le projet lui-même, en font aussi partie les données rassemblées par des collaborateurs, comme par exemple Béatrice Colcuc, et les données qui sont fournies par les crowd, c’est-à-dire les locuteurs individuels et non connus personnellement. Les sources utilisées sont exclusivement des sources livrant des données linguistiques géo-référencées ou du moins que l’on peut géo-localiser. Toutefois, ces données doivent subir systématiquement un traitement différencié au vu de la Réduction à types. Les propos transcrits phonétiquement avec exactitude sont affichés par VerbaAlpina comme des « références individuelles ». Il est intéressant à présent de regrouper (« typiser ») ces références individuelles ; on peut considérer d’entrée de jeu comme typisées les données proposées par la source sous forme orthographique, étant donné que beaucoup de variables phonétiques sont masquées par cette forme de transcription. De là, VerbaAlpina ne se contente pas d'indiquer les sources, mais précise aussi systématiquement le statut (« référence propre » vs « type phonétique » vs « type morpho-lexical ») de chaque donnée linguistique que fournit la source. Les dictionnaires de références dictionnaires de référence, dans lesquels les types morpho-lexicaux sont protégés d’un point de vue lexicographique et dans le meilleur des cas reliés, n’ont pas valeur de sources. À ce propos, nous citerons les exemples suivants :  
(1) La source fournit une référence propre :
Une seule référence :  [a̠lpˈejo̞] – Lieu : Bassano del Grappa – Source : ALD-II 848_1, 181 (Valrovina)
Type phonétique : (non-typisé)
Type morpho-lexical : Treccani  alpeggio (roa. m.)
Base-type : alpe; voir DELI 42
Concept : ALPAGE
(2) La source fournit un type phonétique
(Pas de référence propre disponible) – Lieu : Adelboden
Type phonétique : Anke -Source : SDS V_179_1, BE104
Type morpho-lexical : Anke (gem. m.), voir Idiotikon s.v. Anke, 1, 341 ss.
Base-type : anko; voir Kluge 2001, 47
Concept : BEURRE
(3) La source fournit un type morpho-lexical :
(Pas de référence propre disponible) – Lieu : St. Peter-Pagig
Type phonétique : Putter- Source : SDS V_179_1, GR22
Type morpho-lexical : Butter (gem. n.), voir Idiotikon s. v. [[Butter,  1, 341 ss.
Source : SDS V_179_1, GR22
Base-type : butyru(m); voir DELI 178
Concept : BEURRE
(4) La source fournit un type morpho-lexical qui existe certes dans la langue allemande standard, mais qui entre en relation avec un autre concept :
Type morpho-lexical : Pelz Duden s.v. Pelz (nicht für dieses Konzept); Idiotikon s.v. Belz P-, 4, 1222 – Quelle: SDS V_162_1
Concept : PEAU SUR LE LAIT, LORS DU REFROIDISSEMENT APRES EBULLITION


(auct. Thomas Krefeld | Stephan Lücke)

Tags: Page Web



Statut d'auteur  (Citer)

Toutes les contributions écrites sur la page de VerbaAlpina sont marquées nominalement. L'abréviation "auct." marque l'auteur/les auteurs d'une contribution, l'abréviation "trad." marque le(s) traducteur(s). S'il y a plusieurs auteurs ou traducteurs, les noms sont toujours affichés par ordre alphabétique.

Le software est développé essentiellement par Florian Zacherl, David Englmeier (à partir du 1/10/2016) et Filip Hristov (à partir du 1/10/2016).

(auct. Thomas Krefeld | Susanne Oberholzer | Florian Zacherl – trad. Susanne Oberholzer)

Tags: Page Web



Strates  (Citer)

La linguistique diachronique (l'histoire de la langue) distingue deux configurations historiques (voir Krefeld 2003). Se basant toutes deux sur un espace géographique, elles partent de la langue parlée dans chaque région au moment de l'analyse; cette langue peut parfois être désignée par le mot ‘strate’ :
  • les langues parlées jadis dans l’espace d’analyse (‘couches anciennes’) sont appelées ‘substrats’ ; au cours de l’histoire, celles-ci ont été refoulées par la langue prise en considération, la strate ;
  • Les langues qui, de manière secondaire, par conquête, sont parvenues jusque dans le champ d’analyse, ayant eu durant un certain temps des interférences avec la langue prise en considération sont appelées ‘superstrats’ ; ces langues ne purent cependant pas refouler les langues interférées et disparurent d’elles-mêmes après un temps plus ou moins long, souvent à la suite de changements politiques. Ainsi par exemple, le superstrat allemand des régions romano-slaves de l’empire austro-hongrois a décliné avec la désintégration de cette forme étatique, après la Première guerre mondiale.

  • On ne parle donc de substrats et de superstrats qu’à posteriori, du point de vue d’une époque à laquelle ces langues ne sont plus parlées dans le secteur analysé; à cet égard, il faut parfois faire de grands sauts dans le temps, de sorte que l’on s’oriente sur les systèmes linguistiques pour y chercher des modifications induites par des contacts, c’est-à-dire que l’on cherche les résultats de ces contacts linguistiques. Pour véritablement comprendre l'apparition présumée d’un contact linguistique, la période historique de chaque bilinguisme, c’est-à-dire l’époque durant laquelle deux langues ont été parlées côte à côte et en même temps, reste décisive. Ces langues parlées au cours de la même période s’appellent des ‘adstrats’. Il faut cependant immanquablement prendre en compte une perspective synchronique qui ne peut être limitée aux ‘langues’ mais prend aussi en compte le ‘locuteur’ avec sa compétence spécifique et peut-être même l’expression concrète, le ‘parler’. Dans une perspective historique, cela est certes souvent impossible, mais il faut cependant y penser aussi en principe lors de la reconstruction de la Stratigraphie, car il faut apprécier différemment l’expression d’un locuteur bilingue de celle d’un locuteur monolingue.


    (auct. Thomas Krefeld – trad. Pierre Herrmann)

    Tags: Linguistique



    Stratigraphie  (Citer)

    Les Alpes sont une région de contacts linguistiques variés et ce depuis l'époque préhistorique. Ces contacts remontent à des configurations stratigraphiques très différentes (cf. Krefeld 2003). En principe, les langues entrant en contact dans une région de locuteurs (ou de communautés de locuteurs) plus ou moins bilingues sont appelées adstrats. Si un type de contact est répandu seulement dans une certaine région, comme par exemple dans les Alpes, et si ce type ne se retrouve pas ailleurs dans les familles linguistiques concernées, souvent ni la direction de l'emprunt, ni la langue d'origine ne seront claires (cf. le type de base roa. baita 'chalet de montagne' / ted. Beiz, Beisl 'buvette').
    Si la langue d'origine de l'élément emprunté n'est plus parlée dans la région de diffusion, on distingue deux configurations : dans le cas du substrat, la langue d'origine (la langue de substrat) était parlée dans la région de diffusion avant que la continuité de sa tradition orale n'ait été interrompue et que la langue dominante se soit imposée; le roman est la langue de substrat pour toutes les zones de la région alpine où l'on parle actuellement allemand et slovène. Les mots de substrat se distinguent souvent par une continuité régionale ou locale extraordinaire; ils survivent donc au remplacement de leur langue d'origine (la langue substratique) par les langues lui succédant. Dans le cas du superstrat, la langue d'origine a été dominante pendant une certaine période dans la zone de diffusion, sans s'y établir durablement. Ainsi, dans les parties de la région alpine où on parle aujourd'hui des les variétés romanes, des superstrats germaniques (le gotique, le lombard) prédominaient après l'effondrement de l'infrastructure romane; en Slovénie, l'allemand avait cette fonction de langue superstratique pendant la période des Habsbourg. Entre les trois familles linguistiques, des scénarios complètement différents se sont développés; eu égard à l'importance du contact linguistique pour l'histoire de l'espace linguistique, c'est surtout la chronologie de l'emprunt qui compte : par exemple la question de savoir si les emprunts romans dans les régions germaniques et slaves représentent de mots de substrat avec une continuité orale régionale depuis l'Antiquité ou d'emprunts plus récents de type adstratique. La même question vaut mutatis mutandis pour les germanismes dans la région romane et les slavismes dans la région germanophone.



    Les emprunts sont un indicateur fiable des divers processus d'acculturation historique; il méritent donc une analyse quantitative qui soit capable de documenter des effets d'accumulation locale.

    (auct. Thomas Krefeld – trad. Susanne Oberholzer)

    Tags: Linguistique



    Stratigraphie : romanismes  (Citer)

    "Romanismes“ désigne dans VerbaAlpina toutes les expressions retrouvées aujourd’hui dans la région de langue allemande et slave faisant l’objet de recherches. Les expressions viennent directement du roman et indirectement du latin voire des langues préromaines. A cet égard, il faut distinguer deux configurations géolinguistiques et historiques différentes, au regard de la stratigraphie régionale tout comme au regard de la vaste ‘architecture’ de l’allemand et du slovène.
    (1) Les romanismes exclusivement dialectaux
      Cette catégorie, à laquelle appartiennent les variantes locales sans correspondances dans la langue standard, constitue pour ainsi dire les emprunts romans prototypiques de l’espace alpin; il s’agit de mots substrats, c’est-à-dire d’expressions qui ont été empruntées à l’époque d’une cohabitation linguistique, selon le cas romano-germanique ou romano-slave, et qui ont survécu grosso modo en qualité de reliquat aux changements linguistiques futurs tendant vers un monolinguisme germanique ou slave. Le type morpho-lexical Käser, qui renvoie comme son équivalent roman casera à la base-type lat. casearia, en est un exemple clair.
    Voir carte.






    (2) Les romanismes dialectaux avec correspondance dans la langue standard et les dialectes romans du terrain de recherche
      Etant donné que, dans ce groupe tout comme dans le cas de (1), il y a eu une diffusion par aire géographique dépassant les frontières actuelles des familles linguistiques, on conçoit aisément que les variantes de la langue standard renvoient aux formes dialectales. Cette catégorie de romanismes peut de ce fait aussi revendiquer d’avoir un intérêt historico-linguistique au-delà de l’espace alpin. Un exemple clair et méconnu dans l’étymologie de l’allemand standard serait le mot allemand, féminin, Butter.
    La carte suivante montre clairement que la variante sud-allemande du masculin der Butter forme une aire commune avec le type roman également masculin butirro und beurre et qu’il doit de ce fait être considéré comme historiquement premier face à la variante standard féminine: voir carte.

    Ce cas de figure, de l’emprunt sud-allemand premier puis de sa diffusion dans l’allemand standard dans un second temps, semble cependant ne pas être toujours évident, dans la mesure où l'on doit aussi envisager la possibilité qu’il se soit diffusé à l’inverse, de l’allemand standard au dialecte du champ de recherche. C’est ainsi que l’on pourrait éventuellement voir les correspondants allemands du type de base lat. cellārium.
    Aussi bien dans le cas des romanismes exclusivement dialectaux que dans celui des romanismes de langues dialectales et standards, il faut distinguer dans le détail les reliquats locaux substrataux et les emprunts adstrataux avec des diffusions secondaires par aires.


    (auct. Thomas Krefeld – trad. Pierre Herrmann)

    Tags: Linguistique



    Stratigraphie et onomasiologie  (Citer)

    Certains domaines onomasiologiques ont des affinités évidentes avec les emprunts linguistiques; on trouve ainsi en allemand des types romans, voire préromains, pour certains concepts tirés du domaine de l’alpage, spécifiquement de la transformation du lait (voir les bases-types butyru(m), caseu(m), caseāria, crama, tegia, stabulum u. a.).
    Cela se passe à sens unique, dans la mesure où les techniques culturelles fondamentales correspondant à l’espace alpin sont très anciennes et ont été transmises à chaque ethnie arrivante et donc à sa langue. Mais cela serait bien évidemment trop simple de lier des parties déterminées du domaine onomasiologique au tout avec des ‘couches’ linguistiques déterminées. Il faut plutôt remarquer que justement ce sont aussi les emprunts qui sont attestés dans un sens opposé, et de là, il faut supposer un échange culturel réciproque s'inscrivant dans la durée. Les types de désignation complémentaire pour le concept de BEURRE sont à cet égard caractéristiques. Tandis que le type roman Butter s’est imposé dans le bavarois, le type allemand Schmalz est établi dans une partie du patois roman. Voir carte synoptique des bases-types butyrum und saindoux.

    Il semblerait donc que "laisser de côté" c’est-à-dire "faire fondre" (de là vient Schmalz) le beurre en tant que technique de conservation élémentaire se sont propagé vers le sud en partant de l’espace germanophone.
    Les types de désignation latins stabulu(m) et allemands Stall donnent une image comparable dans le cas d’un bâtiment d’alpage: Voir carte.



    (auct. Thomas Krefeld)

    Tags: Linguistique



    Structuration des données  (Citer)

    voir Modélisation des données

    Tags: Technologie de l'information



    Technologie  (Citer)

    VerbaAlpina utilise autant que possible la technologie en ligne. Le noyau du projet est une installation Wordpress (Modul VA_WEB) à laquelle sont reliées plusieurs base de données MySQL (Modul VA_DB). Wordpress est un framework PHP disponible gratuitement, open source et extensible individuellement, dont les fonctionnalités sont complétées par l'utilisation de bibliothèques Javascript. Cela s'applique surtout au plan interactif en ligne qui, dans les premières versions de VerbaAlpina, utilisait la Javascript-Bibliothek von Google Maps. La conversion vers le framework open source Javascript-Framework "Leaflet", devrait avoir lieu avec la version 19_1, qui sera accompagnée par l'implémentation d'un layer WebGL pour la visualisation de grandes quantités de données.

    Toutes les fonctionnalités développées par VerbaAlpina sont implémentées sous forme de plug-ins. Les plug-ins sont ensuite stockés sur "Github", une plateforme bien connue et fermement établie dans la communauté des développeurs (https://github.com/VerbaAlpina/). Ils peuvent être téléchargés et réutilisés librement et sans restriction. L'utilisation des plug-ins est possible grâce à la MIT, largement utilisée dans le domaine du développement de logiciels. La distinction entre les plug-ins PHP et Javascript affichée sur Github est artificielle et a été automatiquement saisie par la même plateforme. La plupart des plugins développés par VerbaAlpina contiennent toujours certaines parties de code Javascript en plus du code PHP. Actuellement (novembre 2018) les plugins "TranscriptionTool-Plugin", "Interactive-Map_Plugin", "Verba-Alpina-Plugin" sont disponibles sur la page Github de VerbaAlpina. De plus, le "Thème Verba-Alpina", design utilisé pour le frontal, peut y être téléchargé. VerbaAlpina a prévu de proposer d'autres extensions fonctionnelles sous forme de plug-ins à télécharger sur Github.

    Liste des principales extensions fonctionnelles développées par VerbaAlpina jusqu'à présent:
    • Plan interactif en ligne (visualisation multicouche des analyse de données)
    • Outil de transcription (surtout pour la transcription des atlas linguistiques)
    • Outil de typisation (catégorisation du matériel relevé et affectation aux types)
    • Arbre conceptuel (gestion de la structure hiérarchique du monde conceptuel extra-linguistique)
    • CS-Tool ("Crowdsourcing"-Tool; collecte de matériel linguistique via Internet pour compléter les données)
    • SQLtoHTML (intégration directe des résultats des requêtes SQL dans les contributions Wordpress)

    A côté de ces outils complexes, qui peuvent être utiles pour les utilisateurs aussi en dehors de VerbaAlpina, plusieurs fonctionnalités ont été développées, dont la transformation en plug-ins modulaires ne semble pas pertinente, car elles apparaissent soit trop petites soit trop spécifiquement adaptées aux besoins de VerbaAlpina. Cependant, cette catégorie de développements est également accessible, d'autant plus que le code complet du logiciel de VerbaAlpina est stocké sur Github en plus des plug-ins ci-dessus.

    Le back-end connecté à Wordpress est constitué de plusieurs bases de données MySQL. La base de données va_wp est basée sur le modèle standard d'une base de données MySQL, couramment utilisée comme back-end pour les installations Wordpress. A travers cette base de données, on gère principalement les fonctionnalités "génériques" d'une installation Wordpress comme par exemple la gestion des utilisateurs. La base de données scientifique centrale de VerbaAlpina telle que les transcriptions (tableau 'tokens'), typisations au sens large (tableau 'morph_typen', 'basistypen', 'etyma' et 'lemmata'), concepts ('konzepte'), contributions méthodologiques ('glossar') et du Lexikon Alpinum ('im_comments') ou la bibliographie ('bibliographie') se trouve dans la base de données va_xxx. Le suffixe "xxx" indique les différentes versions de VerbaAlpina, dont la base de données est soumise à des modifications constantes en cours de fonctionnement. Lors de la création d'une version de VerbaAlpina, une copie stable de cette base de données est créée. Le nom de cette copie stable sera composé par "va_" et le suffixe contiendra le numéro de version (par exemple: va_181). De plus, il existe une base de données MySQL pour différents partenaires de VerbaAlpina. Les noms de ces bases de données portent le préfixe "pva_" (=Partenaires de VerbaAlpina) suivi d'une abréviation du projet partenaire (par exemple: pva_ald-i).

    Les fichiers multimédia (images, vidéos, enregistrement sonores) collectés par VerbaAlpina dans la médiathèque (Modul VA_MT) de l'installation Wordpress sont stockés dans le système de fichiers du serveur web, comme de coutume pour les installations Wordpress.

    Toutes les instances technologiques de VerbaAlpina, à savoir l'installation Wordpress ainsi que les bases de données, utilisent l'infrastructure informatique du groupe de la technologie de l'information des sciences humaines de la LMU. Cette institution dispose d'un système de gestion informatique professionnel avec des serveurs web et de bases de données à haute disponibilité et utilise également les services du centre informatique de l'académie bavaroise. Avec un total de sept postes permanents, le stock actuel du groupe est assuré à long terme. Une partie du personnel se consacre exclusivement à l'exploitation, à la maintenance et à l'entretien du matériel et des logiciels du serveur.

    Tous les développements de logiciels ont été réalisés par les informaticiens David Englmeier (collaborateur scientifique; depuis octobre 2016), Filip Hristov (assistant; depuis septembre 2016) et Florian Zacherl (collaborateur scientifique; depuis octobre 2014).

    (auct. Stephan Lücke – trad. Beatrice Colcuc)

    Tags: Technologie de l'information



    Terminologie  (Citer)

    On fait souvent une distinction entre les données brutes, les données primaires et les métadonnées. Il n'existe pas encore de définition contraignante de ces catégories.

    Données brutes: données après l'adoption à partir de la "source" (par exemple à partir des données des partenaires, par OCR à partir de dictionnaires, par transcription...)

    VA est basé sur le modèle Stuart Card (infovis-reference-model; modèle de référence pour la visualisation).

    Une distinction est faite entre les données brutes et les données primaires. Les données brutes sont toutes les données sous leur forme d'avant leur transfert électronique dans la structure de VA. Ceci s'applique également dans le cas où les données à transférer sont déjà disponibles dans la structure de VA, puisque l'interaction humaine est également nécessaire pour le transfert de données dans ce cas (par exemple, pour déterminer *que* la structure est identique).

    Les données primaires sont toutes les données qui peuvent être récupérées via l'API avec le paramètre "getRecord" (exemple: https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getRecord&id=C1&version=182&format=xml&empty=0; pas encore complètement implémenté). Une distinction est faite entre les données primaires de base (= données linguistiques) et les données primaires périphériques (périphérie linguistique comme par exemple les données archéologiques).

    Les métadonnées sont l'ensemble des données décrivant les données primaires (par exemple, les données administratives décrivant l'ensemble du projet, tous les textes explicatifs, commedans la méthodologie [qui met en évidence différents aspects du projet global] ou le Lexikon Alpinum).

    Les données secondaires sont toutes les données utilisées pour traiter toutes les autres données (code, requêtes, etc....).

    (auct. David Englmeier | Filip Hristov | Thomas Krefeld | Stephan Lücke | Christina Mutter | Florian Zacherl – trad. Beatrice Colcuc)

    Tags: Technologie de l'information



    Transcription  (Citer)

    Les matériaux linguistiques sont rendus graphiquement de manière double afin de satisfaire les deux principes contraires de la fidélité à la source et de la comparabilité facile:

    (1) Version d'entrée dans la transcription originale

    Le portail de VerbaAlpina réunit des sources qui proviennent de traditions scientifiques différentes (philologie romane, allemande et slave) et qui représentent différentes phases historiques de la recherche dialectologique. Certains données lexicographiques ont été relevées au début du siècle dernier (GPSR) et d'autres il y a peu d'années (ALD) seulement. Pour cette raison, il est nécessaire du point de vue historique et épistémologique de respecter la transcription originale à quelques détails près. Pour des raisons techniques, il est pourtant impossible de maintenir intégralement certaines conventions; cela concerne en particulier les combinaisons verticales de caractère de base ('lettre') et signes diacritiques comme par exemple la superposition typographique d'un diacritique pour l'accent, d'un diacritique pour la durée, d'une voyelle et d'un diacritique pour la fermeture. Ces conventions sont transférées dans des séries linéaires de signes selon des transcriptions techniques définies pour chaque convention en utilisant exclusivement des caractères ASCII ("Beta code"). Jusqu'à un certain point, on peut profiter des ressemblances graphiques intuitivement compréhensibles entre les diacritiques originaux et les pendants ASCII choisis pour l'encodage beta; ces ressemblances sont mnémoniquement favorables.

    (2) Version de sortie en API

    Pour satisfaire la comparabilité et aussi le confort, il est souhaitable de rendre toutes les données dans une transcription uniforme. C'est pourquoi tous les beta codes seront transférés dans des caractères API au moyen de routines de remplacement spécifiques. On n'est confronté qu'à peu de problèmes, qui pourtant sont inévitables : par exemple si un caractère de base spécifié par des diacritiques dans la transcription d'entrée correspond à deux caractères de base différentes en API. Cela concerne surtout les degrés d'aperture des voyelles où par ex. deux caractères de base <i> e <e> combinés avec un point de fermeture et un ou deux crochets d'aperture permettent de représenter six degrés d'aperture dans la série palatale; dans l'encodage beta ce sont les suivants: i – i( – i((– e?-- e – e(– e((. Pour représenter cela, API n'offre que quatre caractères de base: i – ɪ – e – ɛ.

    (auct. Thomas Krefeld – trad. Susanne Oberholzer)

    Tags: Linguistique Technologie de l'information



    Uniform Resource Name (URN)  (Citer)

    voir Digital Object Identifier

    Tags: Technologie de l'information



    Wikidata  (Citer)

    Wikidata est une base de connaissances libre servant à gérer et mettre à disposition les données d'autres projets Wikimédia (Wikipédia, Wikivoyage, Wikisource) dans une sorte de mémoire centrale. Grâce à leur mise à disposition sous une licence libre (Creative Commons Public Domain Dedication 1.0), les données Wikidata peuvent être rédigées, utilisées et consultées dans jusqu'à 111 langues. À la différence de Wikipédia on n'y trouve pas des articles entiers, mais une nomenclature de concepts dont chacun correspond à un identifiant Q unique (Q-ID). Le concept LACTOSÉRUM, par exemple, est lié à l'identifiant Q 185009 (cf. Wikidata). Même si la pérennité du catalogue Wikidata n'est garantie dans le sens strict, dans une visée linguistique ce dernier constitue en effet la base pour un référentiel onomasiologique particulièrement utile.

    VerbaAlpina attribue à ses concepts les identifiants correspondants enregistrés par Wikidata, ces derniers jouant un rôle clé notamment pour la collaboration avec le projet GeRDI. GeRDI peut alors recourir à Wikidata comme base de connaissances (knowledge base) dans le but de faciliter des recherches multilingues et interdisciplinaires; la recherche d'un mot clé italien, par exemple, fournira donc aussi des résultats disponibles en d'autres langues.

    Des concepts encore inexistants sur Wikidata y sont ajoutés par VerbaAlpina au fur et à mesure. À ce titre, un compte d'utilisateur Wikidata lié au projet VerbaAlpina a été créé. La langue standard étant l'anglais on peut cependant saisir l'équivalent d'un concept donné dans toutes les langues disponibles sur Wikidata.

    (auct. Christina Mutter – trad. Sonja Schwedler-Stängl)

    Tags: Technologie de l'information



    Wording  (Citer)



    Tags: Page Web