Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O  P   Q  R   S   T   U   V  W  X  Y  Z 


Approche inductive à l'espace culturel  (Citer)

Le projet focalise les Alpes comme un seul complexe d'espace culturel parce que VerbaAlpina part des attentes de techniques culturelles communes dans toute la région alpine. La base pour cela consiste dans l'adaptation à des conditions de vie identiques ou au moins très semblables en haute montagne et dans la diffusion toute naturelle d'aptitudes et traditions correspondantes qui est associée à ces conditions de vie communes. Comme ces points communs se manifestent clairement dans la langue par des désignations correspondantes, il ne convient pas de décrire la culture alpine spécifique dans une approche trop étroite de communautés linguistiques séparées, pour ainsi dire "top-down", c.-à-d. par une grille de points d'enquête dans des régions linguistiques ou dialectales fixées a priori; cela correspond le plus souvent aux intentions de la dialectologie qui vise à la description la plus complète possible de régions isolées et de variétés dans l'idéal spécifiques. Dans la perspective adoptée par le projet qui est celle d'une géolinguistique plurilingue qui franchit les frontières linguistiques, les zones de diffusion de traditions culturelles et de leurs désignations doivent par contre être dégagées de manière inductive par une approche "bottom-up", c.-à-d. en accumulant le plus grand nombre de résultats locaux possible.

C'est le principe de base d'utiliser exclusivement des données géoréférenciables et de ne présupposer aucune macro-région, à part celle de la Convention alpine à laquelle toutes localités considérées doivent appartenir. Les données complémentaires qui fournissent des informations actuelles ou historiques sur l'organisation sociale des habitants et/ou sur le développement des infrastructures de base et sur la gestion de l'espace peuvent contribuer au profilage de la région alpine comme espace culturel. Eu égard à la reconstruction historique de l'espace culturel alpin il est désirable de comparer des régions de persistance archéologique à des zones de vestiges linguistiques et de visualiser cette comparaison de manière quantitative sous forme d'une cartographie qui combine la stratigraphie linguistiques et ethnographqiue; cf. à ce sujet du point de vue archéologique en général Häuber/Schütz 2004a et plus spécifiquement l'atlas des strates urbaines de Cologne (cf. Häuber/Schütz/Spiegel 1999 et Häuber u.a. 2004).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Archivage de longue durée  (Citer)

Toutes les données du projet VerbaAlpina sont gérées de telle sorte qu'elles restent lisibles et utilisables pendant une période la plus longue possible. La perspective temporale envisagée du projet comprend au moins plusieurs décennies, le concept sur lequel le projet est basé est en fin de compte pourtant orienté sur une conservation sans limitation de durée. Les aspects suivants sont pris en considération : 1. A quelle institution/à quelles institutions est confiée la conservation des données respectivement des supports d'information en question? 2. Documentation de la structuration des données ainsi que des relations logiques entre données et catégories de données (entité-association) 3. Documentation des codages de caractère utilisés4. Sur quel type de support d'information sont conservées les données?ad 1) Plusieurs copies des données du projet devront être archivées chez plusieurs institutions différentes. Actuellement, l'IT-Gruppe Geisteswissenschaften de la LMU (c'est-à-dire le groupe de technologie de l'information des sciences humaines de l'Université de Munich,  ITG) è prévu pour ce devoir. Ce groupe è lié aux serveurs d'archivage du Leibniz-Rechenzentrum ainsi qu'au BAS Clarin Repository. La mise en dépôt de copies de sûreté supplémentaires chez d'autres institutions qui y sont aptes est prévue.L'archivage a lieu au rythme de la gestion de versions. Chaque fois, la base de données est archivée avec toutes les données du projet ainsi que le framework d'application web qui est responsable pour la présentation des données au web (y inclus la respective fonctionnalité) de telle façon qu'il est possible (au moins théoriquement) de "réveiller de nouveau" chaque version isolément dans les correspondants environnements de système d'exploitation respectivement de logiciel émulés.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Atlas linguistiques des Alpes  (Citer)

Les atlas linguistiques suivants envisagent la zone alpine:
  • Romania alpina: ALF, AIS, ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
  • Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAÖ;
  • Slavia alpina: SLA.
Le grand numéro d'atlas ne doit quand même pas dissimuler les divergences considérables, en partie tout à fait inattendues entre les différents atlas. Ce sont juste certains atlas régionaux, comme par ex. l'ALD-II ou le BSA, qui ne s'intéressent pas particulièrement aux données ethnolinguistiques. L'alpage – qui représente un système économique fondamental de la région alpine – n'est presque pas du tout thème de discussion. Dans l'ALD-II, certes il y a (à la différence du BSA) un stimulus 869 l'alpeggio 'Alm'/ la baita 'Sennhütte'. Mais des concepts fondamentaux du traitement de lait comme VACHER (ita. casaro, caciaio), TRAIRE (ita. mungere), PRÉSURE (ita. caglio), ÉCRÉMER (ita. scremare) et de l'élevage de bétail comme ÉTABLE (ita. stalla), BERGER (ita pastore), PÂTURAGE (ita. pascolo) etc. manquent (cf. le questionnaire.



(auct. Thomas Krefeld – trad. Thomas Krefeld | Susanne Oberholzer)

Tags: Linguistique



Beta code  (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) qui a développé le concept correspondant au début des années soixante-dix pour la saisie électronique de textes en grec ancien avec des moyens de technique informatique d'alors, la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est désigné "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Tout d'abord, on distingue les caractères de bases des diacritiques lors de la transmission de la transcription phonétique utilisée dans l'atlas linguistique selon Böhmer-Ascoli dans des séquences composées par des caractères ASCII. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté par lui-même lors de la transmission (ce qui est entièrement le cas dans l'exemple présenté). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII spécial. L'affectation des diacritiques à des caractères ASCII est claire dans VerbaAlpina et elle est documentée dans des tableaux de la base de données VerbaAlpina. Le choix de l'affectation est guidé par le principe de la ressemblance optique autant que possible. Ainsi dans l'exemple mentionné, la coche sous l'u dans la parole tu est rendue par une parenthèse ouvrante: tu(. Les diacritiques sont écrits en partant des leur disposition près le caractère de base dans l'ordre de bas en haut et de gauche à droite après le caractère de base. En raison du principe de la ressemblance optique l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d.: même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche est rendue malgré tout en les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques pour chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d.: le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a un nombre d'avantages:
- la saisie des données peut être fait sur des claviers standard traditionnels à relativement grande vitesse et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissances de systèmes de transcription phonétique;
- n'importe quel caractère respectivement diacritique peut être saisi, indépendamment s'il est codé dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque n'importe quel autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent se passer éventuellement; celles-ci sont pourtant crées par l'essence des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée qui n'est pas prévue dans le système API.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Cadre onomasiologique  (Citer)





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Carte synoptique  (Citer)

Cette fonction permet à l'utilisateur de choisir un certain nombre de cartes seules disponibles selon ses propres intérêts et de les fixer dans des cartes combinées synoptiques. De cette manière on peut visualiser les zones de diffusion de n'importe quelle caractéristique linguistique et extralinguistique en relation. En même temps, on a la possibilité de fixer ces cartes synoptiques en niveaux de zoom différents si un contexte local, comme par ex. le massif des Karwendel ou le continuum dialectal occitan-franco-provençal-piémontais des Alpes occidentales, doit être manifesté.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Cartographie  (Citer)

La cartographie est un instrument de la géolinguistique qui peut-être n'est pas sans contredit, mais bien éprouvée car elle sert au même titre à la documentation et à la visualisation des relations spatiales (cf. les contributions dans Lameli 2010). Il y a deux techniques traditionelles qui se distinguent nettement par leur précision. Dans le cas de cartes 'analytiques', des énonciations linguistiques (partielles) sont rendues de telle façon que la documentation est mise en relief tandis que l'interprétation des relations spatiales doit être faite par l'utilisateur. Dans le cas des cartes synthétiques, les relations spatiales entre les foemes énonccée sont exprimées directement par la symbolisation. Les cartes quantitatives sont nécessairement synthétiques. La cartographie en ligne propose une combinaison des deux procédures en présentant à première vue des cartes 'synthétiques', mais en offrant aussi l'accès aux énonciations (partielles) avec un clic sur le symbole.
Le potentiel heuristique de ce type de cartographie est considérable : on offre à l'utilisateur de VerbaAlpina l'option de combiner et cumuler des classes de données différentes soit d'une seule catégorie (par ex. plusieurs types de base), soit de plusieurs catégories (par ex. des données linguistiques et extralinguistiques) au moyen des cartes synoptiques.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web Contexte extralinguistique



Communication scientifique au web  (Citer)

VerbaAlpina peut être décrit comme environnement de recherche sur le web et sensible à l'espace. Ce format est déterminé par les conditions générales actuelles qui se distinguent considérablement de la communication scientifique traditionnelle. En toutes les disciplines qui travaillent de manière 'classique' avec des données empiriques, on peut distinguer trois phases successives:
  1. Le scientifique cherche des informateurs.
  2. Les informateurs fournissent des données primaires au scientifique.
  3. Le scientifique fait passer une certaine quantité des données relevées qui ont été sélectionnées et modelées selon des hypothèses théoriques à un public essentiellement scientifique.
La communication en ces trois phases se déroule de manière unidirectionnelle et vise à une publication conclue en forme de livres imprimés.

Les trois pas de la communication scientifique traditionnelle

Les nouveaux médias ont révolutionné les conditions générales pour la communication scientifique: l'unidirectionalité ébauchée de la circulation de l'information est tout aussi abolie que l'attachement du rôle (INFORMATEUR, AUTEUR, LECTEUR) à des personnes différentes; de principe, la même personne peut participer à la communication dans des fonctions rapidement changeantes. La fonction INFORMATEUR est fondamentalement changée compte tenu des personnes communicantes car la gestion des données fournies reste transparente et peut être suivie de façon continue. L'INFORMATEUR devient comme ça LECTEUR de ses propres DONNÉES – tout indépendamment s'il comprend l'intention scientifique ou pas. En même temps, il lui est possible de prendre position sur ses propres données comme AUTEUR. Le statut des données mêmes se change au moins aussi radicalement dans ces conditions car elles sont déposées dans une base de données fondamentalement dynamique dont le volume et la structure restent soumis à des changements.


Communication scientifique dans les conditions de l'Internet

Dans ce sens, des domaines de fonction différents, mais étroitement liés entre eux sont établis en VerbaAlpina.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Concept  (Citer)

Le domaine des concepts (ou de l'onomasiologie) est varié; trois domaines thématiques sont prédéfinies :
- la vie quotidienne traditionnelle
- l'environnement naturel
- la vie quotidienne moderne
Ces domaines n'ont pourtant pas de pertinence pour l'organisation des données sur le niveau de la base de données. Sur ce niveau, ce sont plutôt les champs conceptuels spécifiques qui sont pertinents, comme par exemple l'alpage dans la vie quotidienne traditionnelle. Tout d'abord, des catégories de la vie quotidienne se laissent saisir par des concepts de degré d'abstraction resp. de spécification très différent ainsi que des hiérarchies taxonomiques en résultent. Entre les concepts qui sont sur des niveaux hiérarchiques différents, il y a des
(1) Relations d'inclusion
rigoureuses. Les relations d'inclusion raccordent des hyperonymes et des hyponymes de telle manière que chaque définition d'un hyponyme contient son hyperonyme et le spécifie. Pour cela un exemple d'une catégorie conceptuelle:
  • hyperonyme : BÂTIMENT
  • hyponyme de premier niveau : CHALET, ÉTABLE, CAVE DE FROMAGE etc.
  • hyponyme de deuxième niveau: CHALET DE PIERRE, CHALET DE BOIS, CHALET DE BOIS AVEC FONDATIONS DE PIERRE etc.
Chaque chalet etc. est aussi un bâtiment, mais l'inverse n'est pas valable. Le concept inclus est plus abstrait et sur ce point supérieur dans la représentation en forme d'arbre (graphe).

Entre les concepts qui sont sur le même niveau hiérarchique existent par contre toujours des
(2) Relations d'exclusion
Un chalet n'est ni une étable ni une cave de fromage.

Par contre, la hiérarchie qui résulte des concepts complémentaires qui forment une relation de fonction complexe qui doit aussi être comprise comme concept est complètement différente. Ici on parle de
(3) Relations tout/partie
Il y a des sections différentes qui appartiennent au champs de l'ALPAGE (tout): le TERRAIN, le BÉTAIL, le PERSONNEL et les ACTIVITÉS, spécialement le TRAITEMENT DU LAIT (parties).





Les relations tout/partie sont d'un côté hiérarchiques (comme les relations d'inclusion), mais de l'autre côté elles ne reposent pas sur l'inclusion définitoire, mais sur l'exclusion. Le schéma du champs ALPAGE montre un exemple d'une telle classification conceptuelle.





Dans le domaine des sections on peut reconnaître encore une fois un tout et ses parties constitutives. Comme ça, des ACTIVITÉS, PROCESSUS, OUTILS, RÉCIPIENTS, PERSONNES et BÂTIMENTS (parties) différents appartiennent à la PRODUCTION DU FROMAGE (tout). Les relations ébauchées entre les concepts se reflètent dans la signification de leur désignation linguistique (sémantique) et aussi dans les changements de signification : les désignations d'hyponymes peuvent être transmises à des hyperonymes et inversement. Également les transmissions de désignation peuvent se passer entre des concepts qui s'excluent, mais qui vont ensemble (métonymie) ou pour des relations tout/partie (méronymie). Les concepts qui sont liés au type de base malg- dans des variétés romanes différentes ne représentent un cas exemplaire.





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Concession d'une licence  (Citer)

Les modules de VerbaAlpina (VA_DB, VA_WEB et VA_MT) et les données y contenues sont soumis aux licences Creative Commens suivantes:




CC BY-SA 3.0 DE (http://creativecommons.org/licenses/by-sa/3.0/fr/; "Attribution, Partage dans les Mêmes Conditions") (dépendant de l'objet) respectivement




CC BY-NC-SA 3.0 DE (http://creativecommons.org/licenses/by-nc-sa/3.0/fr/; "Attribution, Pas d'Utilisation Commerciale, Partage dans les Mêmes Conditions").

Quelques-uns des fichiers média du module VA_MT que VA ha reçus ou achetés peuvent aussi être soumis au copyright. Les objets dans le module VA_MT sont marqués chaque fois par des signes correspondants.

Le système de concession d'une licence ainsi que les droits d'accès des groupes d'utilisateurs de VA différents sont démontrés dans le graphique suivant:





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Page Web



Contact linguistique  (Citer)

Concernant le contact linguistique dont le contact des variétés linguistiques fait aussi partie, on doit différencier deux modèles radicalement différents: ou il s'agit d'intégrats stables, indépendents du locuteur ('emprunts') – sur le niveau du système linguistique – ou bien il s'âgit de phénomènes individuels – sur le niveau du locuteur. Ces derniers, d'autre part, peuvent correspondre à des emplois habitualisés ou complètement occasionnels, dits switchings. Cette réserve doit être considérée toujours aussi quand on interprète des vieux matériaux des atlas, dès qu'un informateur exprime une forme proche au standard ou, dans des régions bilingues, une forme de la langue seconde respective. La différence thèoriquement fondamentale est plus ou moins probable face aux données linguistiques, pourtant, en fait, jamais évidente. Seulement l'accroissement des informateurs qui devient un'option absolument réaliste avec les médias sociaux permet des informations fiables.



(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Continuité  (Citer)

Il est extrêmement important de considérer la question de la continuité de tradition en reconstituant les espaces de communication plurilingues; elle doit être travaillée de manière pluridisciplinaire dans le sens d'une procédure dirigée par les données, inductive. On peut pourtant difficilement attendre des réponses pour ce qui concerne les substrats préromains même si on réunit des forces de plusieurs disciplines. Tant mieux est la situation de départ eu égard au substrat romain des régions germaniques et slaves. Le changement de langue du roman à l'allemand constitue tout simplement une constante historique qu'on peut observer même aujourd'hui aux Grisons. #Karte der Germanisierungsphasen des ganzen Alpengebiets?# Le processus a commencé déjà avec l'effondrement de l'infrastructure romane (en 476); la période qui le suit immédiatement est très intéressante pour la histoire linguistique, elle est pourtant très mal documentée par écrit de sorte que la coopération avec d'autres matières historiques, spécialement avec l'archéologie, est indispensable. Il est vrai qu'il y a encore de grandes lacunes de recherche, mais avec Weindauer 2014 une mise à jour des sources archéologiques et onomastiques (du 6ème au 8ème siècle) de la Haute Bavière, de la région de Salzbourg et de la Vallée de l'Inn tyrolienne est disponible. Il en ressort qu'on peut exclure "eine längere, grundlegende Siedlungsunterbrechung zwischen Römer- und Bajuwarenzeit" (traduction: une interruption d'habitat plus longue et fondamentale entre l'époque romaine et l'époque des Bavarii) parce que tout plaide en faveur d'un "fließenden Übergang der Besiedlungsstruktur von der Spätantike zum Frühmittelalter" (traduction: transition graduelle de la structure de population de l'Antiquité tardive au haut Moyen Âge) (Weindauer 2014, 248). Néanmoins une différence graduelle entre les régions mentionnées eu égard à la consolidation scientifique: "Was bezüglich des Zusammenhangs spätantiker und frühmittelalterlicher Fundstellen für das oberbayerische Alpenvorland noch überwiegend theoretisch galt {...}, findet in den österreichischen Gebieten seine nachweisliche Bestätigung: Die frühmittelalterlichen Ortsgründungen des 6. Jhs. orientieren sich fast ausschließlich an spätrömischer Infrastruktur bzw. – soweit noch vorhanden – an der romanischen Siedlungsstruktur" (traduction: ce qui était valable encore dans l'ensemble de manière théorique eu égard au rapport entre les lieux de la découverte de l'Antiquité tardive et du haut Moyen Âge pour les Préalpes de la Haute Bavière {...}, est avéré dans les régions autrichiennes: les fondations de lieu du haut Moyen Âge du 6ème siècle s'orientent presque exclusivement à l'infrastructure de l'antiquité tardive respectivement – dans la mesure où elles sont encore existantes – à la structure d'habitat romaine) (Weindauer 2014, 257).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Coopération  (Citer)

La coopération avec d'autres projets est fondamentale pour la conception de VerbaAlpina. Elle se reflète dans de nombreux contrats de coopération avec des partenaires de projet. Son application n'est pourtant pas toujours facile; elle est gênée par des problèmes pratiques, c.-à-d. des problèmes dus aux techniques de l'information et corrélativement des problèmes relatifs au droit. Marginalement, l'application est aussi gênée par des réserves idéologiques à l'égard de l'orientation open source. Chaque coopération est basée sur un accord formel qui assure les partenaires (PVA) d'une base de données exclusivement utilisable à la télétransmission. Chaque base de données de partenaire est à la disposition de tous les partenaires pour le téléchargement. Mais la coopération ne doit bien évidemment pas être limitée à l'échange des données; au contraire, tous les partenaires sont invités (et incités) à utiliser tous les domaines de fonction.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Crowdsourcing  (Citer)

Bien qu'il y ait déjà beaucoup de données linguistiques en ce qui concerne les domaines qui seront enquêtés de VerbaAlpina (surtout dans les atlas et dictionnaires), on prévoit de relever de nouvelles données. Ainsi (1) on nivellera les inconsistances entre les sources déjà existantes, (2) on éliminera des lacunes et imprécisions et (3) on marquera si les dénominations ou les outils sont de type traditionnel et désuet. Les nouvelles enquêtes ne seront pas faites en utilisant la méthode classique de l'analyse scientifique sur place, mais avec des moyens qui nous sont offerts par les médias sociaux. Des procédures pareilles sont souvent subsumées sous l'expression crowdsourcing. Le renvoi à la crowd est ambigu sous beaucoup d'aspects aussi parce que la crowd est associée pour beaucoup de gens au choix arbitraire, à l'absence de professionnalisme et à la fiabilité insuffisante; cette méfiance n'est pas complètement injustifiée parce que de telles méthodes s'adressent effectivement à une foule indéfinie et anonyme de personnes potentiellement intéressées. Des problèmes fondamentaux se créent non seulement pour le fournisseur du projet scientifique, mais encore pour le destinataire (profane ou non) : l'offre doit être suffisamment 'visible' et intéressante et le destinataire doit avoir une compétence pratique et linguistique suffisante. Il y a des stratégies différentes de gérer ces défis. On peut essayer de rendre l'offre attrayante par des aspects ludiques en concevant une interface web qui ressemble à un jeu. Le groupement de projet play4science a expérimenté des offres pareilles. Après ces expériences, pourtant, il semble plus prometteur de faire comprendre à l'informateur, dans le cas de VerbaAlpina au locuteur, qu'il peut contribuer essentiellement et directement à la recherche par son savoir spécifique et linguistique personnel (cf. la liste des projets citizen science). La compétence des informateurs peut être évaluée par des questions de savoir spécifiques, mais il est sans doute plus digne de foi de se faire confirmer et valider les données fournies par d'autres locuteurs des mêmes localités.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Description de concept  (Citer)

Les concepts sont saisis dans le tableau KONZEPTE (concepts) de la base de données comme suit : au cas où une dénomination lexicalisée existe pour un concept, cette dénomination vient inscrit dans la case de la base de données 'Name_F' (dénomination française). Quand la lexicalisation manque, la case reste blanche. Indépendamment de l'existence d'une dénomination, le concept est spécifié ou bien défini dans la case 'Beschreibung_F' (description française). Cela se fait en suivant une manière de procéder fixée qui est démontrée à l'aide de l'exemple du concept 'ÉCRÉMOIR' (ID_Konzept 142; identifiant du concept dans la base de données): le concept mentionné est désigné par un lexème spécifique, c’est pourquoi on inscrit ÉCRÉMOIR dans 'Name_F'. La description prévoit l'ordre hiérarchique suivant: ustensile, fonction, matériau, forme (éventuellement). Appliqué au concept de l'exemple, il en résulte la description suivante: USTENSILE, POUR ÉCRÉMER, LOUCHE. Si possible respectivement nécessaire on devrait suivre ces règles supplémentaires: les nombres 1-10 sont écrits en toutes lettres; dans la description d'un processus, d'une activité etc. on peut ou utiliser "pour+infinitif" ou "pour+article+substantif". L'observation de ces modèles permet des traductions analogues, la formation de catégories indépendantes de langues particulières à des niveaux différents d'abstraction (->RÉCIPIENTS ->RÉCIPIENTS POUR LE TRANSPORT ->RÉCIPIENTS DE BOIS etc.), des corrections automatisées respectivement des modifications et une recherche transparente. Tous les concepts sont saisis de cette manière dans les langues allemande, italienne, française, slovène et romanche.

(auct. Giorgia Grimaldi | Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Désignation  (Citer)

Par 'désignation' VerbaAlpina entend l'instance idéalisée d'un mot écrit, parlé ou pensé qui nomment un ou plusieurs concepts et qui renvoie peut-être à des choses concrètes. A la place d'un seul mot une séquence spécifique de plusieurs mots peut assumer ces fonctions (les polylexèmes). Au égard à la catégorie 'concept' il y a une relation m:n, en termes d'informatique: une désignation polysémique peut désigner plusieurs concepts, à l'envers, un concept peut être désigné par une multitude de désignations synonymes.





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Documentation  (Citer)

VerbaAlpina documente la variation dialectale dans un espace défini ethnographiquement. Le cadre onomasiologique est jalonné par des techniques culturelles et des modes de vie qui ont eu le statut de conventions dans des conditions d'environnement spécifiques, aussi indépendantes de culture. Tels espaces pour lesquels les Alpes représentent un prototype, n'ont pas pu être compris par les traditions de recherche linguistiques, parce que les disciplines partielles qui s'occupent systématiquement de la constitution d'espaces – donc la géographie linguistique, resp. la dialectologie ou aussi la géolinguistique – s'orientent presque sans aucune exception à des confins politiques et/ou linguistiques tracés. On arrive certainement à comprendre l'orientation spatiale des études centrales et à maints égards toujours déterminantes (cf. par ex. l'AIS et le FEW), mais on n'est souvent pas du même avis. Juste les régions culturelles plurilingues qui sont particulièrement fascinantes, comme par ex. la région entre la côté adriatique monténégrine-albanaise et le Danube, ne sont pas prises en considération de la recherche établie qui est orientée par des présuppositions philologiques pensées nationalement. L'Atlante linguistico mediterraneo qui a été planifié de manière ambitieuse aurait pu devenir un grand projet novateur, il n'a pourtant jamais dépassé la phase initiale.
VerbaAlpina vise la région alpine.



(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Données complémentaires  (Citer)

Pour une approche inductive à l'espace culturel les données démographiques et institutionnelles sont de principe intéressantes si elles se révèlent être géoréférenciables. A ce type de données appartiennent les informations qui concernent l'histoire d'habitat, en particulier celles qui regardent l'appartenance à des institutions écclésiastiques ou de l'Etat. Mais aussi des voies de communication, en particulier les cols de montagne, sont extrêmement importantes (vgl.). Des données écologiques et géophysicales sont importantes au moment où elles sont en rapport avec l'histoire de l'habitat. Cela est le cas par exemple des zones de végétation qui permettent ou exigent certaines utilisations (par ex. l'alpage suppose des altitudes au-dessus de la limite des forêts et des arbres (http://www.slf.ch/forschung_entwicklung/gebirgsoekosystem/themen/baumgrenze/index_FR).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Données d'entrée  (Citer)

Dans VerbaAlpina on utilise exclusivement des données qui sont géoréférenciées au moins sur le territoire d'une commune, mais si possible encore plus précisément (comme par ex. les photos d'alpages). À l'égard des données linguistiques qui sont particulièrement importantes, on doit distinguer deux types: d'un côté, les données qui remontent directement aux énoncés des informateurs individuels – comme par exemple les attestations de quelques atlas linguistiques (spécialement les atlas romans) ou aussi de la Bayerische Dialektdatenbank (BayDat); ces énoncés sont décomposés en leurs éléments constitutifs, les tokens. De l'autre côté, certains atlas, comme par exemple le SDS ou aussi le VALTS, ainsi que tous les dictionnaires ne contiennent pas d'énoncés de locuteur, mais des formes qui ont déjà été réduites à types par les éditeurs de sorte qu'il n'est pas possible de remonter jusqu'aux tokens.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Entité-association  (Citer)

De principe, des données peuvent être réunies dans des groupes appelés "entités". Il s'agit de classes de données qui présentent une certaine nature et un certain nombre de caractéristiques spécifiques. Comme ça, les villes de Trento, d'Innsbruck et de Lucerne peuvent former une classe "lieux" à laquelle appartiennent les caractéristiques "nom de lieu", "degré de longitude", "degré de latitude", "Etat" e "nombre d'habitants". Les membres individuels d'une classe pareille diffèrent par les valeurs différentes des caractéristiques qui forment cette classe.Dans une base de données relationnelle chaque entité est sauvegardée dans un tableau particulier. Les colonnes de ces tableaux comprennent les valeurs d'une spécifique caractéristique. Les lignes comprennent les membres individuels d'une classe de données (entité), ces membres se distinguent par les valeurs de la caractéristique. Dans presque tous les cas – aussi chez VerbaAlpina – une base de données relationnelle représente une collection d'entités différentes (et par conséquent de tableaux) entres lesquelles il y a des relations logiques. Comme ça, l'entité "informateur" qui est définie par les caractéristiques "âge", "sexe", "lieu de naissance" et "domicile" est liée logiquement à l'entité "lieux" de telle manière que les valeurs des caractéristiques "lieu de naissance" et "domicile" ont des points communs dans l'entité "lieux". Les relations entre les membres de ces deux entités résultent des correspondances des valeurs d'une ou de plusieurs caractéristiques (essentiellement congruentes) de l'entité correspondante. Dans ce cas, il en pourrait résulter théoriquement une affectation entre des valeurs identiques des caractéristiques "lieu de naissance" et "nom de lieu" par laquelle on pourrait affecter indirectement à l'informateur les coordonnées géographiques de son lieu de naissance. Il est évident que dans cet exemple on peut être confronté à des problèmes dus à homonymes. Pour éviter des problèmes de ce genre, il est habituel d'utiliser des entiers relatifs comme identifiants (abréviation: "ID") qui définissent de façon univoque les membres d'une entité.Le système décrit des entités et de leur relations logiques s'appelle "entité-association". Les données recueillies dans une base de données relationnelle sont difficilement intelligibles et utilisables sans une explication des dépendances qui y existent. L'entité-association est représentée normalement en forme d'un schèma graphique. L'entité-association est soumise à des adaptations continues et par conséquent à des modifications pendant les phases de développement cycliques de VerbaAlpina (cf. gestion de versions). On ajoute à chaque version archivée de VerbaAlpina le modèle entité-association de la version de la base de données qui y forme la base en forme de graphique en format JPG.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Environnement de recherche  (Citer)

Les tâches et les prestations de VerbaAlpina peuvent être classées aux domaines suivants :
(1) documentation et analyse diachronique du vocabulaire dialectal qui est estimé caractéristique conformément au cadre onomasiologique ;
(2) coopération avec les partenaires de projet pour l'échange mutuel et l'analyse des données ;
(3) des données, de textes analytiques et de matériau différent concernant le projet, visant un public aussi bien scientifique que général.
Les fonctions (1), (2) et (3) ont déjà été activées avec la première version 15/1 et seront consolidées de façon continue. Deux autres fonctions sont en préparation :
(4) enquête des données par le crowdsourcing ;
(5) l'installation d'un laboratoire de recherche qui invite tous les utilisateurs intéressés à se servir de façon personnalisée des outils géolinguistiques développés par VerbaAlpina (des présentations cartographiques différentes, des niveaux de réduction à types différents etc.) et à présenter des analyses et résultats nouveaux et peut-être même alternatifs.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Domaines de fonction



Ethnolinguistique  (Citer)

"On ne peut pas faire l'histoire des mots sans faire l'histoire des choses" (Jaberg 1936, 23).
Dans la tradition de recherche des langues romanes, mais surtout de la langue italienne la dialectologie a été depuis le début, c.-à-d. en Italie au moins depuis Giuseppe Pitré, très étroitement liée aux sciences sociales, plus précisément à la sociologie et à l'ethnologie. Dans cette perspective, toute la géolinguistique peut être comprise comme matière partielle d'une 'ethnoscience' générique. Cette expression qui est utilisée ici comme traduction d'ita. etnoscienza (de l'angl. ethnoscience), ne s'est toutefois établie ni en Italie ni en Allemagne. Dans le Manuale di etnoscienza très sagace et informatif de Giorgio Raimondo Cardona (Cardona 1995) on peut lire le suivant:

"[...] il prefissoide etno- permette un'immediata 'etnologizzazione' di qualunque sottodisciplina [...]. L'inglese offre ancora un altro tipo di formazione, quella con folk- (folk-taxonomy), che ha però lo svantaggio di non essere atrettanto facilmente esportabile quanto il suo concorrente grecizzante.
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 f.; gras par ThK)

L'etnoscienza si ébauchée est désignée aussi comme cultural anthropology dans la tradition des États-Univs d'Amérique. De plus, dans les pays germanophones, on a distingué la Volkskunde pour l'exploration de culture(s) indigène(s) de la Völkerkunde pour l'exploration de cultures étrangères, spécialement pas européennes. Actuellement, on parle au lieu de cela le plus souvent généralement d'Ethnologie (fr. ethnologie) avec le domaine spécial de lethnologie européenne (au sens de la Volkskunde). C'est pourquoi la désignation ethnolinguistique n'est pas claire parce qu'elle est souvent limitée à l'exploration linguistique de cultures non européennes (cf. Senft 2003) bien qu'elle ne devrait pas exclure les européennes. La séparation catégorique se révèle de plus en plus vaine face aux flux migratoires massifs et vastes.

Un flou dans le passage cité de Cardona doit encore être résolu; il concerne le 'préfixoide' ethno- qui est d'un côté synonyme de l'angl. folk et de l'autre est utilisé en faisant référence à etnia. Par folk (en folk-taxonomy etc.) on renvoie à des savoirs et conventions relatifs à la culture du quotidien des non spécialistes ou bien non scientifiques et c'est à ce sens qu'aussi ethnie (ou bien ethno-) devrait faire référence à des communautés de culture de vie quotidienne sans pourtant impliquer des idées idéalisées de homogénéité, arcaïcité, fermeture sociale etc.. La distinction de Cardona (a vs. b) renvoie de plus à deux perspectives de recherche complémentaires dans les sciences sociales et culturelles.

En résumé on peut désigner la recherche dialectologie au sens de Cardona (aussi à posteriori) comme 'ethnolinguistique' si elle relève et analyse ses données linguistiques en rapport étroit à la vie quotidienne des locuteurs. Dans la tradition de la linguistique romane, cette orientation a été établie de façon prototypique par le Sprach- und Sachatlas Italiens und der Südschweiz (AIS); elle marque sans doute la plus grande différence et le plus grand progrès à l'égard de l'ALF, comme Karl Jaberg fait observer avec une certaine emphase. Le passage instructif relatif à l'histoire de la discipline. Il mérite d'être mis en valeur parce qu'il montre comment les auteurs de l'AIS se positionnaient eux-mêmes:

"L'importance des «choses» n'a pas échappé à l'esprit de Gilliéron [...] Que Gilliéron ait complètement négligé ce point de vue dans la conception de l'Atlas et qu'il n'en ait tenu compte qu'en passant dans ses autres publications, c'est un fait d'autant plus étrange qu'il connaissait fort bien les «choses» et s'y intéressait passionnément. A-t-il approuvé l'enseignement que Ferdinand de Saussure a tiré de ses incursions dans les domaines limitrophes de notre science, à savoir que la «linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même», principe qui, malgré l'admiration que j'ai pour le grandsavant genevois, m'a toujours semblé singulièrement rétrécir le champ d'action du linguiste." (Jaberg 1936, 27 f.)

Jaberg attire explicitement et à juste titre l'attention sur le fait que le structuralisme saussurien garde juste sur ce point précis des idées des néogrammairiens. Du point de vue de la géolinguistique contemporaine la tentative de regarder la langue come un 'module' qui peut être isolé n'était donc absolument pas perçue comme un paradigme nouveau , mais tout simplement comme traditionaliste:

"La conception du Petit Atlas phonétique du Valais roman [également de Gilliéron; Th.K.] et celle de l'Atlas linguistique de la France remontent à une époque qui était encore sous l'empire des néogrammairiens, et on sait ce que les néogrammairiens doivent aux sciences naturelles. Ce n'est certes pas un hasard que le Cours de linguistique générale s'en ressente également. M. Jud et moi, nous avions pas ces attaches avec les néogrammairiens, Gilliéron lui-même nous avait aidés à les rompre. Nous étions en revanche fortement impressionnés par les brillants articles de Meringer et de Schuchardt. La réalité des choses était autours de nous. Nous avions nous-mêmes parcouru les pays romans ; nous avions recueilli sur le terrain des observations ethnographiques et folkloriques. Comment en rester aux mots? Tout en sauvegardant le caractère essentiellement linguistique de notre ouvrage, nous croyions devoir fournir à l'historien des mots les données nécessaires pour se faire une idée des choses, afin qu'il ne bâtisse pas dans le vide." (Jaberg 1936, 28).


L'étude de Hugo Plomteux 1980 sur la Cultura contadina in Liguria, qui est née par l'observation participative, est innovatrice pour la tradition ethnolinguistiquement orientée de la dialectologie italienne. La région qui est bien ethnolinguistiquement très bien analysée – en comparaison des autres régions peut-être même la région la mieux analysée – est la Sicile. Ce sont surtout Fanciullo 1983 et plusieurs études importantes qui ont été faites dans le cadre de l'Atlante linguistico della Sicilia qui doivent être mentionnés à cette occasion. Les œuvres suivantes offrent des renseignements sur les techniques et traditions culturelles chaque fois étudiées: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 et Castiglione 1999.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Etymologie  (Citer)

Pour dégager les strates linguistiques, la stratigraphie demande l'etymologisation. Le commentaire étymologique part du type de base et poursuit un but triple :
- déterminer la langue d'origine de la base lexématique ;
- justifier l'union de tous les types unis au même type de base; pour faire cela, on recourt aux régularités de la phonétique historique et à la plausibilité sémantique des relations conceptuelles sont sous-jacentes ;
- reconstruire les trajets des emprunts si le type de base est répandu dans plusieurs régions linguistiques; dès que la langue de l'étymon d'un côté et de l'informateur de l'autre ne sont pas conformes, on constate automatiquement contact linguistique.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Familles linguistiques dans les Alpes  (Citer)

Au territoire de la Convention alpine et ainsi dans la région étudiée de VerbaAlpina, des langues de trois familles linguistiques sont traditionnellement parlées. Toutes les trois sont représentées par des continua dialectaux. Le degré de différenciation de ces continua dépend manifestement aussi de l'étendue de leurs zones de diffusion. La fragmentation de la zone romane est plus grande de celle de la zone germanique et celle-ci est encore une fois plus grande de celle slave; les atlas linguistiques correspondants informent de la situation dialectale. Dans VerbaAlpina, les lieux de l'enquête des atlas différentes sont noués entre eux et il en résulte un réseau étendu plurilingue. Au niveau des langues nationales supérieures ou bien des langues des langues de minorité qui sont régionalement implémentées seulement la Romania alpina est structurée de plus. En plus du français et de l'italien, d'autres langues sont reconnues officiellement come langues nationales ou langues de minorité, ce sont le romanche en Suisse et l'occitan, l'arpitan (ou francoprovençal) reconnu officiellement dans la Vallée d'Aoste, le ladin et le frioulan en Italie. Dans la Slavia alpina e dans la Germania alpina, il existe une langue standard respectivement: le slovène et l'allemand. Eu égard à la langue pluricentrique allemand, on doit différencier au moins trois variétés standard nationales coexistantes en Suisse, en Allemagne et en Autriche.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géolinguistique analogique  (Citer)

Les dimensions du savoir qui font partie de l'horizon épistémique de VerbaAlpina, c.-à-d. les CHOSES, les CONCEPTS et les MOTS, sont en général unis de manière très étroite et souvent complètement indéfinie dans la présentation analogue pratiquée par la géolinguistique traditionnelle. La carte AIS 1192a LA CASCINA DI MONTAGNA en est un cas exemplaire. Le titre de la carte a tout d'abord le statut d'un concept, assavoir le bâtiment, "wo ein gut ausgebildeter Käser ('Senn') mit Hilfspersonal die Milch sachgemäss zu Käse, Butter, Zieger verarbeitet" (traduction: où un fromager qualifié transforme le lait en fromage, beurre, sérac de manière adéquate avec du personnel auxiliaire). En plus, on apprend qu'il s'agit d'un hyperonyme car quelques chalets servent en même temps de dépôt pour le lait et le fromage alors que dans d'autres cas il y a des caves spéciales pour le lait et le fromage qui encore peuvent être ou contiguës à un édifice ou particulières et à travers lesquelles souvent un cours d'eau s'écoule. En outre, on doit distinguer la "meist massive steinerne Sennhütte" (traduction: le chalet massif le plus souvent en pierre) de ceux-ci en bois etc. En d'autres termes: il y a toute une typologie de concepts subalternes et plus spécifiques sans qu'il soit toujours clair en détail quel chalet est entendu par le mot attesté sur la carte. Le concept dans le titre de la carte est donc souvent trop peu spécifié et l'existence d'autres désignations pour des chalets plus spécifiques ne peut pas être exclue pour aucune localité; les dictionnaires de dialecte confirment cette impression très constamment. En même temps, deux autres concepts qui ne sont pas d'hyponymes de CHALET entrent en jeu: CAVE POUR LE LAIT et CAVE POUR LE FROMAGE. En outre, dans la même légende on fait référence à la présence fréquente de bâtiments où on loge des animaux, y compris ceux pour les cochons, donc un troisième concept encore. Des désignations pour ces autres concepts ne sont pas citées dans la carte topographique, mais en marge en forme de listes qui montrent le plus souvent seulement des attestations pour peu de localités. En même temps il arrive souvent que des mots polysémiques apparaissent sur les listes qui désignent de tout autres concepts dans les localités particulières. A ce sujet on regarde le type kort qui est attesté dans la liste qui se réfère au concept BATÎMENT ALPIN OÙ ON LOGE DES ANIMAUX pour les localités AIS 107 et 109 bien qu'il désigne tout autre concept dans une des deux attestations (point 109), et ce LIEU DE GÎTE ET DE TRAITE POUR LE BÉTAIL PRÈS LE CHALET.




Les inconsistances de ce type doivent absolument être dissipées quand on enregistre des données numériquement; c'est une exigence essentielle de distinguer et séparer strictement les dimensions épistémiques mentionnées, pour ainsi dire la déconstruction systématique des informations offertes. 





Ceci fait, les catégories consistantes permettent de consulter et de visualiser  toutes les informations disponibles à partir de la base de données, dans n'importe quelle combinaison.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géolinguistique plurilingue  (Citer)

C'est un des objectifs de ce portail de faire ressortir la force façonnante du contact linguistique et spécialement son conditionnement ethnolinguistique au cours de l'histoire de l'espace linguistique alpin. La conception de la base de données permettra de représenter les emprunts saisis aussi quantitativement dans leur accumulation locale parce qu'ils résultent automatiquement quand l'appartenance d'un informateur à une des trois familles linguistiques ne correspond pas à celle de l'étymon. Ce sont trois familles linguistiques qui forment la région alpine moderne sous forme de continua dialectaux avec une extension et une différenciation complètement diverses. Les zones de diffusion de ces trois familles linguistiques ne coincident d'ailleurs pas avec les territoires des États politiques. Le germanique est représenté par des variétés alémaniques et bavaroises qui peuvent être attribuées à la langue allemande pluricentrique. Toutefois la référence commune aux variétés standard suisse, allemande et autrichienne qui ne fonde que l'affiliation à la même communauté linguistique n'existe plus en fait dans certaines enclaves linguistiques walser et anciennes bavaroises (cimbres).
Les variétés du continuum roman peuvent être attribuées – à l'inverse des régions germaniques – à plusieurs langues; en plus du français et de l'italien il s'agit conformément à la reconnaissance politique en Suisse et en Italie de l'occitan, du franco-provençal, du romanche, du ladin et du frioulan.
Le slave est représenté par des dialectes slovènes qui sont parlés sauf en Slovénie aussi dans plusieurs communes italiennes et autrichiennes. Ce n'est pourtant pas l'objectif de VerbaAlpina de décrire le plus complètement possible les dialectes de la région alpine, de faire ressortir les frontières des dialectes locaux ou régionaux et de représenter l'espace en quelque sorte comme mosaïque de variétés. Grâce à la conception géolinguistique du projet, il s'agit plutôt de faire apparaître ces caractéristiques (surtout lexicales) qui sont répandues au-delà des frontières de certains dialectes ou de langues particulières et qui démontrent ainsi la trame ethnolinguistique commune .





Vu que les dialectes constituent des systèmes linguistiques complets en eux-mêmes, et qu'ils représentent trois continua 'génétiquement' différents on peut prétendre que le projet affronte le contact linguistique dans la perspective d'une géolinguistique plurlingue.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géoréférencement  (Citer)

Le géoréférencement en employant les degrés de latitude et de longitude est un critère de classement essentiel pour la gestion des données de VerbaAlpina. La précision de ce référencement varie selon le type de données; on aspire un référencement le plus exact possible, au mètre près. Au cas des données linguistiques des atlas et des dictionnaires, c'est seulement un référencement approximatif conformément à un toponyme qui est possbile en règle générale. Au cas de données archéologiques par contre, des géoréférencements au mètre près sont possibles. On peut sauvegarder des points, des lignes (commes des rues, des rivières) et des surfaces. Sous l'angle technique, le format WKT (https://en.wikipedia.org/wiki/Well-known_text) est principalement utilisé, celui-ci est transféré à un format MySQL spécifique dans la base de données VA par la fonction geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html et est sauvegardé ainsi. La sortie au format WKT se produit par la fonction MySQL astext().
La grille de référence du géoréférencement est le réseau des communes dans la région alpine qui peuvent être sorties ou comme surfaces ou comme points, suivant les besoins. Les tracés des frontières de commune du 2014 que VerbaAlpina a reçus de son partenaire "Conférence Alpine" en forment la base. Une actualisation permanente de ces données qui changent tout à fait plus souvent à cause des réformes administratives pas rares est superflue car il s'agit seulement d'un cadre de référence géographique dans la perspective de VerbaAlpina. Une représentation de la grille des communes est déduite de façon algorithmique des frontières de commune et est donc secondaire.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information Contexte extralinguistique



Gestion de versions  (Citer)

VerbaAlpina consiste des modules suivants :

-VA_DB: ensemble des données dans la base de données du projet (MySQL) (va_xxx)
-VA_WEB: code de programme de l'interface web du portail www.verba-alpina.gwi.uni-muenchen.de avec la base de données Wordpress (va_wp) correspondante
-VA_MT: fichiers média (photos, films, textes et documents audio) qui se trouvent dans la médiathèque de l'interface web

Tous les trois modules forment un ensemble consistant avec des connections et dépendances mutuelles et par conséquent ils ne peuvent pas être séparés l'un de l'autre. Pendant la durée du projet le statut actuel des modules VA_DB et VA_WEB est simultanément "congelé" à intervalles réguliers sous forme de copies électroniques. Ces copies congelées reçoivent un numéro de version selon le schéma [année civile]/[numéro de série] (par ex. 15/1). La version VA actuelle et productrice reçoit la désignation XXX.

La production de copies de la médiathèque VA (VA_MT) est exclue à cause de la dimension énorme de fichiers média. Pour cette raison, on ne produit pas de copie de ce module au cours du processus de gestion de versions. Des éléments qui y ont été déposés une fois ne peuvent plus être enlevés de la médiathèque VA dès qu'une seule version VA y est associée.

Le portail du projet offre la possibilité de changer entre les versions différentes, c'est-à-dire entra la version VA "productrice" qui est soumise à des changements permanents et les versions archivées, "congelées". Par la teinte du fond respectivement de certains éléments de commande, l'utilisateur peut reconnaître s'il se trouve dans la version productrice ou dans une des versions archivées de VA. *Seulement* les versions archivées doivent être citées.



Photos de couverture des versions précédentes de VerbaAlpina:

15/1

15/2

16/1

16/2

17/1

17/2

18/1

18/2

19/1



(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Horizon épistémique  (Citer)

Ce portail informe à trois dimensions différentes:

(1) de la realité extralinguistique ('choses'),
(2) de concepts, ou: de catégories onomasiologiques qui ne sont pas liées à des langues ou dialectes particuliers,
(3) d'expressions linguistiques des langues et des dialectes enquêtés.

Le traitement séparé de (2) et (3) est fondamental parce que les concepts pertinents ne sont pas toujours documentés dans toute la région de l'enquête par des termes spécifiques (ils ne sont donc pas tous lexicalisés). De la façon, il n'y a pas de parole pour le fromage produit du petit-lait (cf. além. Ziger, ital. ricotta, fr. sérac) dans une grande partie de la région bavaroise, alors que pour la masse de fromage fraîche pas encore modelée (bav. Topfen, alem. Quark), il manque souvent un terme dans les dialectes romans comme une désignation n'existe pas non plus en italien standard. La relation entre (1) d'un côté et (2) et (3) de l'autre côté est parfois plus problématique que cela semble à première vue: comme ça, on est confronté quelquefois à des expressions de statut sémiotique ambigu parce qu'il ne ressort pas des données s'il s'agit de désignations de concepts ou plutôt de noms de choses; c'est le cas par ex. si un locuteur appelle un certain alpage, par exemple cet alpage-là qu'il utilise lui-même, avec un nom générique comme munt, littéralement 'montagne', ou pastüra 'pâturage'.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Humanités numériques  (Citer)

Le projet VerbaAlpina était destiné d'emblée à être implémentées par les navigateurs web car il veut contribuer de manière décisive au transfert des traditions établies des sciences humaines, plus précisément de la géolinguistique, aux humanités numériques, angl. digital humanities.
Voici ce que cela signifie :
(1) La base empirique de la recherche consiste en données (cf. Schöch 2013), c.-à-d. en unités digitalement codifiées et structurées ou au moins structurables ; il s'agit de données en partie déjà publiées et numérisées beaucoup plus tard, dans le cadre de ce projet même (comme par ex. les matériaux des atlas plus vieux), mais en partie aussi de données originales à relever encore. Dans les domaines conceptuels pertinents on aspire à bancariser une quantité de donnée consistante. La méthode est donc quantitative et largement inductive.
(2) La communication scientiifique se sert des conditions médiatiques de l'internet. Cela offre tout d'abord la possibilité de tresser hypertextuellement des média différents (écriture, image, vidéo, audio) ; de plus, les chercheurs, les partenaires de coopération et/ou les informateurs peuvent communiquer et coopérer les uns avec les autres de façon continue.
(3) En procédant de cette façon, cette plate-forme scientifique et collaborative offre aux chercheurs la possibilité de participer activement à son développement. Cette perspective est utile et productive à au moins deux égards : elle permet d'engager des sièges différentes et surtout de promouvoir la combinaison constructive de technologie de l'information et géographie linguistique avec des ressources publiques sans devoir recourir au service d'assistance de sociétés d'informatique privées (service d'assistance qui peut créer des problèmes juridiques et économiques).
(4) Le savoir qui est pertinent pour le projet pourra être accumulé et modifié de façon continue pendant longtemps bien que la garantie d'une disponibilité permanente ne puisse pas encore être offerte du point de vue technique (cf. sur ce point l'infrastructure scientifique CLARIN-D , page Web disponible seulement en allemand et en anglais). Sous cet angle, ce n'est plus une requête principale de publier les résultats du projet en forme de support d'information matériel (livres, CD, DVD). Néanmoins une option secondaire d'imprimer sera installée, une option qui est offerte parfois aussi par la lexicographie en ligne, comme le fait le Tesoro della Lingua Italiana delle Origini de façon exemplaire.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Technologie de l'information



Informateur  (Citer)

L'expression informateur est d'ordre technique dans VerbaAlpina parce qu'elle comprend deux choses différentes suivant la source: dans les atlas toutes les données linguistiques sont en général transparentes jusqu'au locuteur lui-même; dans la basede données, les informateurs sont identifiables par un numéro individuel. Ils sont de plus chronoréférencés par l'année de l'enquête et géoréférencés par le lieu de l'enquête. Dans les dictionnaires géoréférénciables par contre, il est normalement impossible d'identifier des locuteurs concrets. Par des raisons techniques dues à la base de données un informateur fictif est attribué à chaque source de ce genre. Chaque informateur est ensuite attribué à famille linguistique et cette attribution est transmise automatiquement à toutes les données fournies de cet informateur.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Langue  (Citer)

L'interface de ce portail sera disponible en plusieurs langues standard, à savoir (par ordre alphabétique) en allemand, en anglais, en français, en italien, en romanche (rumantsch grischun) et en slovène. Dans le cas de l'allemand, il y aura des variantes standard suisses ou autrichiennes dans les textes suivant l'auteur. Indépendamment de la langue choisie, l'utilisateur a toujours accès à tous les matériaux linguistiques en tous les dialectes et en toutes les langues relevés.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Lexique alpin  (Citer)

Des choses réales typiquement alpines (comme le CHAMOIS, le CEMBROT DES ALPES ou l'ALPAGE) sont souvent désignées par des mots de substrat préromains. C'était bien Jakob Jud 1911 qui a décrit le premier cette strate linguistique plus en détail; elle forme le fond du lexique alpin. Toutefois, l'expression n'est pas complètement univoque parce qu'elle a un sens plus vaste tant chez Otto von Greyerz 1933 qui l'a probablement forgée, que chez Johannes [Bibl:Hubschmid 1951]] qui l'a surtout rendue publique: "Ich verstehe darunter Wörter, die Geländeformationen, Naturerscheinungen, Tiere und Pflanzen oder mit der menschlichen Tätigkeit zusammenhängende konkrete Begriffe bezeichnen, Wörter, die sich nur oder hauptsächlich in den Alpenmundarten erhalten haben, oder die zwar auf einem größeren Gebiet leben, aber in den Alpen häufig eine speziell 'alpine' Bedeutung zeigen. Alpenwörter können auch germanischen oder romanischen Ursprungs sein" (Hubschmid 1951, 7; traduction: "Par lexique alpin, j'entends des mots qui désignent des formations de terrain, des phénomènes de nature, des animaux et des plantes ou des termes concrets qui sont en rapport avec l'activité humaine, des mots qui se sont maintenus seulement ou surtout dans les dialectes alpins ou qui certes existent dans une région plus vaste, mais qui montrent souvent un sens spécialement 'alpin' dans les Alpes. Le lexique alpin peut aussi être d'origine germanique ou romane.") (Cf. pour l'histoire du terme depuis peu aussi Rampl 2011, 131ss.)

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Manière de citer  (Citer)

On recommande la manière de citer suivante aux utilisateurs de VerbaAlpina pour citer les données linguistiques mises à la disposition:

  • Note de VerbaAlpina dans une bibliographie
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de,[version].

La mention de la data du dernier accès n'est pas nécessaire parce que les versions de citation (à la différence de la version de travail XXX) sont stables et ne peuvent plus être changées (cf. Gestion de versions.

Exemple:
VerbaAlpina (VA), http://www.verba-alpina.gwi.uni-muenchen.de, 15/1.

  • Citation d'une entrée de glossaire:
[Auteur/s]: s.v. “[Lemme]”, en: VA-[sigle de langue d'après ISO 639-1] [version], Méthodologie , [URL de l'entrée de glossaire].

Exemple:
Krefeld, T. / Lücke, S. / Oberholzer, S.: s.v. “Tipizzazione”, in: VA-it 15/1, Metodologia, http://www.verba-alpina.gwi.uni-muenchen.de/it/?page_id=21&letter=T#tipizzazione.

Comme auteur, on doit toujours mentionner les personnes citées sous l'entrée de glossaire.

  • Citation d'une attestation seule:
[citation]|[catégorie]|[lieu]|[sigle de la source]#[référence]|VA_[version]

Exemples:
Hütte|Type morphologique|Herisau|SDS#VII_244_1|VA_15/1
Chääsera|Type phonétique|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1
Käserei|Type de base|Hinteres_Diemtigtal|SDS#VII_244_1|VA_15/1

Remarque 1: Le caractère de séparation pipe (barre verticale/tube) | peut être obtenu en appuyant la touche Alt Gr + la touche 6 si on utilise un ordinateur avec le système d'exploitation Windows. Sur les ordinateurs d'Apple, il faut appuyer la combinaison de touches suivante: Alt + Maj + L.
Remarque 2: Les abbréviations suivantes selon ISO 639-1 sont à utiliser: pour l'allemand de, pour le français fr, pour l'italien it, pour le romanche rm, pour le slovène sl.

(auct. Stephan Lücke | Susanne Oberholzer – trad. Susanne Oberholzer)

Tags: Page Web



Modélisation des données  (Citer)

voir Modèle relationnel.

Tags: Linguistique Technologie de l'information



Modules  (Citer)

voir gestion de versions

Tags: Technologie de l'information



Notation  (Citer)

Dans les contributions de texte, les principes de notation suivants, très communs sont utilisés : les formes linguistiques (exemples d'attestations) sont écrites en italique ; la signification est marquée par des guillemets simples, par ex. ita formaggio 'fromage'. Des catégories extralinguistiques (concepts) sont représentées par des majuscules. La différence entre sens linguistique et concept est importante dans les cas où il n'y a pas de parole dans certaines langues/dialectes pour certains concepts, comme dans le cas de FROMAGE DU LIQUIDE APRÈS LA PREMIÈRE COAGULATION DE LA PÂTE. On appelle cela ita ricotta, fra sérac, alémanique Ziger etc.; un mot en allemand standard manque pourtant.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web



Numérisation  (Citer)

Dans le contexte de VerbaAlpina, par numérisation on ne comprend pas l'emploi simple d'ordinateurs pour le traitement électronique des données, mais essentiellement l'exploitation digitale en profondeur par la *structuration* et la catégorisation systématiques et transparentes.



Dans le projet, on utilise presque esclusivement le modèle relationnel dans lequel les données sont organisées strictement en forme de tableau. Les tableaux se composent de lignes (= enregistrements, tuple) et de colonnes (= attributs, cases, propriétés); chaque tableau peut être élargi dans chaque direction en ajoutant des lignes et des colonnes. Entre les tableaux, il y a des relations logiques qui permettent des associations sensées et des représentations synoptiques correspondantes (dites "joins") de deux ou plusieurs tableaux. Pour la gestion des tableaux VerbaAlpina utilise actuellement le système de gestion de base de données MySQL. Les tableaux ne sont pourtant pas liés à ce système, mais peuvent être exportés à tout moment, par ex. en forme de texte avec des délimiteurs univoquement définissables pour les limites de case et d'enregistrement (dits séparateurs) avec les noms de colonne et la documentation des relations logiques (modèle entité-association). Sur le plan opérationnel de VerbaAlpina, on ne se sert pas de la structure XML qui est actuellement souvent utilisée dans d'autres domaines. Dans le cadre de la conception d'interface, XML est pourtant compris comme format d'exportation.

Au-delà de la structuration logique des données, c'est le codage des caractères qui joue un rôle important dans le contexte du mot-clé "numérisation". Ce domaine est de la plus grande importance juste en vue de l'archivage de longue durée des données et doit être géré de manière prévoyante. Autant que possible, VerbaAlpina s'oriente au tableau de codage et aux prescriptions du Consortium Unicode dans ce contexte. Au cas où la numérisation concerne des caractères qui ne sont pas encore accueillis dans le tableau Unicode, la saisie digitale de données d'un caractère isolé se fait de préférence en sérialisant le caractère en forme d'un ordre de caractères du bloc Unicode x21 jusqu'à x7E (à l'intérieur du bloc ASCII). Les affectations correspondantes sont témoignées dans des tableaux spéciaux par quoi une future conversion dans des valeurs Unicode qui seront possiblement existantes à ce moment-là sera toujours possible.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Page de code  (Citer)

VerbaAlpina réunit des données de différents genres de sources: des données d'atlas linguistiques et de dictionnaires imprimés qui doivent tout d'abord être numérisés aussi que des données qui existent déjà en forme électronique d'un nombre de projets partenaire. Chaque de ces sources différentes utilise des systèmes plus ou moins individuelles pour la transcription. Pour réaliser l'uniformisation nécessaire on a besoin de listes dans lesquelles est fixé quel caractère dans le système de transcription d'une source a quelle correspondance dans le système de transcription d'une autre source. Il s'agit surtout de représenter les systèmes de transcription différents sur l'Alphabet phonétique international (API) qui fait office de transcription de référence dans VerbaAlpina. Pour transférer le système de transcription spécifique à une source au système API on doit créer une liste complète en forme de tableau avec les correspondances de caractère. Un tableau pareil est nommé "page de code". Ci-après un extrait de la page de code qui est fondamental pour la conversion du système de transcription de l'AIS à l'API. En tout, cette page de code comprend en gros 4500 lignes/affectations:


La colonne `BETA` comprend les caractères utilisés dans l'AIS en forme transcrite selon le principe du beta code; la colonne `IPA` le caractère API correspondant et la colonne `HEX` la valeur ou les valeurs du tableau Unicode qui correspond(ent) au caractère API.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Photographies  (Citer)

La médiathèque de VerbaAlpina contient une collection riche et variée de photographies géoréférencées qui s'accroît continuellement. Ces photographies remplissent une fonction double: d'un côté, elles renvoient à des référents concrets avec toutes leurs particularités idiosyncratiques qui sont surtout très prononcées concernant les bâtiments. De l'autre côté, les photographies doivent illustrer un concept d'une manière la plus parlante possible et devenir ainsi la base pour l'enquête d'autres désignations pour le concept. L'objectif de cette fonction n'est donc pas celle de reconnaître le référent spécifique, donc un chalet particulier. Cela serait même plutôt gênant car dans ce cas les informateurs ont la tendance d'indiquer le nom propre de l'alpage et pas les désignations du concept. Ce risque est pourtant calculable: un malentendu fondamental résulte en principe seulement des situations où les informateurs reconnaissent des personnes connues. Dans ce cas, les caractéristiques individuelles catalyse toute l'attention de l'observateur à tel point que la personne représentée est appelée spontanément et involontairement par son nom ("mais c'est le Willi!") – et pas par la fonction qu’elle exerce sur la photographie (VACHER). A proprement parler, l'emploi de dessins idéalisés à la place de photographies d'objets concrets serait plus adéquat pour l'enquête de désignations. Cela échoue pourtant à cause de l'absence de modèles correspondants. Toutes les illustrations de référents sont associées aux catégories "concept" et "désignation" par la base de données.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Profil de similarité ethnolinguistique  (Citer)

Du point de vue ethnolinguistique de ce projet, se sont les types de base qui fondent l'espace alpin plurilingue. Au sens d'une représentation synthétique, il est prévu d'offrir deux fonctions de cartographie quantitatives différentes:
  1. Tout d'abord on vise le lexique alpin dont l'ensemble forme pour ainsi dire un type idéal fictif auquel les dialectes locaux s'approchent plus ou moins. La cartographie d'une similarité graduelle qui a été inspirée par la représentation du champ gradient de la gasconité à l'ALG 6 y correspond.
  2. Ensuite on cartographie (selon le modèle de l'ASD) la similarité relative de tous les lieux d'enquête entre eux en comparant et en visualisant les types de base que n'importe quel lieu d'enquête et n'importe quel autre lieu comme point de référence ont en commun.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Public  (Citer)

La publication directe des résultats, indépendante de maisons d'édition est un composant intégral de VerbaAlpina. Car pas tout qui s'appelle publication sert à la PUBLICATION. Ainsi, le médium traditionnel de l'impression provoque maintenant le contraire catégorique: il retire des informations au public qui devraient lui être offertes le plus largement possible face à la subvention de recherche par des moyens publics et qui pourraient lui être fournies très facilement en utilisant les nouveaux médias. Les tirages de papier de 200 ou 300 exemplaires qui sont usuels dans les sciences ne créent pas de 'public' inclusive, mais une sphère privée exclusive. Face à la technologie de l'information facilement disponible, il n'y a donc aucune raison concluante de préférer l'impression comme moyen de diffusion du savoir ou de la considérer comme solution catégorique.
Dans certaines sciences (à notre connaissance cela s'applique entre autres à l'informatique), on peut même observer une tendance ces dernières années qui prouve l'absurdité des possibilités techniques crées par les nouveaux médias: alors qu'il serait un jeu d'enfant à présent d'accorder un accès commode à des informations et des textes dans le monde entier, c'est le pur contraire qui arrive en offrant l'accès seulement contre paiement. C'est même une régression par rapport à la publication traditionnelle sur papier que nous avons critiquée avant. Nous tenons donc à souligner nos mises en garde appuyées quant à tels développements qui peuvent aussi déjà être observés dans les grandes lignes dans les sciences humaines.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Page Web



Réduction à types  (Citer)

La réduction à types des données géoréférenciées fait partie des exigences fondamentales de VerbaAlpina. Où possible, dans une première étape des tokens ('mots individuels') sont extraits des données d'entrée après la transcription et sont inscrits dans la case de base de données du même nom.

Le point de mire de VerbaAlpina est la réduction à types morphologique des matériaux linguistiques rassemblés. Un type morphologique est défini par l'unanimité des propriétés suivantes: famille linguistique – partie du discours – mot simple versus mot affixé – genre – type de base lexical. La forme indiquée du type morphologique s'oriente aux lemmes correspondants de certains dictionnaires sélectionnés (voir ci-dessous).

Par l'attribution à un type de base lexical commun, l'union de tous les types morpho-lexical associés devient claire – même par-dessus des frontières linguistiques. Ainsi les noms et verbes suivants (qui ne sont pas décrits en détail ici) peuvent être attribués à un seul type de base malga (ALPAGE, TROUPEAU), malgaro (VACHER), malghese (BERGER), immalgare (ENALPER), dismalgare (DÉSALPER). Toutefois, le type de base lexical en dit peu rien sur l'histoire de parole d'un seul type morpho-lexical: on doit faire ressortir chaque fois séparément si un type avec étymon latin-roman qui aujourd'hui est attesté dans la région linguistique germanique ou slave, comme par exemple slovène baita 'maison simple', remonte à substrat local ancien ou bien à contact linguistique roman plus récent. Pour cette raison, la désignation "étymon" qui fait de principe référence au stade historique immédiatement préliminaire d'une parole est évitée dans ce contexte, même si le type de base lexical correspond en beaucoup de cas à l'étymon d'un type morpho-lexical.

Les types morpho-lexicaux forment la catégorie directrice dans la gestion des données linguistiques; ils sont comparables aux lemmes de la lexicographie. Au moyen des critères susnommés robustes et bien mesurables on peut réduire par ex. les quatre types phonétiques barga, bark, margun, bargun avec le sens CHALET DE MONTAGNE, ÉTABLE D'ALPAGE à trois types morphologiques.

L'appartenance des types morpho-lexicaux à des familles linguistiques (germ., rom., slav.) dépend de la source correspondante; elle résulte dans le cas des données d'enquêtes traditionnelles d'atlas ou de dictionnaires automatiquement des informateurs correspondants et est notée corrélativement dans la banque de données. Dans le cas des données que VerbaAlpina même relève par crowdsourcing l'appartenance linguistique ou bien dialectale est prétendue par les informateurs et est confirmée quantitativement dans le meilleur des cas. Le nombre d'informateurs confirmants devient ainsi un instrument de la validation de données.

Des types morpho-lexicaux sont limités à une famille linguistique. La question qui se pose avec cela est la suivante: par quelle forme un type morpho-lexical devrait être représenté dans la zone de recherche de la carte interactive? Eu égard à la famille linguistique germanique et slave la réponse est plutôt facile parce que les deux sont représentées chacune par une seule langue standardisée ('Deutsch' [deu] respectivement 'Slowenisch' [slo]). Les types morpho-lexicaux peuvent être rendus sous la forme de leur variantes standard, évidemment à condition que des correspondances de ce type existent dans la langue standard. Ainsi, par exemple, tous les types phonétiques correspondants de l'alémanique et du bavarois qui sont des variantes de la forme standard 'fromage' peuvent être appelées par cette forme standard. Si des variantes standard n'existent pas, on prend les lemmes des grands dictionnaires de références (Idiotikon, WBÖ) à titre d'exemple.

Au cas de la famille linguistique romane la situation est beaucoup plus complexe à cause des nombreuses langues petites qui ne sont pas assez standardisées. Par des raisons pragmatiques on a choisi la solution suivante: tous les types morpho-lexicaux sont représentés par les formes standard françaises et italiennes, si existantes. Ainsi tous les types phonétiques qui sont variantes de par ex. beurre/burro peuvent être appelées par ces deux formes. Les dictionnaires TLF et Treccani font office de dictionnaires de références. Si seulement une de ces deux langues standard présente une variante convenable, c'est celle-ci qui apparaît, comme dans le cas de ricotta (l'appartenance à l'italien est signalée par la convention de notation -/ricotta). S'il n'y a aucune variante du type dans les deux langues de références romanes, on recourt à l'entrée d'un dictionnaire de références dialectal, comme par ex. le LSI. Au cas où il n'existe aucune entrée dans les dictionnaires dialectaux, VerbaAlpina propose un type de base qui est représenté graphiquement par le sigle 'VA'.

Il est prévu aussi la réduction à types phonétiques des matériaux linguistiques ; cette étape de travail est pourtant secondaire est n'est pas faite de façon cohérente. La catégorie correspondante est indispensable surtout à cause des atlas linguistiques et des dictionnaires qui documentent parfois exclusivement (par ex. SDS, VALTS) des types phonétiques. Lors de la réduction à types phonétiques faite par VerbaAlpina, les tokens sont classés selon les critères de la phonétique historique dans des types phonétiques (case de base de données 'phon_typ'); une automatisation de la réduction à types phonétiques sur la base d'algorithme Levenshtein et soundex sera examinée et, si possible, appliquée.

Par la réduction à types (constitution de classes) la diversité de données devient plus claire; il est valable en règle générale: nombre des tokens > nombre des types phonétiques > nombre des types morpho-lexicaux > type de base. On note le cas extrême d'une seule attestation (hapax): l'attestation correspond à un token, un type phonétique et un type morpho-lexical comme seul représentant d'un type de base. Il est éventuellement raisonnable de filtrer ces formes d’hapax de la représentation.

(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Région étudiée  (Citer)

"Une historie globale et cohérente des Alpes n'est pas encore réalisable à l'heure actuelle" (http://www.hls-dhs-dss.ch/textes/f/F8569.php), plutôt des définitions différentes, "naturräumliche" et "wirtschaftlich-politische" (traduction: définitions géophysiques et politico-économiques, cf. Bätzing 1997, 23 f.) sont en concurrence. Dans le sens d'une délimitation transparente et pragmatique, la région étudiée de ce projet correspond au domaine d'application clairement défini de la Convention alpine; on a été prêt à accepter les "Inkonsistenzen zwischen den Mitgliedstaaten" (traduction: les inconsistances entre les États membres, cf. Bätzing 1997, 31) y fixées. Elles concernent les Préalpes bavaroises (incluses), "grössere randalpine Gebiete wie das Emmental oder das Zürcher Oberland" (traduction: des zones plus grandes au bord des Alpes comme l'Emmental ou l'Oberland zurichois, (Bätzing 1997, 32), exclues) ainsi que le maniement de quelques villes plus importantes au bord des Alpes: Lucerne et Salzbourg y sont incluses, Graz et Biella sont par contre exclues. Le périmètre de la Convention alpine peut être téléchargé ici. Le but d'origine du projet est pourtant de recenser les Alpes dans ce cadre formellement fixé comme espace linguistique-culturel et de représenter la similarité des lieux qui en font partie.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Représentation quantifiée  (Citer)

[Remarque préliminaire: l’article suivant est lié en partie aux fonctionnalités de VA_WEB qui sont encore actuellement en travaux et qui ne sont pas encore accessible au public actuellement.

La carte interactive de VerbaAlpina permet, à côté d’une cartographie qualitative, également une visualisation de données agrégées dans le sens d’une représentation quantifiable des données dans l’espace. L’agrégation s’oriente toujours à cet égard sur des régions géographiques. L’utilisateur a le choix entre une agrégation sur la base d’une surface communale (petit espace), les soit- disant régions NUTS-3 (espace moyen) et enfin les régions de diffusion des trois grandes familles linguistiques germano-roman-slave (grand espace). En outre, il y a la possibilité de définir à volonté les surfaces communales comme des régions individuelles qui ensuite fonctionnent inversement comme des valeurs de référence de l’agrégation. Une toute dernière option peut agir contre des effets déformants qui résultent dans la perspective d’une agrégation au-delà des surfaces administratives et ainsi dans la perspective de la linguistique des régions communales ou bien des régions NUTS-3. Dans des cas particuliers, cette procédure correspondante peut bien entendu n’être qu’heuristique, l’utilisateur a cependant la possibilité de sauvegarder les cohérences régionales qu’il aura découvertes comme étant éloquentes, de les commenter, de les réutiliser et de les mettre à disposition de la communauté.
En relation avec les régions choisies, respectivement avec les surfaces, l’ensemble des données qualitatives choisies jusqu’à l’activation de la représentation quantitative sont agrégées. Grandeur et rendu des couleurs de chaque symbole cartographique sont corrélés à cet égard avec le nombre des données qualitatives singulières focalisées sur un symbole à chaque fois. La valeur maximale fondée de manière arithmétique, par l’accès duquel un symbole contient toujours une grandeur maximale et un rendu des couleurs, correspond à cet égard de manière standard la quantité la plus grande en matière de données agrégées, qui apparaît dans l’une des surfaces, respectivement des régions choisies. Cette valeur de référence maximale peut être appliquée à souhait sur l’ensemble des données agrégées prise une par une, ce qui conduit à une modification de la représentation cartographique.
Lorsque la fonction quantification est activée, on peut extraire des données quantitatives, par désactivation de chaque entrée dans une liste dans la légende de la carte, les données qualitatives correspondantes ou bien ajouter d’autres données par un autre choix.
A côté de la quantification d’une carte géo-référencée qui reproduit les tracés frontaliers en temps réel, VerbaAlpina permet également la représentation de données quantifiées sur une carte dénommée « en alvéoles ». Son modèle est un dessin Wikipedia qui visualise les résultats des élections britanniques à la Chambre des Communes de 2015. Sur celle-ci, on a d’abord restitué fidèlement la carte en ses points, distances et angles (celle-ci désigne la « carte géographique ») avec les résultats des élections dans chaque circonscription. Au final, on y représente une carte en alvéoles sur laquelle chaque circonscription est figurée par un hexagone de grandeur identique.




Source : https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Source : https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (demandées le 03.11.2016)
La confrontation des deux types de cartes montre leurs avantages et inconvénients respectifs. La carte en alvéoles renvoie à des imprécisions géographiques, respectivement même à des informations erronées. On reconnaît ainsi par exemple dans le district Greater London une alvéole rouge isolée qui se trouve entourée d’alvéoles bleues imposantes – un fait anodin mais qui ne trouve pas de preuve sur la carte géographique. D’un autre côté, la carte en alvéoles possède l’avantage de mieux visualiser les relations réelles entre les chiffres, par chaque couleur, étant donné que, sur la carte géographique, une multitude de toute petites circonscriptions du point de vue de la surface sont perçues par l’observateur comme inférieurs, bien que leur importance politique est mise sur le même plan que celle des grands districts d’un point de vue de la surface. C’est ainsi que les deux types de cartes se complètent et leur véritable plus-value réside dans la possibilité de pouvoir consulter les deux cartes et de confronter leur visualisation.
La carte alvéolaire de VerbaAlpina se distingue du fait qu’elle représente l’ensemble des communes politiques de l’espace alpin par de grands hexagones de taille identique à chaque fois. A cet égard, on cherche, à peu près, à conserver au moins la logique géographique. Le calcul du rendu des couleurs des hexagones pris un par un s’ensuit de la même manière que sur la carte à points. L’avantage d’une telle carte alvéolaire consistant, contrairement à une simple coloration des surfaces communales, en une carte géo-référencée, est que les effets suggestifs sont mis au second plan par rapport aux grandeurs variables des surfaces communales.


(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Technologie de l'information Page Web



Rhéto-roman  (Citer)

Conforme à la Constitution fédérale de la Confédération suisse, l'expression allemande 'Rätoromanisch' (version française de la Constitution: 'romanche') est utilisée dans le projet VerbaAlpina pour les variétés romanes du Canton des Grisons qui traditionnellement ne font pas partie des variétés italiennes (cf. Gross 2004 et Liver 2010). En faisant ainsi, on n'affirme pourtant absolument pas l'union de ce romanche grison avec le ladin des Dolomites et le frioulan dans le sens d'une 'lange' commune; c'est justement pour ce concept (qui aujourd'hui n'est plus acceptable) que l'expression 'Rhéto-roman' a été forgé par la linguistique au 19ème siècle. Graziadio Isaia Ascoli a développé l'idée en tant que telle et a désigné cette langue comme 'ladino' en italien.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Statut d'auteur  (Citer)

Toutes les contributions écrites sur la page de VerbaAlpina sont marquées nommément. L'abréviation "auct." marque l'auteur/les auteurs d'une contribution, l'abréviation "trad." marque le(s) traducteur(s). Le software est développé essentiellement par Florian Zacherl, David Englmeier (à partir du 1/10/2016) et Filip Hristov (à partir du 1/10/2016).

(auct. Thomas Krefeld | Susanne Oberholzer – trad. Susanne Oberholzer)

Tags: Page Web



Stratigraphie  (Citer)

Les Alpes sont une région de contacts linguistiques variés depuis l'époque préhistorique. Ils remontent à des configurations stratigraphiques très différentes (cf. Krefeld 2003). En principe, les langues qui sont en contact dans une région parce qu'il y a des locuteurs ou même des communautés de locuteurs plus ou moins bilingues sont désignées adstrats. Si un type de contact est répandu seulement dans une certaine région, comme par exemple dans les Alpes, et si ce type ne se retrouve  pas ailleurs dans les familles linguistiques concernées, souvent ni la direction de l'emprunt, ni la langue d'origine ne sont claires (cf. le type de base rom. baita 'chalet de montagne' / ted. Beiz, Beisl 'buvette').
Si la langue d'origine de l'emprunt n'est plus parlée dans la région de diffusion ou dans une partie de elle-ci, on distingue deux configurations: dans le cas du substrat, la langue d'origine (la langue de substrat) était parlée dans la région de diffusion avant que la continuité de sa tradition orale ait été interrompu et la langue dominante se soit imposée; le roman est la langue de substrat pour toutes les parties de région alpine où parle actuellement allemand et slovène. Les mots de substrat se distinguent souvent par une continuité régionale ou locale extraordinaire; ils survivent donc le remplacement de leur langue originaire (la langue substratique) par les langues succédantes,  Dans le cas du superstrat, la langue d'origine dominait pendant une certaine période dans la région de diffusion sans s'y établir pourtant durablement. Comme ça, dans des parties de la région alpine où on parle aujourd'hui des les variétés romanes, des superstrats germaniques (le gotique, le lombard) prédominaient après l'effondrement de l'infrastructure romane; en Slovénie, l'allemand avait cette fonction de langue superstratique pendant la période des Habsbourg. Entre les trois familles linguistiques, des scénarios complètement différents se sont développés; eu égard à l'importance du contact linguistique pour l'histoire de l'espace linguistique c'est surtout la chronologie de l'emprunt qui compte : par exemple la question de savoir si les emprunts romans dans les régions germaniques et slaves représentent de mots de substrat avec une continuité orale régionale depuis l'Antiquité ou d'emprunts plus récents de type adstratique? La même question vaut mutatis mutandis pour les germanismes dans la région romane et les slavismes dans la région germanophone.



Les emprunts sont un indicateur fiable des divers processus d'acculturation historique; il méritent donc une analyse quantitative qui soit capable de documenter des effets d'accumulation locale.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Transcription  (Citer)

Les matériaux linguistiques sont rendus graphiquement de manière double pour satisfaire aux deux principes contraires de la fidélité à la source et de la comparabilité facile:

(1) Version d'entrée dans la transcription originale

Le portail de VerbaAlpina réunit des sources qui proviennent de traditions scientiques différentes (philologie romane, allemande et slave) et qui représentent différentes phases historiques de la recherche dialectologique. Quelques données lexicographiques ont été relevées au début du siècle dernier (GPSR) et d'autres il y a peu d'années (ALD) seulement. Pour cette raison, il est nécessaire du point de vue historique et épistémologique de respecter la transcription originale à quelques détails près. Par des raisons techniques, il est pourtant impossible de maintenir certaines conventions intégralement; cela est regarde en particulier les combinaisons verticales de caractère de base ('lettre') et signes diacritiques comme par exemple la superposition typographqiue d'un diacritique pour l'accent, d'un diacritque pour la durée, d'une voyelle et d'un diacritique pour la fermeture. Ces conventions sont transférées dans des séries linéaires de signes selon des transcriptions techniques définies pour chaque convention en utilisant exclusivement des caractères ASCII ("Beta code"). Jusqu'à un certain point on peut profiter des ressemblances graphiques intuitivement compréhensibles entre les diacritiques originaux et les pendants ASCII chosis pour l'encodage beta; ces ressemblances sont mnémoniquement favorables.

(2) Version de sortie en API

Pour satisfaire à la comparabilité et aussi à la convivialité, il est en plus souhaitable de rendre toutes les données également dans une transcription uniforme. C'est pourquoi tous les beta codes seront transférés dans des caractères API au moyen de routines de remplacement spécifiques. On n'est confronté qu'à peu de problèmes qui pourtant sont inévitables: c'est le cas si un caractère de base spécifié par des diacritiques dans la transcription d'entrée correspond à deux caractères de base différentes en API. Cela concerne surtout les degrés d'aperture des voyelles où par ex. deux caractères de base <i> e <e> combinés avec un point de fermeture et un ou deux crochets d'aperture permettent de représenter six degrés d'aperture dans la série palatale; dans l'encodage beta ce sont les suivants: i – i( – i((– e?-- e – e(– e((. Pour représenter cela, API n'offre que quatre caractères de base: i – ɪ – e – ɛ.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Uniform Resource Name (URN)  (Citer)

voir Digital Object Identifier

Tags: Technologie de l'information