Méthodologie

Tri

Montrer toutes les contributions

(no Tag)   Contexte extralinguistique   Domaines de fonction   Technologie de l'information   Linguistique   Page Web  


Approche inductive à l'espace culturel  (Citer)

Le projet se focalise sur les Alpes prises en tant que complexe d'espace culturel seulement, VerbaAlpina s'attendant à des techniques culturelles communes à toute la région alpine. En effet, on note une adaptation à des conditions de vie identiques, ou au moins très semblables, en haute montagne et une diffusion toute naturelle d'aptitudes et de traditions associées à ces conditions de vie communes. Ces points communs se manifestant clairement dans la langue par des désignations correspondantes, il ne convient pas de décrire la culture spécifiquement alpine dans une approche trop étroite de communautés linguistiques séparées, pour ainsi dire "top-down", c.-à-d. par une grille de points d'enquête dans des régions linguistiques ou dialectales fixées à priori; cela correspondrait aux intentions de la dialectologie, qui vise à la description la plus complète possible de régions isolées et idéalement de variétés particulières. Dans la perspective adoptée par le projet, celle d'une géolinguistique plurilingue allant au-delà des frontières linguistiques, les zones de diffusion de traditions culturelles et de leurs désignations doivent par contre être dégagées de manière inductive par une approche "bottom-up", c.-à-d. en accumulant le plus grand nombre de résultats locaux possibles.

Le principe de base consiste à utiliser exclusivement des données géoréférenciables et à ne présupposer aucune macro-région, à part celle de la Convention alpine à laquelle doivent appartenir toutes les localités prises en considération. Les données complémentaires, qui fournissent des informations actuelles ou historiques sur l'organisation sociale des habitants et/ou sur le développement des infrastructures de base et la gestion de l'espace, peuvent contribuer au profilage de la région alpine comme espace culturel. À l'égard de la reconstruction historique de l'espace culturel alpin, il est souhaitable de comparer les régions de persistance archéologique à des zones de vestiges linguistiques, et de visualiser cette comparaison de manière quantitative sous forme d'une cartographie combinant stratigraphie linguistique et ethnographique; cf. à ce sujet du point de vue archéologique en général Häuber/Schütz 2004a et plus spécifiquement l'atlas des strates urbaines de Cologne (cf. Häuber/Schütz/Spiegel 1999 et Häuber u.a. 2004).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Atlas linguistiques et dictionnaires des Alpes  (Citer)

Les atlas linguistiques suivants envisagent la zone alpine:
  • Romania alpina: ALF, AIS, ALI, ALP, ALJA, ALEPO, CLAPie, APV, ALAVAL, ALD-I, ALD-II, ASLEF;
  • Germania alpina: SDS, VALTS, BSA, SONT, TSA, SAÖ;
  • Slavia alpina: SLA.
Le grand nombre d'atlas ne doit pas dissimuler les divergences considérables, parfois tout à fait inattendues entre les différents atlas. Ce sont seulement certains atlas régionaux, comme par ex. l'ALD-II ou le BSA, qui ne s'intéressent pas particulièrement aux données ethnolinguistiques. L'alpage – qui représente un système économique fondamental de la région alpine – n'est presque pas du tout thème de discussion. Dans l'ALD-II, certes il y a (à la différence du BSA) un stimulus 869 l'alpeggio 'Alm'/ la baita 'Sennhütte'. Mais des concepts fondamentaux du traitement de lait, comme VACHER (ita. casaro, caciaio), TRAIRE (ita. mungere), PRÉSURE (ita. caglio), ÉCRÉMER (ita. scremare) et de l'élevage de bétail comme ÉTABLE (ita. stalla), BERGER (ita pastore), PÂTURAGE (ita. pascolo) etc. manquent (cf. le questionnaire.

De plus, il y a aussi beaucoup de dictionnaires concernant les idiomes de l'aire alpin. Les dictionnaires utilisés par VerbaAlpina son les suivants:
  • Romania alpina: DRG (Dicziunari Rumantsch Grischun), LSI (Lessico dialettale della Svizzera italiana), GPSR (Glossaire des patois de la Suisse romande), ALTR (Archivio lessicale dei dialetti trentini)
  • Germania alpina: Idiotikon (Schweizerisches Idiotikon), BWB (Bayerisches Wörterbuch), WBÖ (Wörterbuch der bairischen Mundarten in Österreich).






(auct. Beatrice Colcuc | Thomas Krefeld – trad. Beatrice Colcuc | Thomas Krefeld | Susanne Oberholzer)

Tags: Linguistique



Beta code  (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) (qui a développé au début des années soixante-dix, avec les moyens de technique informatique d'alors, un concept similaire pour la saisie électronique de textes en grec ancien), la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est appelée "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Pour permettre la retranscription en caractères ASCII des transcriptions phonétiques selon Böhmer-Ascoli utilisées dans les atlas, il faut tout d'abord distinguer caractères de base et diacritiques. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté tel quel lors de la transmission (ce cas se retrouve dans l'exemple). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII dédié. L'attribution des diacritiques à des caractères ASCII est sans équivoque au sein de VerbaAlpina et des tableaux dédiés de la base de données VerbaAlpina consignent le processus. Autant que possible, le choix de l'attribution est guidé par le principe de la ressemblance optique. Ainsi dans l'exemple mentionné, le point sous le e dans le mot tega est rendue par un point d`interrogation: te?. Les diacritiques sont retranscrits en partant de leur position par rapport au caractère de base dans l'ordre suivant : de bas en haut et de gauche à droite, après le caractère de base. En raison du principe de la ressemblance optique, l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d. que même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche sera rendue dans les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques à chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d. que le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a nombre d'avantages:
- la saisie des données peut être faite sur des claviers standard traditionnels, à relativement grande vitesse, et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissance des systèmes de transcription phonétique;
- n'importe quel caractère ou diacritique peut être saisi, qu'ils soit codés dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque tout autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent éventuellement se passer; mais c'est là le caractère même des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée, qui n'est pas prévue dans le système API.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Cadre onomasiologique  (Citer)





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Cartographie  (Citer)

La cartographie est un instrument de la géolinguistique, certes prêtant à discussion mais ayant aussi fait ses preuves : elle sert tout autant à la documentation qu'à la visualisation des relations spatiales (cf. les contributions dans Lameli 2010). Deux techniques traditionnelles de cartographie se distinguent nettement de par leur concision. Dans le cas de cartes 'analytiques', les énonciations linguistiques (partielles) sont rendues de telle façon que c'est la documentation qui est mise en relief, l'interprétation des relations spatiales devant, elle, être faite par l'utilisateur. Dans le cas de cartes 'synthétiques', les relations spatiales entre les phonèmes énoncés sont exprimées directement par la symbolisation. Les cartes quantitatives sont obligatoirement synthétiques. La cartographie en ligne propose une combinaison des deux procédures en présentant à première vue des cartes 'synthétiques', mais en offrant aussi l'accès aux énonciations (partielles) avec un clic sur le symbole.
Le potentiel heuristique de ce type de cartographie est considérable : on offre à l'utilisateur de VerbaAlpina l'option de combiner et cumuler des classes de données différentes, soit d'une seule catégorie (par ex. plusieurs types de base), soit de plusieurs catégories (par ex. des données linguistiques et extralinguistiques) au moyen des cartes synoptiques.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web Contexte extralinguistique



Concept  (Citer)

Le domaine des concepts (ou de l'onomasiologie) est varié. Trois domaines thématiques sont prédéfinis :
- la vie quotidienne traditionnelle
- l'environnement naturel
- la vie quotidienne moderne
Ces domaines n'ont pourtant pas de pertinence pour l'organisation des données au niveau de la base de données. A ce niveau, ce sont plutôt les champs conceptuels spécifiques qui sont pertinents, comme par exemple l'alpage dans la vie quotidienne traditionnelle. Tout d'abord, les catégories de la vie quotidienne se laissent saisir par des concepts de degré d'abstraction ou de spécification très différents ainsi que par les hiérarchies taxonomiques en résultent. Entre les concepts de niveaux hiérarchiques différents existent des :
(1) Relations d'inclusion
rigoureuses. Les relations d'inclusion raccordent des hyperonymes et des hyponymes de telle manière que chaque définition d'un hyponyme contient son hyperonyme et le spécifie. Pour cela un exemple d'une catégorie conceptuelle:
  • hyperonyme : BÂTIMENT
  • hyponyme de premier niveau : CHALET, ÉTABLE, CAVE DE FROMAGE etc.
  • hyponyme de deuxième niveau: CHALET DE PIERRE, CHALET DE BOIS, CHALET DE BOIS AVEC FONDATIONS DE PIERRE etc.
Chaque chalet etc. est aussi un bâtiment, mais l'inverse n'est pas valable. Le concept inclus est plus abstrait et sur ce point supérieur dans la représentation en forme d'arbre (graphe).

Entre les concepts qui sont sur le même niveau hiérarchique existent par contre toujours des
(2) Relations d'exclusion
Un chalet n'est ni une étable ni une cave de fromage.

Par contre, une hiérarchie très différente est celle résultant de concepts complémentaires, lesquels forment une relation de fonction complexe devant aussi être comprise comme concept. Ici on parle de
(3) Relations tout/partie
Il y a des sections différentes qui appartiennent au champs de l'ALPAGE (tout): le TERRAIN, le BÉTAIL, le PERSONNEL et les ACTIVITÉS, spécialement le TRAITEMENT DU LAIT (parties).





Les relations tout/partie sont d'un côté hiérarchiques (comme les relations d'inclusion), d'un autre côté elles ne reposent pas sur l'inclusion définitoire, mais sur l'exclusion. Le schéma du champs ALPAGE montre un exemple d'une telle classification conceptuelle.





Dans le domaine des sections on peut reconnaître encore une fois un tout et ses parties constitutives. Ainsi, les ACTIVITÉS, PROCESSUS, OUTILS, RÉCIPIENTS, PERSONNES et BÂTIMENTS (parties) différents appartiennent à la PRODUCTION DU FROMAGE (tout). Les relations ébauchées entre les concepts se reflètent dans la signification de leur désignation linguistique (sémantique) et aussi dans les changements de signification : les désignations d'hyponymes peuvent être transmises à des hyperonymes et inversement. De la même manière, des transmissions de désignation peuvent se passer entre des concepts qui s'excluent, mais qui vont ensemble (métonymie) ou pour des relations tout/partie (méronymie). Les concepts liés au type de base malg- dans des variétés romanes différentes ne représentent un cas exemplaire.





(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Contact linguistique  (Citer)

Concernant le contact linguistique – le contact des variétés linguistiques en fait aussi partie – on doit différencier deux modèles radicalement différents: ou bien il s'agit d'intégrats stables, indépendants du locuteur ('emprunts') – sur le niveau du système linguistique – ou bien il s'agit de phénomènes individuels – au niveau du locuteur. Ces derniers, d'autre part, peuvent correspondre à des emplois habituels ou alors complètement occasionnels, dits switchings. Cette réserve doit toujours être faite, même quand on interprète des matériaux issus d'atlas anciens et dès qu'un informateur exprime une forme proche du standard ou, dans les régions bilingues, une forme de la seconde langue. La différence, théoriquement fondamentale, est plus ou moins probable face aux données linguistiques, pourtant, elle n'est en fait jamais évidente. Seulement l'accroissement des informateurs, ce qui devient tout à fait réaliste grâce aux médias sociaux, promet des informations fiables dans ce domaine.



(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Continuité  (Citer)

Il est extrêmement important de prendre en compte la continuité de tradition lorsque l'on reconstitue des espaces de communication plurilingues; elle doit être travaillée de manière pluridisciplinaire dans le sens d'une procédure dirigée par les données, inductive. On peut difficilement s'attendre à trouver des réponses en ce qui concerne les substrats pré-romains, même en réunissant des forces de plusieurs disciplines. En revanche, la situation vis-à-vis du substrat romain dans les régions germaniques et slaves est bien meilleure. Le changement de langue du roman à l'allemand constitue tout simplement une constante historique que l'on peut observer même aujourd'hui dans les Grisons. #Karte der Germanisierungsphasen des ganzen Alpengebiets?# Le processus a commencé dès l'effondrement de l'infrastructure romaine (en 476). La période qui suit immédiatement est très intéressante pour l'histoire linguistique, elle est pourtant très mal documentée par écrit, de sorte que la coopération avec d'autres matières historiques, spécialement avec l'archéologie, est indispensable. Il est vrai qu'il y a encore de grandes lacunes de recherche, mais grâce à Weindauer 2014 une remise à jour des sources archéologiques et onomastiques (du 6ème au 8ème siècle) de Haute Bavière, de la région de Salzbourg et de la vallée de l'Inn tyrolienne a eu lieu. Il en ressort qu'on peut exclure "eine längere, grundlegende Siedlungsunterbrechung zwischen Römer- und Bajuwarenzeit" (traduction: une interruption d'habitat plus longue et fondamentale entre l'époque romaine et l'époque des Bavarii) parce que tout plaide en faveur d'un "fließenden Übergang der Besiedlungsstruktur von der Spätantike zum Frühmittelalter" (traduction: transition graduelle de la structure de population de l'Antiquité tardive au haut Moyen Âge) (Weindauer 2014, 248). Néanmoins une différence graduelle entre les régions mentionnées eu égard à la consolidation scientifique: "Was bezüglich des Zusammenhangs spätantiker und frühmittelalterlicher Fundstellen für das oberbayerische Alpenvorland noch überwiegend theoretisch galt {...}, findet in den österreichischen Gebieten seine nachweisliche Bestätigung: Die frühmittelalterlichen Ortsgründungen des 6. Jhs. orientieren sich fast ausschließlich an spätrömischer Infrastruktur bzw. – soweit noch vorhanden – an der romanischen Siedlungsstruktur" (traduction: ce qui était valable encore dans l'ensemble de manière théorique eu égard au rapport entre les lieux de la découverte de l'Antiquité tardive et du haut Moyen Âge pour les Préalpes de la Haute Bavière {...}, est avéré dans les régions autrichiennes: les fondations de lieu du haut Moyen Âge du 6ème siècle s'orientent presque exclusivement à l'infrastructure de l'antiquité tardive respectivement – dans la mesure où elles sont encore existantes – à la structure d'habitat romaine) (Weindauer 2014, 257).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Désignation  (Citer)

Par 'désignation', VerbaAlpina entend l'instance idéalisée d'un mot, écrit, parlé ou pensé, qui dénomme un ou plusieurs concepts et, renvoie le cas échéant à des choses concrètes. Une séquence spécifique de plusieurs mots, pas nécessairement un mot seul, peut aussi assumer ces fonctions (séquence appelée lexie plurilexicale). Concernant la catégorie 'concept' il y a une relation m:n, en termes informatiques : une désignation polysémique peut désigner plusieurs concepts; et vice versa, un concept peut être désigné par une multitude de désignations synonymes.





(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Dictionnaires de référence  (Citer)

Dans le cadre de la typisation (réduction à types), centrale pour le projet VerbaAlpina, les dictionnaires de référence ont une grande importance. Pour garantir la comparabilité du matériel, toutes les données qui sont extraites des sources – aussi bien des types phonétiques que des types morpho-lexicaux – se réfèrent à un cadre de référence lexicographique. Le travail de réduction à types est fait par les employés de VerbaAlpina et s'appuie sur leur expertise linguistique. Ce travail est donc un travail interprétatif et ne prétend pas à la validité incontestable. Les données extraites des sources sont liées aux lemmes des dictionnaires de référence mentionnés ci-dessous. Dans une famille linguistique, les données linguistiques qui doivent être réduites à types sont liées aux lemmes appropriés des dictionnaires de références spécifiques pour la région linguistique. Vice-versa il est donc possible de trouver toutes les données classées de VerbaAlpina en partant des lemmes des dictionnaires de référence. Sur ce point, VerbaAlpina représente un élargissement organique des dictionnaires de référence utilisés, élargissement techniquement réalisable sans grands problème au moyen de mises en relation.
Si aucun des dictionnaires de référence définis ne présente de lemme approprié, VerbaAlpina fixe un type morpho-lexical orthographique qui prend dorénavant le statut de référence et auquel toutes les autres données linguistiques de cette catégorie morpho-lexicale peuvent être référées. Par cet auto-référencement, VerbaAlpina obtient aussi le statut de dictionnaire de référence.
Comme cette attribution aux dictionnaires de référence correspond à un travail demandant interprétation, VerbaAlpina permet aux scientifiques et aux profanes de commenter de façon controversée des attributions de lemme. Cela permet aux personnes externes de faire des réductions à types alternatives qui peuvent à leur tour être commentées et discutées.

Les mors des régions germaniques sont liés si possible aux lemmes de :

  • Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch
  • Grimm, Jacob und Wilhelm (1854-1961): Deutsches Wörterbuch von Jacob und Wilhelm Grimm, 16 volumes subdivisés en 32 tomes, Leipzig (Quellenverzeichnis Leipzig 1971) (DWB)
  • Duden (pris en considération à cause de son importance effective et de l'abondance de matériel- malgré la pauvreté des informations lexicographiques présentées)

Les mots des régions romanes sont liés si possible aux lemmes de:

Les mots des régions slaves sont liés si possible aux lemmes de :
  • Slovar slovenskega knjižnega jezika (SSKJ)

Si nécessaire (spécialement en vue des étymons), le dictionnaire de référence pour la langue latine est :
  • Georges, Karl Ernst (1913-1916, Reprint 1998): Ausführliches lateinisch-deutsches Handwörterbuch. Aus den Quellen zusammengetragen und mit besonderer Bezugnahme auf Synonymik und Antiquitäten unter Berücksichtigung der besten Hilfsmittel ausgearbeitet, 2 Bände, Darmstadt.
Pour la détermination de l'étymologie des types de base, ce sont les dictionnaires suivants qui servent de référence :
  • Wartburg, Walther von (1922-1967): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel (FEW), avec ses commentaires (qui ferment les articles) souvent fondamentaux au-delà du français ou même du roman.
  • Kluge
  • DELI
  • Bezlaj et sous l'édition la plus récente Snoj. Cf. généralement pour les étymologies slaves Berneker
  • Si possible, les lemmes de l'AWB servent de forme de référence pour les types de base germaniques, car ils représentent les formes documentées les plus anciennes.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Données d'entrée  (Citer)

Au sein de VerbaAlpina sont utilisées exclusivement des données géoréférenciées au moins sur le territoire d'une commune, et si possible encore plus précisément (par exemple des photos d'alpages). À l'égard de données linguistiques particulièrement importantes, deux types sont à distinguer : d'un côté, les données remontant directement aux énoncés des informateurs individuels – comme par exemple les attestations de certains atlas linguistiques (spécialement les atlas romans) ou de la Bayerische Dialektdatenbank (BayDat); ces énoncés sont décomposés selon leurs éléments constitutifs, les tokens. De l'autre, des formes déjà typisées par les éditeurs – en effet certains atlas, par exemple le SDS, le VALTS ainsi que les dictionnaires, ne contiennent pas d'énoncés de locuteur, de sorte qu'il n'est pas possible de remonter jusqu'aux tokens.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Ethnolinguistique  (Citer)

"On ne peut pas faire l'histoire des mots sans faire l'histoire des choses" (Jaberg 1936, 23).
Traditionnellement, en ce qui concerne la recherche en langues romanes, surtout en langue italienne, la dialectologie est depuis le début, c.-à-d. en Italie au moins depuis Giuseppe Pitré, très étroitement liée aux sciences sociales, plus précisément à la sociologie et à l'ethnologie. Dans cette perspective, toute la géo-linguistique peut être considérée comme matière partielle d'une 'ethnoscience' générique. Cette expression, utilisée ici comme traduction d'ita. etnoscienza (de l'eng. ethnoscience), ne s'est toutefois établie ni en Italie ni en Allemagne. Dans le très pertinent et très informatif Manuale di etnoscienzade Giorgio Raimondo Cardona (Cardona 1995) on peut lire les mots suivants:

"[...] il prefissoide etno- permette un'immediata 'etnologizzazione' di qualunque sottodisciplina [...]. L'inglese offre ancora un altro tipo di formazione, quella con folk- (folk-taxonomy), che ha però lo svantaggio di non essere atrettanto facilmente esportabile quanto il suo concorrente grecizzante.
Il termine con etno- copre però due cose distinte, nella letteratura: etnobotanica può significare:
a) una vera botanica scientifica, ma ritagliata sull'habitat, uso ecc. di una specifica etnia;
b) la scienza botanica posseduta da una specifica etnia.
Nel primo caso, il ricercatore è soprattutto un naturalista, che compie il suo lavoro consueto, anche se con una particolare attenzione alle denominazioni locali ecc.; nel secondo il ricercatore è piuttosto un antropologo conoscitivo, che studia come venga categorizzato il mondo naturale da una data etnia; dei dati naturalistici egli si servirà soprattutto per ancorare le classificazioni così individuate a referenti reperibili e riconoscibili anche per chi è esterno alla cultura studiata. [...]
Gran parte dell'analisi etnoscientifica si basa sull'analisi di enunciati della lingua del gruppo [...] " (Cardona 1995, 15 s.; gras par TK)  

L'etnoscienza ainsi ébauchée est désignée aussi comme cultural anthropology dans la tradition des États-Unis d'Amérique. De plus, dans les pays germanophones, on distingue la Volkskunde pour l'exploration de culture(s) indigène(s) de la Völkerkunde pour l'exploration de cultures étrangères, spécialement non-européennes. Actuellement, on parle au lieu de cela le plus souvent d'Ethnologie (fra. ethnologie), comprenant le domaine spécial de l'ethnologie européenne (au sens de Volkskunde). C'est pourquoi la désignation ethnolinguistique n'est pas claire, étant souvent limitée à l'exploration linguistique de cultures non européennes (cf. Senft 2003) même si elle ne devrait pas exclure les européennes; une séparation catégorique se révélant de toutes façons de plus en plus vaine face aux flux migratoires massifs et vastes.

Un flou dans le passage cité de Cardona doit encore être résolu; il concerne le 'préfixoide' ethno- qui est d'un côté synonyme de l'anglais folk et de l'autre est utilisé en faisant référence à etnia. Par folk (eng. folk-taxonomy etc.) on renvoie à des savoirs et conventions relatifs à la culture du quotidien des non spécialistes ou bien non scientifiques et c'est à ce sens qu'ethnie (ou bien ethno-) aussi devrait faire référence à des communautés de culture de vie quotidienne, sans pourtant impliquer des idées idéalisées d'homogénéité, archaïcité, fermeture sociale etc.. La distinction de Cardona (a vs. b) renvoie de plus à deux perspectives de recherche complémentaires au sein des sciences sociales et culturelles.

En résumé, on peut désigner la recherche dialectologique selon Cardona (aussi à posteriori) comme 'ethnolinguistique' si elle relève et analyse ses données linguistiques en rapport étroit à la vie quotidienne des locuteurs. Dans la tradition de la linguistique romane, cette orientation a été établie de façon prototypique par le Sprach- und Sachatlas Italiens und der Südschweiz (AIS); elle marque sans doute la plus grande différence et le plus grand progrès à l'égard de l'ALF, comme Karl Jaberg le fait observer avec une certaine emphase. Le passage instructif relatif à l'histoire de la discipline mérite d'être mis en valeur, il montre comment les auteurs de l'AIS eux-mêmes se positionnaient:

"L'importance des «choses» n'a pas échappé à l'esprit de Gilliéron [...] Que Gilliéron ait complètement négligé ce point de vue dans la conception de l'Atlas et qu'il n'en ait tenu compte qu'en passant dans ses autres publications, c'est un fait d'autant plus étrange qu'il connaissait fort bien les «choses» et s'y intéressait passionnément. A-t-il approuvé l'enseignement que Ferdinand de Saussure a tiré de ses incursions dans les domaines limitrophes de notre science, à savoir que la «linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même», principe qui, malgré l'admiration que j'ai pour le grand savant genevois, m'a toujours semblé singulièrement rétrécir le champ d'action du linguiste." (Jaberg 1936, 27 s.)

Jaberg attire explicitement et à juste titre l'attention sur le fait que justement sur ce point précis le structuralisme saussurien garde les idées des néogrammairiens. Du point de vue de la géo-linguistique contemporaine la tentative de regarder la langue comme un 'module' pouvant être isolé n'était donc absolument pas perçue comme un paradigme nouveau, mais tout simplement comme traditionaliste:

"La conception du Petit Atlas phonétique du Valais roman [également de Gilliéron; TK] et celle de l'Atlas linguistique de la France remontent à une époque qui était encore sous l'empire des néogrammairiens, et on sait ce que les néogrammairiens doivent aux sciences naturelles. Ce n'est certes pas un hasard que le Cours de linguistique générale s'en ressente également. M. Jud et moi, nous avions pas ces attaches avec les néogrammairiens, Gilliéron lui-même nous avait aidés à les rompre. Nous étions en revanche fortement impressionnés par les brillants articles de Meringer et de Schuchardt. La réalité des choses était autour de nous. Nous avions nous-mêmes parcouru les pays romans ; nous avions recueilli sur le terrain des observations ethnographiques et folkloriques. Comment en rester aux mots ? Tout en sauvegardant le caractère essentiellement linguistique de notre ouvrage, nous croyions devoir fournir à l'historien des mots les données nécessaires pour se faire une idée des choses, afin qu'il ne bâtisse pas dans le vide." (Jaberg 1936, 28).
 

L'étude de Hugo Plomteux 1980 sur la Cultura contadina in Liguria, née de l'observation participative, est innovatrice pour la tradition ethnolinguistiquement orientée de la dialectologie italienne. Une région ethnolinguistiquement très bien analysée – en comparaison avec les autres, peut-être même la région la mieux analysée – est la Sicile. Ce sont surtout Fanciullo 1983 et plusieurs études importantes qui ont été faites dans le cadre de l'Atlante linguistico della Sicilia qui doivent être mentionnés à cette occasion. Les œuvres suivantes offrent des renseignements sur les techniques et traditions culturelles chaque fois étudiées: Bonanzinga/Giallombardo 2011, Matranga 2011, Sottile 2002 et Castiglione 1999.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Etymologie  (Citer)

Pour dégager les strates linguistiques, la stratigraphie requiert une étymologisation. Le commentaire étymologique part à chaque fois du type de base, visant un triple but :
- déterminer la langue d'origine de la base lexématique ;
- justifier l'union de tous les types liés au même type de base; pour ce faire, on recourt aux régularités de la phonétique historique et à la plausibilité sémantique des relations conceptuelles.
- reconstruire les trajets des emprunts si le type de base est répandu dans plusieurs régions linguistiques; dès que la langue de l'étymon d'un côté et de l'informateur de l'autre ne sont pas conformes, on constate automatiquement un contact linguistique.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Familles linguistiques dans les Alpes  (Citer)

Dans le territoire de la Convention alpine et donc dans la région étudiée de VerbaAlpina, des langues de trois familles linguistiques sont traditionnellement parlées. Toutes les trois sont représentées par des continua dialectaux. Le degré de différenciation de ces continua dépend manifestement aussi de l'étendue de leurs zones de diffusion. La fragmentation de la zone romane est plus grande que celle de la zone germanique et celle-ci est à son tout plus grande que la slave; les atlas linguistiques correspondants nous renseignent sur la situation dialectale. Dans VerbaAlpina, les lieux de l'enquête des différents atlas sont liés entre eux et il en résulte un réseau étendu plurilingue. Au niveau des langues nationales ainsi que des langues des minorités, régionalement implémentées, c'est seulement la Romania alpina qui a plus de subdivisions. En plus du français et de l'italien, d'autres langues sont officiellement reconnues comme langues nationales ou langues de minorité, ce sont le romanche en Suisse et l'occitan, l'arpitan (ou francoprovençal) reconnu officiellement dans la Vallée d'Aoste, le ladin et le frioulan en Italie. Dans la Slavia alpina e dans la Germania alpina, il n'existe qu'une langue standard, respectivement le slovène et l'allemand. Eu égard à la langue allemande pluricentrique, on doit différencier au moins trois variétés standard nationales coexistantes en Suisse, en Allemagne et en Autriche.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géolinguistique analogique  (Citer)

Les dimensions du savoir qui font partie de l'horizon épistémique de VerbaAlpina, c.-à-d. les CHOSES, les CONCEPTS et les MOTS, sont en général unies de manière très étroite et souvent complètement indéfinie dans la présentation analogue pratiquée par la géolinguistique traditionnelle. La carte AIS 1192a LA CASCINA DI MONTAGNA en est un cas exemplaire (la carte est une partie de cette carte de VerbaAlpina). Le titre de la carte a tout d'abord le statut d'un concept, à savoir le bâtiment, "wo ein gut ausgebildeter Käser ('Senn') mit Hilfspersonal die Milch sachgemäss zu Käse, Butter, Zieger verarbeitet" (traduction: où un fromager qualifié transforme le lait en fromage, beurre, sérac de manière adéquate avec du personnel auxiliaire). En plus, on apprend qu'il s'agit d'un hyperonyme, car certains chalets servent d'entrepôts à la fois pour le lait et le fromage tandis que dans d'autres cas il y a des caves séparées pour le lait et pour le fromage; caves qui à leur tour peuvent être peuvent être soit contiguës à un édifice, soit séparées et à travers lesquelles, souvent, s'écoule un cours d'eau. En outre, le "meist massive steinerne Sennhütte" (traduction: chalet massif le plus souvent en pierre) doit être distingué de ceux en bois etc. En d'autres termes : il y a toute une typologie de concepts subalternes et spécifiques et il n'est pas toujours clair quel chalet exactement est entendu par le mot attesté sur la carte. Le concept du titre de la carte est donc souvent trop peu spécifié et l'existence d'autres désignations pour des chalets plus spécifiques ne peut être exclue pour aucune localité; les dictionnaires de dialecte confirment constamment cette impression. En même temps, deux autres concepts qui ne sont pas hyponymes de CHALET entrent en jeu: CAVE POUR LE LAIT et CAVE POUR LE FROMAGE. En outre, la même légende fait référence à la présence fréquente de bâtiments où on loge différents animaux, y compris des cochons, ce qui revient donc à un troisième concept encore. Les désignations pour ces autres concepts ne sont pas citées dans la carte topographique, mais en marge sous forme de listes, qui montrenten général des attestations pour peu de localités seulement. En même temps, il arrive souvent que des mots polysémiques apparaissent sur les listes qui désignent de tout autres concepts dans les localités particulières. A ce sujet voyons le type kort qui est attesté dans la liste se référant au concept BATÎMENT ALPIN OÙ ON LOGE DES ANIMAUX pour les localités AIS 107 et 109 bien qu'il désigne tout autre concept dans une des deux attestations (point 109), et ce LIEU DE GÎTE ET DE TRAITE POUR LE BÉTAIL PRÈS DU CHALET.




Les inconsistances de ce type doivent absolument être dissipées quand on enregistre des données numériquement; c'est une exigence essentielle de distinguer et séparer strictement les dimensions épistémiques mentionnées, pour ainsi dire la déconstruction systématique des informations offertes. 





Ceci fait, les catégories consistantes permettent de consulter et de visualiser  toutes les informations disponibles à partir de la base de données, dans n'importe quelle combinaison.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géolinguistique plurilingue  (Citer)

L'un des objectifs de ce portail est de faire ressortir la force, tout à fait marquante, du contact linguistique, en particulier le conditionnement ethnolinguistique de celui-ci au cours de l'histoire de l'espace linguistique alpin. La conception de la base de données permettra de représenter, aussi de manière quantitative, les emprunts saisis dans leur accumulation locale. Ils apparaissent automatiquement quand l'appartenance d'un informateur à une des trois familles linguistiques ne correspond pas à celle de l'étymon. Trois familles linguistiques forment la région alpine moderne, sous forme de continua dialectaux chacun avec une extension et une différenciation complètement diverses. Les zones de diffusion de ces trois familles linguistiques ne coïncident d'ailleurs pas avec les territoires des États politiques. La famille germanique est représenté par des variétés alémaniques et bavaroises, attribuées à la langue allemande pluricentrique. Toutefois la référence commune aux variétés standard suisse, allemande et autrichienne, qui fonde l'affiliation à la même communauté linguistique, n'existe plus dans certains îlots linguistiques valaisans et bavarois anciens (cimbres).
Les variétés du continuum roman peuvent être attribuées – à l'inverse des régions germaniques – à plusieurs langues; en plus du français et de l'italien il s'agit, conformément à la reconnaissance politique en Suisse et en Italie de l'occitan, du franco-provençal, du romanche, du ladin et du frioulan.
Le slave est représenté par des dialectes slovènes qui hors de la Slovénie sont parlés aussi dans plusieurs communes italiennes et autrichiennes. Toutefois, ce n'est pas l'objectif de VerbaAlpina de décrire le plus complètement possible les dialectes de la région alpine, de faire ressortir les frontières des dialectes locaux ou régionaux et de représenter l'espace en quelque sorte comme mosaïque de variétés. Il s'agit plutôt, grâce à la conception géolinguistique du projet, de faire apparaître les caractéristiques (surtout lexicales) répandues au-delà des frontières de certains dialectes ou de langues particulières et dénotent ainsi une trame ethnolinguistique commune.





Etant donné que les dialectes constituent des systèmes linguistiques complets en eux-mêmes, et qu'ils représentent trois continua 'génétiquement' différents on peut prétendre que le contact linguistique sera étudié dans la perspective d'une géolinguistique plurilingue (cf. plus en détail Krefeld 2018d).

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Géoréférencement  (Citer)

Le géoréférencement selon les degrés de latitude et de longitude est un critère de classement essentiel pour la gestion des données de VerbaAlpina. La précision de ce référencement varie selon le type de données; on aspire un référencement le plus exact possible, au mètre près. Dans le cas des données linguistiques issues des atlas et des dictionnaires, c'est seulement un référencement approximatif conformément à un toponyme qui est en règle générale possible. Dans le cas de données archéologiques par contre, un géoréférencement au mètre près est possible. On peut sauvegarder des points, des lignes (comme des rues, des rivières) et des surfaces. Sous l'angle technique, le format WKT (https://en.wikipedia.org/wiki/Well-known_text) est principalement utilisé, celui-ci est transféré à un format MySQL spécifique dans la base de données VA par la fonction geomfromtext() (https://dev.mysql.com/doc/refman/5.7/en/gis-wkt-functions.html et est ainsi sauvegardé. La sortie au format WKT se produit par la fonction MySQL astext().
La grille de référence du géoréférencement est établie selon le réseau des communes de la région alpine, qui peuvent être sorties ou comme surfaces ou comme points, suivant les besoins. Les tracés des frontières de commune de 2014 que VerbaAlpina a reçus de son partenaire "Conférence Alpine" en forment la base. Une actualisation permanente de ces données est superflue, même si elles changent selon les réformes administratives, car il s'agit dans la perspective de VerbaAlpina seulement d'un cadre de référence géographique. La représentation en point des communes est calculée selon les frontières communales de façon algorithmique, elle est donc secondaire, ne marquant pas nécessairement le centre bourg.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information Contexte extralinguistique



Horizon épistémique  (Citer)

Ce portail informe de trois dimensions différentes:

(1) de la realité extralinguistique ('choses'),
(2) de concepts, ou: de catégories onomasiologiques qui ne sont pas liées à des langues ou dialectes particuliers,
(3) d'expressions linguistiques des langues et des dialectes enquêtés.

Le traitement séparé de (2) et (3) est fondamental parce que les concepts pertinents ne sont pas toujours documentés dans toute la région de l'enquête par des termes spécifiques (ils ne sont donc pas tous lexicalisés). Ainsi dans une grande partie de la région bavaroise il n'y a pas de mot pour le fromage produit à partir de petit-lait (cf. (alémanique) Ziger, ita. ricotta, fra. sérac), tandis que pour la masse de fromage fraîche pas encore modelée (bar. Topfen, alld. Quark), il manque souvent un terme dans les dialectes romans y compris en italien standard. La relation entre (1) d'un côté et (2) et (3) de l'autre côté est parfois plus problématique que cela semble à première vue: ainsi, on est confronté quelquefois à des expressions de statut sémiotique ambigu, parce qu'il ne ressort pas des données s'il s'agit de désignations de concepts ou plutôt de noms de choses; c'est le cas par ex. si un locuteur appelle un certain alpage, par exemple cet alpage-là qu'il utilise lui-même, avec un nom générique comme munt, littéralement 'montagne', ou pastüra 'pâturage'.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Lexie plurilexicale  (Citer)

Par lexie plurilexicale, VerbaAlpina entend une série spécifique de mots (Tokens), qui, pris ensemble, qualifient un concept précis voire plusieurs concepts précis. Ainsi, entre autres exemples, dans la vallée du Grödner (AIS 1192_1, 312), le concept d’HABITATION D’ALPAGE sera designé par la lexie plurilexicale casa da fuoco (ʧˌaz dɑ fˈuɑk), mot à mot « maison du foyer » ; dans d’autres dialectes (Engadine, Tessin entre autres), la même combinaison qualifie le concept de CUISINE.

D’un point de vue informatique en résulte le problème d’un classement conceptuel à multiples strates, dont on doit rendre compte dans la rubrique modèle relationnel. A côté de la signification de lexie plurilexicale prise en tant que tout, les mots pris un par un possèdent leurs propres significations qui mettent en lumière et motivent l’idée d’une lexie plurilexicale. Afin de prendre en compte cette particularité, on utilise dans la banque de données de VerbaAlpina les groupes dénommés Tokens. Une référence, qui se compose de plusieurs mots pris un à un, est alors décomposée selon ses éléments, eux-mêmes rangés dans le tableau « tokens ». Chacun de ces Tokens renvoie à cet égard à une seule et même entrée dans le tableau « groupe tokens » et enregistre en plus sa position dans le groupe Tokens (1ère, 2ème position, etc.), de sorte que la lexie plurilexicale puisse être reconstituée à partir des Tokens pris un à un. Une sauvegarde explicite de la lexie plurilexicale n’est de ce fait pas nécessaire ; dans le tableau « groupes Tokens », on ne range ainsi (en dehors des ID des groupes Tokens) que des informations complémentaires, qui ne peuvent pas découler des Tokens pris un à un, comme par exemple le genre des groupes Tokens.

Un classement des concepts a lieu aussi bien au niveau des Tokens qu’au niveau des groupes Tokens. Concernant l’exemple cité plus haut, il y a trois entrées dans le tableau Tokens pour lesquelles à chaque fois des concepts différents sont classés.



L'attribution des concepts aux composants se fait à l'aide de dictionnaires. Pour le sous-concept correspondant, l'entrée la plus fréquente est reprise du dictionnaire. Comme les sous-concepts n'ont pas été interrogés, il est possible que certains d'entre eux ne correspondent pas à la réalité.

Il y a de surcroît une entrée dans le tableau „groupe Tokens“ avec une classification conceptuelle qui lui est propre :



Au moment de réaliser la représentation cartographique à la surface de VerbaAlpina, les Tokens et les groupes Tokens sont traités sur le même plan, c’est-à-dire qu’une recherche du concept HABITATION D’ALPAGE fournit aussi bien les groupes Tokens que les Tokens qui sont liés à ce concept. Les mots pris un à un, n'étant référencés que comme composants d’une lexie plurilexicale, sont marqués comme tels.


(auct. Stephan Lücke | Florian Zacherl – trad. Pierre Herrmann)

Tags: Linguistique



Lexique alpin  (Citer)

Les réalias typiquement alpins (comme le CHAMOIS, le CEMBROT DES ALPES ou l'ALPAGE) sont souvent désignés par des mots de substrat préromains. Cette strate linguistique a été décrite dans ses détails tout d'abord par Jakob (voir les travaux scientifiques notoires de Jud 1911a, Jud 1911b, Jud 1924 et Stampa 1937); elle forme le fond du lexique alpin. Toutefois, l'expression "lexique alpin" n'est pas complètement univoque parce qu'elle a un sens plus vaste tant chez Otto von Greyerz 1933 qui l'a probablement forgée, que chez Johannes Hubschmid 1951 qui l'a surtout rendue publique: "Ich verstehe darunter Wörter, die Geländeformationen, Naturerscheinungen, Tiere und Pflanzen oder mit der menschlichen Tätigkeit zusammenhängende konkrete Begriffe bezeichnen, Wörter, die sich nur oder hauptsächlich in den Alpenmundarten erhalten haben, oder die zwar auf einem größeren Gebiet leben, aber in den Alpen häufig eine speziell 'alpine' Bedeutung zeigen. Alpenwörter können auch germanischen oder romanischen Ursprungs sein" (Hubschmid 1951, 7; traduction: "Par lexique alpin, j'entends des mots qui désignent des formations de terrain, des phénomènes de nature, des animaux et des plantes ou des termes concrets qui sont en rapport avec l'activité humaine, des mots qui se sont maintenus > seulement ou surtout dans les dialectes alpins ou qui certes existent dans une région plus vaste, mais qui montrent souvent un sens spécialement 'alpin' dans les Alpes. Le lexique alpin peut aussi être d'origine germanique ou romane.") (cf. pour l'histoire du terme depuis peu aussi Rampl 2011, 131 ss.)

Le terme VerbaAlpina rejoint bien consciemment cette catégorie qui s'avère être très utile à une étude du plurilinguisme. Celle-ci permet d'identifier les unités lexicales qui caractérisent l'espace culturel des Alpes et qui impliquent des emprunts lexicaux, le tout sans se focaliser sur une langue en particulier. Pour rendre le concept verba alpina (ou: lexique alpin) applicable, il doit être précisé dans le cadre du projet: on désigne comme étant 'alpins' les types lexicaux qui ont des correspondances dans plus d'une des familles linguistiques traditionnelles de la région des Alpes ainsi que ceux qui sont, certes, seulement romans mais qui, au lieu du latin, ont leur origine dans des substrats prélatins régionaux. Ainsi, on trouve sept catégories hybrides:

Correspondances possibles d'un mot alpin
Prélatin Roman Germanique Slave
x x x x ‘alpin’ au sens strict
x x x ‘alpin’ au sens large
x x x
x x
x x
x x
x x


(auct. Thomas Krefeld – trad. Julie Defert | Susanne Oberholzer)

Tags: Linguistique



Lieux d'origine des données  (Citer)

Les noms des lieux de collecte des données sont tirés de la source (y compris une orthographe différente). Si deux ou plusieurs lieux portent le même nom, un supplément local sera ajouté (si disponible et nécessaire). Par exemple: Brixen im Thale, St. Johann in Tirol. Surtout en Autriche ces suppléments sont disponibles et facilitent la différentiations des lieux de collecte des données.
Les noms des villages plus petits n'ont souvent pas de supplément local. Dans ces cas, on rajoute entre parenthèse le nom de la commune à laquelle ils sont rattachés, par exemple St. Magdalena (Gries), St. Magdalena (Villnöss).

(auct. Mona Neumeier – trad. Beatrice Colcuc)

Tags: Linguistique



Modèle relationnel  (Citer)

Le modèle relationnel de données organise les informations sous forme d’un ou plusieurs tableaux. Sa désignation vient du fait que les tableaux sont aussi appelés « relations » dans le jargon technique. Les lignes d’un tableau sont aussi appelées « enregistrement » ou « multiplet »; au lieu de colonnes, on parle aussi de « champs », d’« attributs » ou de « qualités ». Un tableau peut, du moins théoriquement, posséder un nombre illimité de lignes et de colonnes. Un tableau donné peut à tout moment être complété aussi bien par de nouvelles lignes que par de nouvelles colonnes. Un ensemble de tableaux peut être désigné sous le nom de banque de données. Pour gérer un tel ensemble de tableaux/banques de données, on utilise des systèmes de gestion des banques de données comme par exemple MySQL ou PostgreSQL. La gestion des données tout comme leur analyse s’ensuit au moyen d’une langue formelle spécifique que l’on appelle Structured Query Language (SQL), et qui a été spécialement développée pour l’analyse des données en format relationnel, et qui est entre autres présente dans une version standardisée de la ISO (Wikipedia).
Concernant la représentation des informations dans le modèle relationnel de données, il existe des règles spécifiques qui représentent de facto une science en soi (par exemple la dénommée Normalisierung). En même temps, le choix concret de cette modélisation dépend de son emploi, et le respect de règles de modélisation existantes constitue dans certains cas plutôt un handicap sous l’angle de l’utilité et de la performance. Dans la pratique, toute modélisation de données représente un compromis entre prescriptions du règlement théorique, exigences techniques et plaisir de l’utilisateur. En outre, un modèle de données choisi une fois peut à tout moment être modifié et être adapté à des exigences changeantes.


(auct. Stephan Lücke)

Tags: Linguistique



Notation  (Citer)

Dans les contributions de texte, les principes de notation suivants sont utilisés : les formes linguistiques (exemples d'attestations) sont écrites en italique ; la signification est marquée par des guillemets simples. Par ex. ita. formaggio 'fromage'. Les catégories extralinguistiques (concepts) sont représentées par des majuscules. La différence entre sens linguistique et concept est importante dans les cas où il n'y a pas de mot pour certains concepts dans certaines langues ou dialectes, comme par exemple FROMAGE ISSU DU LIQUIDE APRÈS LA DEUXIÈME COAGULATION DE LA PÂTE. On appelle cela ita. ricotta, fra sérac, alémanique Ziger etc.; un mot en allemand standard manque pourtant.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Page Web



Numérisation  (Citer)

Dans le contexte de VerbaAlpina, par numérisation on n'entend pas simplement l'utilisation d'ordinateurs pour le traitement électronique des données, mais surtout et essentiellement l'exploitation numérique en profondeur par la *structuration* et la catégorisation systématiques et transparentes du matériel.



Au sein du projet, c'est presque exclusivement le modèle relationnel qui est utilisé, dans lequel les données sont organisées en forme de tableau. Les tableaux se composent de lignes (= enregistrements, tuples) et de colonnes (= attributs, cases, propriétés); chaque tableau peut être agrandi dans chaque direction en ajoutant des lignes et des colonnes. Entre les tableaux existent des relations logiques, qui permettent des associations cohérentes et les représentations synoptiques correspondantes (dites "joins") de deux ou plusieurs tableaux. Pour la gestion des tableaux, VerbaAlpina utilise actuellement le système de gestion de base de données MySQL. Les tableaux ne sont pas figés par ce système, ils peuvent être exportés à tout moment, par ex. sous forme de texte avec des délimiteurs univoquement définissables pour les limites de case et d'enregistrement (dits séparateurs) avec les noms de colonnes et la documentation des relations logiques (modèle entité-association). La structure XML, souvent employée actuellement, n'est pas utilisée au niveau du plan opérationnel de VerbaAlpin,. Dans le cadre de la conception d'interface pourtant, XML est utilisé comme format d'exportation.

Aux côtés de la structuration logique des données, c'est le codage des caractères qui tient le second rôle principal dans le contexte du mot-clé "numérisation". Ce domaine est de la plus grande importance, en particulier en vue de l'archivage longue durée des données et il doit être géré de manière prévoyante. Autant que possible, VerbaAlpina s'oriente au tableau de codage et selon les prescriptions du Consortium Unicode. Au cas où la numérisation concerne des caractères qui ne sont pas encore intégrés par le tableau Unicode, la saisie digitale de données d'un caractère isolé se fait de préférence en sérialisant le caractère sous forme d'un ordre de caractères du bloc Unicode x21 jusqu'à x7E (à l'intérieur du bloc ASCII). Les affectations correspondantes sont renseignées dans des tableaux spéciaux, une conversion future en valeurs Unicode, lorsqu'elles seront disponibles, reste alors possible.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Onomastique  (Citer)

Les résultats onomastiques, spécifiquement dans le cas de la toponomastique, sont d’une importance capitale pour évaluer la continuité géographique d’une implantation ayant survécu à un changement linguistique (comparer avec l’exemple alpin, déjà, Steub 1867 et von Greyerz 1933). Il faut ici distinguer deux types sémantiques : d’une part, les formes antiques qui sont reprises des substrats linguistiques (« ces traitres souvent peu pratiques venus d’autres temps », comme Steub le dit de manière suffisante en 1867, 142). Leur mise au jour doit tenir en compte des régularités de la phonétique historique et en même temps compter sur de multiples exceptions qui sont souvent dues à une remotivation étymologique d’origine populaire. D’autre part, il y a des noms « parlants » avec lesquels les locuteurs des substrats linguistiques sont nommés explicitement, comme par exemple dans les noms alémaniques et bavarois avec la base wal(l)-, walch-, welsch- ‘romanisch’ (comparer avec l’étude, classique, de Ernst Schwarz 1970). La manière de procéder peut se faire à partir de deux perspectives opposées, en effet, en cherchant des formes correspondantes plus récentes ou actuelles, en partant de traces antiques (dans les itinéraires, sur les bornes, entre autres) ou bien, inversement, en identifiant des étymologies pour des formes actuelles sous la forme de références antiques ou de reconstructions linguistiques.  
La première perspective évoquée est sans doute la plus simple en raison des données traitées et chiffrables, car elle fournit une base de données constituée de noms romains bien localisés la plupart du temps, et qui peut être retravaillée de manière systématique. La perspective a posteriori est bien plus exigeante et aussi considérablement plus pertinente. Il manque ici les conditions préalables pour réussir un travail à plus grande échelle ; beaucoup de régions ne sont pas fermées d’un point de vue de l’onomastique, étant donné qu’il n’y a ni variantes dialectales récentes ni références anciennes. Quoi qu’il en soit, le Suisse Ortsnamenportal a accompli un début très prometteur déjà.
Mais à côté des noms concernant les lieux d’habitat, la documentation sur les noms concernant les toponymes (par exemple les montagnes et les alpages) est justement importante, étant donné qu’elle permet de faire des déductions sur l’utilisation habituelle des terrains. A cet égard, citons l’exemple suivant, totalement provisoire : dans son importante étude sur la colonisation de la Haute Bavière du Sud au Haut Moyen- Âge ainsi que du Tirol et de la région de Salzbourg qui lui sont contigües, Franz Weindauer 2014 rédige le résultat tiré d’une évaluation globale d’une fouille archéologique, en écrivant ce qui suit : « La comparaison des résultats tirés de la toponymie et de la recherche patronymique a donné pour résultat que, de nouveau, les régions déjà peuplées dans l’antiquité tardive fournissent des références concluantes concernant la vie romane au début du Moyen- Âge. En font partie en premier lieu la région de l’Ammersee, le pays de Werdenfelser, la région est du Chiemsee et le Rupertiwinkel, mais aussi par exemple la région du Mangfallknie, autour de Rosenheim et du lac de Starnberg » (Weindauer 2014, 249). A cet égard, et ce dans la partie alpine de son champ de recherche, la répartition des lieux où ont été découverts des éléments se focalise de manière très visible sur les cols, c’est-à-dire à peu près sur la route du Brenner qui se ramifie à Innsbruck (quand on vient du Sud) vers l’Ouest (en passant par le Zirlerberg en direction de Garmisch et du piémont alpin) et vers l’Est (en-deçà de l’Inn). Il suffit de porter un bref regard d’un point de vue toponymique sur la chaîne de montagne de Karwendel, qui se trouve à l’angle de ces deux routes et qui ne connaît pas une seule implantation plus importante jusqu’à aujourd’hui, pour mettre à jour, sur une distance de quelques kilomètres, d’évidents romanismes ou des mots préromains récupérés par le roman :
* die Fereinalm < lat. veranum, vgl. spa. verano 'Sommer' tout comme le  Vereinatunnel dans l’Engadine du sud;
* die Krapfenkarspitze avec pour base le préromain *krapp- 'Fels', vgl. roh. (sursilvan) crap avec beaucoup de traces dans la toponymie des Grisons (vgl. Schorta 1964 , 111-114);
* die Pleisenspitze zur Basis vorröm. *blese 'steile Grashalde', vgl. roh. blaisch, blais, bleis, bleisa (vgl. DRG 2, 373 tout comme les traces toponymiques également très nombreuses dans Schorta 1964 , 44-46);
* der Hochgleirsch zu lat. glarea 'Kies' + iciu avec déplacement de l’accent sur la première syllabe; comparer avec ses équivalents suisses comme avec les lieux de la Rhétie romaine glaretsch dans Disentis (voir Schorta 1964, 164) et les lieux de la Suisse orientale alémanique Glaretsch in Pfäfers (voir ortsnamen.ch);
* die Larchetalm < lat. laricetum 'Lärchenwald', aus larix + etum, comparer les traces importantes dans les Grisons du type laret, avec la variante lat. larictum in Schorta 1964, 185;
* le nom de montagne Juifen < lat. iugum 'Joch', à nouveau, maints parallèles qui se sont propagés, comparer avec les noms de lieu Juferte dans la vallée du Simmen au sud de Bern, plus de Juf et de giuf, giuv dans les Grisons (tous dans le portail des toponymes de la Suisse) tout comme le Jaufenpass dans le sud du Tirol; un peu plus à l’est de Juifen, se trouve la montagne Guffert, dont le nom doit être établi pour ainsi dire comme une variante de la vallée du Simmen.
Un examen consciencieux mettrait encore davantage d’éléments à jour. Que l’on considère avec le dernier exemple la vocalisation non plus latine, mais romane (-g- > -v-, -f). Tous ces héritages présupposent un contact avec une population de langue romane qui utilisait les montagnes comme moyen de subsistance et aussi une acculturation de leurs formes de vie. Gamillscheg 1935, 306 s’est déjà prononcé dans ce sens : « le paysan alémanique et bavarois, qui tire ses fruits d’un sol nouvellement occupé, tisse un lien avec les Romanches qui travaillent eux aussi dans des conditions difficiles en contrebas. Rien ne montre davantage qu’aucun conflit national ne se soit ici jamais joué que le fait que les noms de lieux du vieux romanche et les noms allemands plus récents ont ici continué d’exister de manière tout aussi pacifique que ceux des Ladins et des Allemands-Tiroliens. L’invasion des Alémaniques et des Bavarois dans l’espace alpin rhétique et norique n’a pas eu pour conséquence une destruction culturelle ."  


(auct. Thomas Krefeld – trad. Pierre Herrmann)

Tags: Linguistique



Page de code  (Citer)

VerbaAlpina réunit des données issues de différents types de sources : des données d'atlas linguistiques et de dictionnaires imprimés, qui doivent tout d'abord être numérisées, ainsi que des données déjà numérisées, issues de projets partenaires. Chaque source utilise des systèmes de transcription plus ou moins individuels. Pour réaliser l'uniformisation nécessaire, des listes sont établies dans lesquelles il est fixé quel caractère du système de transcription d'une source X correspond à quel autre dans le système de transcription d'une source Y. Il s'agit surtout de retranscrire les différents systèmes de transcription en Alphabet phonétique international (API), qui fait office de transcription de référence dans VerbaAlpina. Pour convertir le système de transcription spécifique à une source en système API, on doit créer une liste complète sous forme de tableau indiquant les correspondances de caractère. Un tel tableau est nommé "page de code". Ci-dessous un extrait de la page de code fondamentale pour la conversion du système de transcription de l'AIS en API. Cette page de code comprend environ 4500 lignes/affectations en tout :


La colonne `BETA` comprend les caractères utilisés dans l'AIS en forme transcrite selon le principe du beta code; la colonne `IPA` le caractère API correspondant, et la colonne `HEX` la valeur ou les valeurs du tableau Unicode qui correspond(ent) au caractère API.

Un aperçu complet des pages de code de toutes les sources de VerbaAlpina se trouve ici.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information



Profil de similarité ethnolinguistique  (Citer)

Du point de vue ethnolinguistique de ce projet, les types de base fondent l'espace alpin plurilingue. Afin d'offrir une représentation synthétique, deux fonctions de cartographie quantitative différentes sont prévues :
  1. Tout d'abord viser le lexique alpin, dont l'ensemble forme pour ainsi dire un type idéal fictif duquel les dialectes locaux se rapprochent plus ou moins. La cartographie, d'une similarité graduelle, inspirée par la représentation du champ gradient de la gasconité à l'ALG 6 y correspond.
  2. Puis cartographier (selon le modèle de l'ASD) la similarité relative de tous les lieux d'enquête, en comparant et en visualisant les types de base en commun d'un lieu d'enquête x et de n'importe quel autre lieu pris comme point de référence.


(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Contexte extralinguistique



Réduction à types  (Citer)

La réduction à types des données géoréférenciées fait partie des exigences fondamentales de VerbaAlpina. Là où c'est possible parmi les données d'entrées étant déjà passées par la retranscription, une première étape de la réduction à types sera l'extraction de tokens ('mots individuels'), ils sont alors inscrits dans la case de base de données du même nom.

Le point de mire de VerbaAlpina est la réduction à types morphologiques des matériaux linguistiques rassemblés. Un type morphologique est défini par la concordance des propriétés suivantes: famille linguistique – partie du discours – mot simple versus mot affixé – genre – type de base lexical. La forme indiquée du type morphologique s'oriente aux lemmes correspondants de certains dictionnaires sélectionnés (voir ci-dessous).

Par l'attribution à un type de base lexical commun, l'union de tous les types morpho-lexicaux associés devient claire – même au delà des frontières linguistiques. Ainsi les noms et verbes suivants (qui ne sont pas décrits en détail ici) peuvent être attribués à un seul type de base malga (ALPAGE, TROUPEAU), malgaro (VACHER), malghese (BERGER), immalgare (ENALPER), dismalgare (DÉSALPER). Toutefois, le type de base lexical en dit peu rien sur l'histoire de parole d'un seul type morpho-lexical: on doit faire ressortir chaque fois séparément si un type avec étymon latin-roman aujourd'hui attesté dans la région linguistique germanique ou slave (par exemple slovène baita 'maison simple') remonte à un substrat local ancien ou bien à un contact linguistique roman plus récent. Pour cette raison, la désignation "étymon", faisant référence au stade historique immédiatement préliminaire d'un mot, est évitée dans ce contexte, même si le type de base lexical correspond en beaucoup de cas à l'étymon d'un type morpho-lexical.

Les types morpho-lexicaux forment la catégorie directrice dans la gestion des données linguistiques; ils sont comparables aux lemmes de la lexicographie. Au moyen des critères susnommés, résistants et bien mesurables, on peut réduire par ex. les quatre types phonétiques barga, bark, margun, bargun avec le sens CHALET DE MONTAGNE, ÉTABLE D'ALPAGE à trois types morphologiques.





L'appartenance des types morpho-lexicaux à des familles linguistiques (gem., roa., sla.) dépend de la source correspondante; dans le cas des données d'enquêtes traditionnelles d'atlas ou de dictionnaires, elle résulte automatiquement des informateurs correspondants et sera notée corrélativement dans la banque de données. Dans le cas des données que VerbaAlpina relève par crowdsourcing, l'appartenance linguistique ou bien dialectale est affirmée par les informateurs et sera confirmée quantitativement dans le meilleur des cas. Le nombre d'informateurs concordants devient ainsi un instrument de la validation de données.

Les types morpho-lexicaux sont limités à une famille linguistique. La question qui se pose alors est la suivante : sous quelle forme un type morpho-lexical devrait être représenté dans la zone de recherche de la carte interactive? Eu égard à la famille linguistique germanique et slave la réponse est plutôt facile parce que les deux sont représentées chacune par une seule langue standardisée ('Deutsch' [deu] et 'Slowenisch' [slo]). Les types morpho-lexicaux peuvent être rendus sous la forme de leur variante standard, évidemment à condition que des correspondances de ce type existent dans la langue standard. Ainsi, par exemple, tous les types phonétiques correspondants de l'alémanique et du bavarois étant des variantes de la forme standard 'fromage' peuvent être appelées par cette forme standard. Si des variantes standard n'existent pas, les lemmes des grands dictionnaires de références (Idiotikon, WBÖ) seront pris à titre d'exemple.

Dans le cas de la famille linguistique romane, la situation est beaucoup plus complexe à cause des nombreuses plus petites langues qui ne sont parfois pas suffisamment standardisées. Par des raisons pragmatiques, la solution suivante a été choisie : tous les types morpho-lexicaux sont représentés par les formes standard françaises et italiennes, si existantes. Ainsi tous les types phonétiques variantes de par ex. beurre/burro peuvent être appelées par ces deux formes. Les dictionnaires TLF et Treccani font office de dictionnaires de référence. Si seulement une de ces deux langues standard présente une variante convenable, c'est celle-ci qui apparaît, comme dans le cas de ricotta (l'appartenance à l'italien est signalée par la convention de notation -/ricotta). S'il n'y a aucune variante du type dans les deux langues de références romanes, on recourt à l'entrée d'un dictionnaire de références dialectal, comme par ex. le LSI. Au cas où il n'existe aucune entrée dans les dictionnaires dialectaux, VerbaAlpina propose un type de base qui est représenté graphiquement par le sigle 'VA'.

La réduction à types phonétiques des matériaux linguistiques est aussi prévue; cette étape de travail est pourtant secondaire est n'est pas faite de façon cohérente. La catégorie correspondante est indispensable surtout à cause des atlas linguistiques et des dictionnaires qui documentent parfois exclusivement (par ex. SDS, VALTS) des types phonétiques. Lors de la réduction à types phonétiques faite par VerbaAlpina, les tokens sont classés selon les critères de la phonétique historique dans des types phonétiques (case de base de données 'phon_typ'); une automatisation de la réduction à types phonétiques sur la base d'algorithme Levenshtein et soundex sera examinée et, si possible, appliquée.

Par la réduction à types (constitution de classes) la diversité des données devient plus claire; en règle générale: nombre des tokens > nombre des types phonétiques > nombre des types morpho-lexicaux > type de base. On note le cas extrême d'une seule attestation (hapax): l'attestation correspond à un token, un type phonétique et un type morpho-lexical comme seul représentant d'un type de base. Il peut éventuellement être raisonnable de filtrer ces formes d’hapax de la représentation.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Référent  (Citer)

Au sein du triangle des catégories linguistiques reliées entre elles « Désignation » – « Concept » – « Référent », la dernière désigne la substance individuelle d’un concept, qui par essence, est toujours abstraite, en d’autres mots un élément concret et individuel. Parmi le matériau de VerbaAlpina, on rencontre la plupart du temps des référents permettant une représentation imagée (dessin ou photographie). En comparaison des désignations et des concepts, les référents jouent un rôle de moindre importance dans le programme VerbaAlpina. Dans le cadre du "Crowdsourcings" surtout, les représentations des référents, la plupart du temps des photos, sont utilisées en même temps comme « outils de travail » afin de rendre saisissables, pour ceux qui désirent s’informer, les descriptions conceptuelles de temps à autre nécessairement compliquées.

(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Linguistique



Rhéto-roman  (Citer)

Conformément à la Constitution fédérale de la Confédération suisse, l'expression allemande 'Rätoromanisch' (version française de la Constitution fédérale : 'romanche') est utilisée dans le projet VerbaAlpina pour les variétés romanes du Canton des Grisons qui ne font traditionnellement pas partie des variétés italiennes (cf. Gross 2004 et Liver 2010). En faisant ainsi, on n'affirme absolument pas la réunion de ce romanche grison avec le ladin des Dolomites et le frioulan dans le sens d'une 'langue' commune; c'est justement pour ce concept (qui aujourd'hui n'est plus acceptable) que l'expression 'Rhéto-roman' a été forgé par la linguistique au 19ème siècle. Graziadio Isaia Ascoli a développé l'idée en tant que telle et a désigné cette langue comme 'ladino' en italien.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Rubrique onomasiologique  (Citer)

Afin de décomposer les concepts en catégories fonctionnelles, ceux-ci sont répartis en produits, processus, personnes, appareils et contenants. On peut les caractériser comme suit :

produits
Ils constituent une partie de la catégorie « produit » dans son sens le plus large, c’est-à-dire que le lait peut aussi faire partie de ce groupe. En outre, la crème, le petit-lait, tout comme les restes de fermentation sont aussi des produits, desquels on peut tirer de nouveaux produits :

processus
Par des processus, on tire d’un produit d’autres produits (par exemple petit-lait/ fromage blanc).
personnes
La plupart du temps, les personnes sont liées à des processus, comme par exemple le vacher.

appareils
Les personnes utilisent des appareils pour transformer les produits à travers un processus. L’appareil est utilisé pour porter un produit d’un état à un autre (par exemple, briser le lait caillé à l’aide d’une harpe à fromage). Lors de l’utilisation d’un appareil, une forme d’énergie, par exemple la force musculaire ou le courant électrique est toujours en jeu. La distinction avec le contenant n'est pas toujours précise. Un contenant destiné à un processus de maturation, ou bien encore à retirer le liquide d'un produit à l'aide de la pesanteur, représente ainsi également un appareil. Il en va ainsi pour les différentes formes de baratte de beurre. Elles contiennent certes la crème, or leur but n’est pas de la stocker, mais elles sont utilisées pour le processus suivant : séparer la crème en beurre et en petit-lait.

contenants







(auct. Markus Kunzmann)

Tags: Linguistique



Sémantique  (Citer)

La structuration digitale des données ('taux de numérisation D 3') permet une analyse sémantique différenciée des expressions linguistiques saisies, en effet synonymes, polysémies et homonymes se laissent représenter par ce qu'on appelle relations, grâce au lien entre « désignation » et 'concepts':


Graphique : Stephan Lücke
A la lumière des relations conceptuelles existantes, le profil sémantique synchrone d'une expression polysème peut être esquissé ; les formes de polysémie les plus importantes sont nommées comme suit :
- Taxinomique Forme de polysémie présente lorsqu’une expression désigne des concepts de manière hiérarchique, d’un point de vue aussi bien supérieur qu'inférieur.
- Méronymique Forme de polysémie présente lorsqu’une expression désigne aussi bien un fait complexe (‘le tout’) que les constituants de ce fait (‘la partie) ; c’est ainsi que l'ALPAGE, pour les paysans une partie importante de la montagne, est fréquemment désigné par le mot ‘montagne’ tout bonnement :




Désignation méronymique du concept ALPAGE comme partie de la montagne par transmission de la désignation du tout
Morpho-lex. Typ montagna 'Berg' (roa. f.) (16 Belege)
Morpho-lex. Typ monte (roa. m.) (67 Belege)
D’autre part, l’ALPAGE en tant que tout économique (avec tout ce qui lui est attaché) peut être désigné par des expressions qui ne sont normalement là que pour des composants de l’économie d’alpage :  
VA_ALM_Teil td colspan="2"> Désignation méronomique du concept d’ALPAGE comme un tout par transmission des désignations des composants
Morpho-lex. Typ cascina 'Sennhütte' (roa. f.) (1 Beleg)
Morpho-lex. Typ casera 'Sennhütte'  (roa. f.) (1 Beleg)
Morpho-lex. Typ cjampei 'Felder' (roa. m.) (2 Belege)
type morpho-lexical pascol 'Weide' (roa. m.) (1 Beleg)
type morpho-lexical pascolo 'Weide' (roa. m.) (1 trace)
- Métonymique Polysémie présente lorsqu’une expression désigne des concepts qui, à l’intérieur d’un seul et même ‘tout’, désignent différentes ‘parties’ : ainsi font partie de l'ALPAGE entre autres le BETAIL, les BATIMENTS (pour le personnel et pour le bétail), une BARRIERE, etc. Tous les composants susnommés peuvent être désignés dans différents dialectes romans par le type morpho-lexical roa. mandra : VA_mandra Significations métonymiques du type morpho-lexical roa. mandra
concept HABITATION D’ALPAGE (1 référence)
Concept ETABLE D‘ALPAGE (2 références)
concept TROUPEAU (15 références Sources)
concept ENCLOS A BOEUFS (3 références)
- Métaphorique Polysémie présente lorsqu’une expression désigne des concepts venant de différents domaines n'ayant pas de points communs entre eux. Le concept de CREME à lui seul est désigné par les métaphores ainsi que les comparaisons suivantes :
  1. en tant que 'tête': capo (roa. m.), (19 références), en outre capo di latte (roa.), mot à mot 'tête de lait'  (12 références), il capo del latte (roa.) (1 référence)
  2. en tant que ‘fleur’ : fleur / fiore (roa. m.) (15 références), fiora (roa. fem.) (17 références), dazu fiora cruda (1 référence), mot à mot  'fleure crue’, fiore di latte (roa.), mot à mot 'fleur de lait' (2 références)
  3. en tant que 'peau': Haut (gem. m.) (2 références), peau / pelle (roa. fem.) (1 référence), la pelle del latte (roa.) (1 référence)
  4. en tant que 'fourrure': pelliccia (roa. fem.) (2 références), fourrure (gem. m.) (4 références)
  5. en tant que 'brouillard': sbrumacje (roa. fem.) (2 références), sbrume (roa. m.) (11 références)
  6. en tant que 'mousse': écume / schiuma (roa. f.) (2 références), spuma (roa. fem.) (1 référence), spumacje (roa. fem.) (1 référence)
  7. en tant que 'toile': toile / tela (roa. m.) (14 références), en outre tela del latte (roa.) (1 référence) et tela di latte (roa.) (5 références), mot-à-mot  'toile de lait'
Le troisième type, 'peau', montre d’ailleurs très bien que les métaphores aussi peuvent être répandues au-delà des limites de familles linguistiques; en effet ici l'allemand Pelz et le roman pelliccia sont des représentants du même type de base, le latin pellīcia, forme féminine d’un adjectif dénominal du latin pellis 'Haut'.





 
    - Antonymique Polysémie présente lorsqu’une expression désigne des concepts qui s’opposent l’un l’autre.
Il va de soi qu’une expression peut aussi désigner plusieurs relations sémantiques différentes, comme les concepts liés dans différentes variations romanes avec le type base malg-  le montrent de manière exemplaire.





(auct. Thomas Krefeld – trad. Pierre Herrmann)

Tags: Linguistique



Strates  (Citer)

La linguistique diachronique (l'histoire de la langue) distingue deux configurations historiques (voir Krefeld 2003). Se basant toutes deux sur un espace géographique, elles partent de la langue parlée dans chaque région au moment de l'analyse; cette langue peut parfois être désignée par le mot ‘strate’ :
  • les langues parlées jadis dans l’espace d’analyse (‘couches anciennes’) sont appelées ‘substrats’ ; au cours de l’histoire, celles-ci ont été refoulées par la langue prise en considération, la strate ;
  • Les langues qui, de manière secondaire, par conquête, sont parvenues jusque dans le champ d’analyse, ayant eu durant un certain temps des interférences avec la langue prise en considération sont appelées ‘superstrats’ ; ces langues ne purent cependant pas refouler les langues interférées et disparurent d’elles-mêmes après un temps plus ou moins long, souvent à la suite de changements politiques. Ainsi par exemple, le superstrat allemand des régions romano-slaves de l’empire austro-hongrois a décliné avec la désintégration de cette forme étatique, après la Première guerre mondiale.

  • On ne parle donc de substrats et de superstrats qu’à posteriori, du point de vue d’une époque à laquelle ces langues ne sont plus parlées dans le secteur analysé; à cet égard, il faut parfois faire de grands sauts dans le temps, de sorte que l’on s’oriente sur les systèmes linguistiques pour y chercher des modifications induites par des contacts, c’est-à-dire que l’on cherche les résultats de ces contacts linguistiques. Pour véritablement comprendre l'apparition présumée d’un contact linguistique, la période historique de chaque bilinguisme, c’est-à-dire l’époque durant laquelle deux langues ont été parlées côte à côte et en même temps, reste décisive. Ces langues parlées au cours de la même période s’appellent des ‘adstrats’. Il faut cependant immanquablement prendre en compte une perspective synchronique qui ne peut être limitée aux ‘langues’ mais prend aussi en compte le ‘locuteur’ avec sa compétence spécifique et peut-être même l’expression concrète, le ‘parler’. Dans une perspective historique, cela est certes souvent impossible, mais il faut cependant y penser aussi en principe lors de la reconstruction de la Stratigraphie, car il faut apprécier différemment l’expression d’un locuteur bilingue de celle d’un locuteur monolingue.


    (auct. Thomas Krefeld – trad. Pierre Herrmann)

    Tags: Linguistique



    Stratigraphie  (Citer)

    Les Alpes sont une région de contacts linguistiques variés et ce depuis l'époque préhistorique. Ces contacts remontent à des configurations stratigraphiques très différentes (cf. Krefeld 2003). En principe, les langues entrant en contact dans une région de locuteurs (ou de communautés de locuteurs) plus ou moins bilingues sont appelées adstrats. Si un type de contact est répandu seulement dans une certaine région, comme par exemple dans les Alpes, et si ce type ne se retrouve pas ailleurs dans les familles linguistiques concernées, souvent ni la direction de l'emprunt, ni la langue d'origine ne seront claires (cf. le type de base roa. baita 'chalet de montagne' / ted. Beiz, Beisl 'buvette').
    Si la langue d'origine de l'élément emprunté n'est plus parlée dans la région de diffusion, on distingue deux configurations : dans le cas du substrat, la langue d'origine (la langue de substrat) était parlée dans la région de diffusion avant que la continuité de sa tradition orale n'ait été interrompue et que la langue dominante se soit imposée; le roman est la langue de substrat pour toutes les zones de la région alpine où l'on parle actuellement allemand et slovène. Les mots de substrat se distinguent souvent par une continuité régionale ou locale extraordinaire; ils survivent donc au remplacement de leur langue d'origine (la langue substratique) par les langues lui succédant. Dans le cas du superstrat, la langue d'origine a été dominante pendant une certaine période dans la zone de diffusion, sans s'y établir durablement. Ainsi, dans les parties de la région alpine où on parle aujourd'hui des les variétés romanes, des superstrats germaniques (le gotique, le lombard) prédominaient après l'effondrement de l'infrastructure romane; en Slovénie, l'allemand avait cette fonction de langue superstratique pendant la période des Habsbourg. Entre les trois familles linguistiques, des scénarios complètement différents se sont développés; eu égard à l'importance du contact linguistique pour l'histoire de l'espace linguistique, c'est surtout la chronologie de l'emprunt qui compte : par exemple la question de savoir si les emprunts romans dans les régions germaniques et slaves représentent de mots de substrat avec une continuité orale régionale depuis l'Antiquité ou d'emprunts plus récents de type adstratique. La même question vaut mutatis mutandis pour les germanismes dans la région romane et les slavismes dans la région germanophone.



    Les emprunts sont un indicateur fiable des divers processus d'acculturation historique; il méritent donc une analyse quantitative qui soit capable de documenter des effets d'accumulation locale.

    (auct. Thomas Krefeld – trad. Susanne Oberholzer)

    Tags: Linguistique



    Stratigraphie : romanismes  (Citer)

    "Romanismes“ désigne dans VerbaAlpina toutes les expressions retrouvées aujourd’hui dans la région de langue allemande et slave faisant l’objet de recherches. Les expressions viennent directement du roman et indirectement du latin voire des langues préromaines. A cet égard, il faut distinguer deux configurations géolinguistiques et historiques différentes, au regard de la stratigraphie régionale tout comme au regard de la vaste ‘architecture’ de l’allemand et du slovène.
    (1) Les romanismes exclusivement dialectaux
      Cette catégorie, à laquelle appartiennent les variantes locales sans correspondances dans la langue standard, constitue pour ainsi dire les emprunts romans prototypiques de l’espace alpin; il s’agit de mots substrats, c’est-à-dire d’expressions qui ont été empruntées à l’époque d’une cohabitation linguistique, selon le cas romano-germanique ou romano-slave, et qui ont survécu grosso modo en qualité de reliquat aux changements linguistiques futurs tendant vers un monolinguisme germanique ou slave. Le type morpho-lexical Käser, qui renvoie comme son équivalent roman casera à la base-type lat. casearia, en est un exemple clair.
    Voir carte.






    (2) Les romanismes dialectaux avec correspondance dans la langue standard et les dialectes romans du terrain de recherche
      Etant donné que, dans ce groupe tout comme dans le cas de (1), il y a eu une diffusion par aire géographique dépassant les frontières actuelles des familles linguistiques, on conçoit aisément que les variantes de la langue standard renvoient aux formes dialectales. Cette catégorie de romanismes peut de ce fait aussi revendiquer d’avoir un intérêt historico-linguistique au-delà de l’espace alpin. Un exemple clair et méconnu dans l’étymologie de l’allemand standard serait le mot allemand, féminin, Butter.
    La carte suivante montre clairement que la variante sud-allemande du masculin der Butter forme une aire commune avec le type roman également masculin butirro und beurre et qu’il doit de ce fait être considéré comme historiquement premier face à la variante standard féminine: voir carte.

    Ce cas de figure, de l’emprunt sud-allemand premier puis de sa diffusion dans l’allemand standard dans un second temps, semble cependant ne pas être toujours évident, dans la mesure où l'on doit aussi envisager la possibilité qu’il se soit diffusé à l’inverse, de l’allemand standard au dialecte du champ de recherche. C’est ainsi que l’on pourrait éventuellement voir les correspondants allemands du type de base lat. cellārium.
    Aussi bien dans le cas des romanismes exclusivement dialectaux que dans celui des romanismes de langues dialectales et standards, il faut distinguer dans le détail les reliquats locaux substrataux et les emprunts adstrataux avec des diffusions secondaires par aires.


    (auct. Thomas Krefeld – trad. Pierre Herrmann)

    Tags: Linguistique



    Stratigraphie et onomasiologie  (Citer)

    Certains domaines onomasiologiques ont des affinités évidentes avec les emprunts linguistiques; on trouve ainsi en allemand des types romans, voire préromains, pour certains concepts tirés du domaine de l’alpage, spécifiquement de la transformation du lait (voir les bases-types butyru(m), caseu(m), caseāria, crama, tegia, stabulum u. a.).
    Cela se passe à sens unique, dans la mesure où les techniques culturelles fondamentales correspondant à l’espace alpin sont très anciennes et ont été transmises à chaque ethnie arrivante et donc à sa langue. Mais cela serait bien évidemment trop simple de lier des parties déterminées du domaine onomasiologique au tout avec des ‘couches’ linguistiques déterminées. Il faut plutôt remarquer que justement ce sont aussi les emprunts qui sont attestés dans un sens opposé, et de là, il faut supposer un échange culturel réciproque s'inscrivant dans la durée. Les types de désignation complémentaire pour le concept de BEURRE sont à cet égard caractéristiques. Tandis que le type roman Butter s’est imposé dans le bavarois, le type allemand Schmalz est établi dans une partie du patois roman. Voir carte synoptique des bases-types butyrum und saindoux.

    Il semblerait donc que "laisser de côté" c’est-à-dire "faire fondre" (de là vient Schmalz) le beurre en tant que technique de conservation élémentaire se sont propagé vers le sud en partant de l’espace germanophone.
    Les types de désignation latins stabulu(m) et allemands Stall donnent une image comparable dans le cas d’un bâtiment d’alpage: Voir carte.



    (auct. Thomas Krefeld)

    Tags: Linguistique



    Transcription  (Citer)

    Les matériaux linguistiques sont rendus graphiquement de manière double afin de satisfaire les deux principes contraires de la fidélité à la source et de la comparabilité facile:

    (1) Version d'entrée dans la transcription originale

    Le portail de VerbaAlpina réunit des sources qui proviennent de traditions scientifiques différentes (philologie romane, allemande et slave) et qui représentent différentes phases historiques de la recherche dialectologique. Certains données lexicographiques ont été relevées au début du siècle dernier (GPSR) et d'autres il y a peu d'années (ALD) seulement. Pour cette raison, il est nécessaire du point de vue historique et épistémologique de respecter la transcription originale à quelques détails près. Pour des raisons techniques, il est pourtant impossible de maintenir intégralement certaines conventions; cela concerne en particulier les combinaisons verticales de caractère de base ('lettre') et signes diacritiques comme par exemple la superposition typographique d'un diacritique pour l'accent, d'un diacritique pour la durée, d'une voyelle et d'un diacritique pour la fermeture. Ces conventions sont transférées dans des séries linéaires de signes selon des transcriptions techniques définies pour chaque convention en utilisant exclusivement des caractères ASCII ("Beta code"). Jusqu'à un certain point, on peut profiter des ressemblances graphiques intuitivement compréhensibles entre les diacritiques originaux et les pendants ASCII choisis pour l'encodage beta; ces ressemblances sont mnémoniquement favorables.

    (2) Version de sortie en API

    Pour satisfaire la comparabilité et aussi le confort, il est souhaitable de rendre toutes les données dans une transcription uniforme. C'est pourquoi tous les beta codes seront transférés dans des caractères API au moyen de routines de remplacement spécifiques. On n'est confronté qu'à peu de problèmes, qui pourtant sont inévitables : par exemple si un caractère de base spécifié par des diacritiques dans la transcription d'entrée correspond à deux caractères de base différentes en API. Cela concerne surtout les degrés d'aperture des voyelles où par ex. deux caractères de base <i> e <e> combinés avec un point de fermeture et un ou deux crochets d'aperture permettent de représenter six degrés d'aperture dans la série palatale; dans l'encodage beta ce sont les suivants: i – i( – i((– e?-- e – e(– e((. Pour représenter cela, API n'offre que quatre caractères de base: i – ɪ – e – ɛ.

    (auct. Thomas Krefeld – trad. Susanne Oberholzer)

    Tags: Linguistique Technologie de l'information