Méthodologie

Tri

Montrer toutes les contributions

(no Tag)   Crowdsourcing   Dokumentation   Forschungslabor   Kooperation   Publikation  


Beta code  (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) qui a développé le concept correspondant au début des années soixante-dix pour la saisie électronique de textes en grec ancien avec des moyens de technique informatique d'alors, la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est désigné "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Tout d'abord, on distingue les caractères de bases des diacritiques lors de la transmission de la transcription phonétique utilisée dans l'atlas linguistique selon Böhmer-Ascoli dans des séquences composées par des caractères ASCII. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté par lui-même lors de la transmission (ce qui est entièrement le cas dans l'exemple présenté). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII spécial. L'affectation des diacritiques à des caractères ASCII est claire dans VerbaAlpina et elle est documentée dans des tableaux de la base de données VerbaAlpina. Le choix de l'affectation est guidé par le principe de la ressemblance optique autant que possible. Ainsi dans l'exemple mentionné, la coche sous l'u dans la parole tu est rendue par une parenthèse ouvrante: tu(. Les diacritiques sont écrits en partant des leur disposition près le caractère de base dans l'ordre de bas en haut et de gauche à droite après le caractère de base. En raison du principe de la ressemblance optique l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d.: même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche est rendue malgré tout en les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques pour chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d.: le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a un nombre d'avantages:
- la saisie des données peut être fait sur des claviers standard traditionnels à relativement grande vitesse et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissances de systèmes de transcription phonétique;
- n'importe quel caractère respectivement diacritique peut être saisi, indépendamment s'il est codé dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque n'importe quel autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent se passer éventuellement; celles-ci sont pourtant crées par l'essence des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée qui n'est pas prévue dans le système API.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)




Tags: Dokumentation Kooperation Forschungslabor



Carte synoptique  (Citer)

Cette fonction permet à l'utilisateur de choisir un certain nombre de cartes seules disponibles selon ses propres intérêts et de les fixer dans des cartes combinées synoptiques. De cette manière on peut visualiser les zones de diffusion de n'importe quelle caractéristique linguistique et extralinguistique en relation. En même temps, on a la possibilité de fixer ces cartes synoptiques en niveaux de zoom différents si un contexte local, comme par ex. le massif des Karwendel ou le continuum dialectal occitan-franco-provençal-piémontais des Alpes occidentales, doit être manifesté.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Dokumentation Kooperation Forschungslabor



Cartographie  (Citer)

La cartographie est un instrument de la géolinguistique qui peut-être n'est pas sans contredit, mais bien éprouvée car elle sert au même titre à la documentation et à la visualisation des relations spatiales (cf. les contributions dans Lameli 2010). Il y a deux techniques traditionelles qui se distinguent nettement par leur précision. Dans le cas de cartes 'analytiques', des énonciations linguistiques (partielles) sont rendues de telle façon que la documentation est mise en relief tandis que l'interprétation des relations spatiales doit être faite par l'utilisateur. Dans le cas des cartes synthétiques, les relations spatiales entre les foemes énonccée sont exprimées directement par la symbolisation. Les cartes quantitatives sont nécessairement synthétiques. La cartographie en ligne propose une combinaison des deux procédures en présentant à première vue des cartes 'synthétiques', mais en offrant aussi l'accès aux énonciations (partielles) avec un clic sur le symbole.
Le potentiel heuristique de ce type de cartographie est considérable : on offre à l'utilisateur de VerbaAlpina l'option de combiner et cumuler des classes de données différentes soit d'une seule catégorie (par ex. plusieurs types de base), soit de plusieurs catégories (par ex. des données linguistiques et extralinguistiques) au moyen des cartes synoptiques.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Dokumentation Forschungslabor



Couche d'accès aux données  (Citer)

L'accès au module VA_DB permet la recherche directe dans les données primaires du projet. Ce sont ou des hommes (par le module VA_WEB) ou des machines respectivement des programmes qui utilisent cet accès. Le deuxième scénario se fait par exemple pour la communication entre le module VA_WEB e VA_CB à l'intérieur du projet, mais aussi pour les accès automatiques, par exemple par des ordinateurs ou des programmes des partenaires projet VA. Au cours des travaux de développement des modules VA_WEB et VA_DB il est souvent nécessaire – du point de vue de l'informatique ou bien de la programmation – de changer des structures de données actuelles et de les adapter aux nouvelles exigences. Cela peut conduire à désarroi dans le cas de l'accès par un homme; dans le cas de l'accès par une machine ou bien un programme le résultat est simplement un dysfonctionnement. Pour remédier à ce problème, on insert dans la VA_DB une structure de données – au moins en grande partie – stable dans laquelle les structures de données primaires qui sont variables peuvent être projetées.

(auct. Stephan Lücke – trad. Susanne Oberholzer)

Tags: Kooperation Publikation Forschungslabor



Domaine de fonction (5): laboratoire de recherche  (Citer)

Il est prévu de créer un laboratoire de recherche virtuel qui invite tous les utilisateurs intéressés à utiliser de façon personnalisée les outils géolinguistiques développés par VerbaAlpina (entre autres des représentations sous forme de cartes différentes, niveaux de réduction à types) et à présenter des analyses et résultats nouveaux, peut-être même alternatifs. Les outils peuvent bien évidemment aussi être développés par les utilisateurs.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Forschungslabor



Modélisation des données  (Citer)

voir Modèle relationnel.

Tags: Dokumentation Kooperation Forschungslabor



Rassembler et trier  (Citer)

Les catégories qui peuvent être choisies sur la 'carte interactive' offrent souvent déjà de nombreuses expressions linguistiques. Ainsi la recherche du 'concept' BEURRE (cf. l'illustration suivante) a 1149 attestations pour résultat. C'est pourquoi la plate-forme permet de rassembler et trier toutes les expressions pertinentes selon des critères différents:





Un tri d'après des types de base montre des superficies de diffusion qui dépassent les frontières linguistiques. Voilà un exemple du type roman butyru(m) dans les régions germaniques et du type allemand Schmalz dans les régions romaines.

SCHMALZ_BUTYRU
  • type de base Schmalz (111 attestations)
  • type de base butyru(m) (913 attestations)

Il y a une option correspondante pour la recherche des types morph-lexicaux; le tri d'après le critère 'concept' est intéressant aussi indépendamment de la région linguistique considérée parce qu'il montre la polysémie de chaque expression. Voilà deux captures d'écran de la manière de procéder pour l'exemple de malga:





Les significations suivantes qui sont en relation clairement métonymiques entre eux en résultent:



Polysémie du type morpho-lexical malga

Tags: Dokumentation Forschungslabor



Stratigraphie  (Citer)

Les Alpes sont une région de contacts linguistiques variés depuis l'époque préhistorique. Ils remontent à des configurations stratigraphiques très différentes (cf. Krefeld 2003). En principe, les langues qui sont en contact dans une région parce qu'il y a des locuteurs ou même des communautés de locuteurs plus ou moins bilingues sont désignées adstrats. Si un type de contact est répandu seulement dans une certaine région, comme par exemple dans les Alpes, et si ce type ne se retrouve  pas ailleurs dans les familles linguistiques concernées, souvent ni la direction de l'emprunt, ni la langue d'origine ne sont claires (cf. le type de base rom. baita 'chalet de montagne' / ted. Beiz, Beisl 'buvette').
Si la langue d'origine de l'emprunt n'est plus parlée dans la région de diffusion ou dans une partie de elle-ci, on distingue deux configurations: dans le cas du substrat, la langue d'origine (la langue de substrat) était parlée dans la région de diffusion avant que la continuité de sa tradition orale ait été interrompu et la langue dominante se soit imposée; le roman est la langue de substrat pour toutes les parties de région alpine où parle actuellement allemand et slovène. Les mots de substrat se distinguent souvent par une continuité régionale ou locale extraordinaire; ils survivent donc le remplacement de leur langue originaire (la langue substratique) par les langues succédantes,  Dans le cas du superstrat, la langue d'origine dominait pendant une certaine période dans la région de diffusion sans s'y établir pourtant durablement. Comme ça, dans des parties de la région alpine où on parle aujourd'hui des les variétés romanes, des superstrats germaniques (le gotique, le lombard) prédominaient après l'effondrement de l'infrastructure romane; en Slovénie, l'allemand avait cette fonction de langue superstratique pendant la période des Habsbourg. Entre les trois familles linguistiques, des scénarios complètement différents se sont développés; eu égard à l'importance du contact linguistique pour l'histoire de l'espace linguistique c'est surtout la chronologie de l'emprunt qui compte : par exemple la question de savoir si les emprunts romans dans les régions germaniques et slaves représentent de mots de substrat avec une continuité orale régionale depuis l'Antiquité ou d'emprunts plus récents de type adstratique? La même question vaut mutatis mutandis pour les germanismes dans la région romane et les slavismes dans la région germanophone.



Les emprunts sont un indicateur fiable des divers processus d'acculturation historique; il méritent donc une analyse quantitative qui soit capable de documenter des effets d'accumulation locale.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Dokumentation Kooperation Forschungslabor