Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


Rassembler et trier (Citer)

Les catégories qui peuvent être choisies sur la 'carte interactive' offrent souvent déjà de nombreuses expressions linguistiques. Ainsi la recherche du 'concept' BEURRE a par exemple 1748 attestations pour résultat. C'est pourquoi la plate-forme permet de rassembler et trier toutes les expressions pertinentes selon des critères différents: voir concept BEURRE

Un tri d'après des types de base montre des superficies de diffusion qui dépassent les frontières linguistiques. Voilà un exemple du type roman butyru(m) dans les régions germaniques et du type allemand Schmalz dans les régions romaines: Voir carte.

Il y a une option correspondante pour la recherche des types morpho-lexicaux; le tri d'après le critère 'concept' est intéressant aussi indépendamment de la région linguistique considérée parce qu'il montre la polysémie de chaque expression (voir type morpho-lexical malga).

Les significations suivantes qui sont en relation clairement métonymiques entre eux en résultent: Voir carte Polysémie du type morpho-lexical malga.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Réduction à types (Citer)

La réduction à types des données géoréférenciées fait partie des exigences fondamentales de VerbaAlpina. Où possible, dans une première étape des tokens ('mots individuels') sont extraits des données d'entrée après la transcription et sont inscrits dans la case de base de données du même nom.

Le point de mire de VerbaAlpina est la réduction à types morphologique des matériaux linguistiques rassemblés. Un type morphologique est défini par l'unanimité des propriétés suivantes: famille linguistique – partie du discours – mot simple versus mot affixé – genre – type de base lexical. La forme indiquée du type morphologique s'oriente aux lemmes correspondants de certains dictionnaires sélectionnés (voir ci-dessous).

Par l'attribution à un type de base lexical commun, l'union de tous les types morpho-lexical associés devient claire – même par-dessus des frontières linguistiques. Ainsi les noms et verbes suivants (qui ne sont pas décrits en détail ici) peuvent être attribués à un seul type de base malga (ALPAGE, TROUPEAU), malgaro (VACHER), malghese (BERGER), immalgare (ENALPER), dismalgare (DÉSALPER). Toutefois, le type de base lexical en dit peu rien sur l'histoire de parole d'un seul type morpho-lexical: on doit faire ressortir chaque fois séparément si un type avec étymon latin-roman qui aujourd'hui est attesté dans la région linguistique germanique ou slave, comme par exemple slovène baita 'maison simple', remonte à substrat local ancien ou bien à contact linguistique roman plus récent. Pour cette raison, la désignation "étymon" qui fait de principe référence au stade historique immédiatement préliminaire d'une parole est évitée dans ce contexte, même si le type de base lexical correspond en beaucoup de cas à l'étymon d'un type morpho-lexical.

Les types morpho-lexicaux forment la catégorie directrice dans la gestion des données linguistiques; ils sont comparables aux lemmes de la lexicographie. Au moyen des critères susnommés robustes et bien mesurables on peut réduire par ex. les quatre types phonétiques barga, bark, margun, bargun avec le sens CHALET DE MONTAGNE, ÉTABLE D'ALPAGE à trois types morphologiques.





L'appartenance des types morpho-lexicaux à des familles linguistiques (gem., roa., sla.) dépend de la source correspondante; elle résulte dans le cas des données d'enquêtes traditionnelles d'atlas ou de dictionnaires automatiquement des informateurs correspondants et est notée corrélativement dans la banque de données. Dans le cas des données que VerbaAlpina même relève par crowdsourcing l'appartenance linguistique ou bien dialectale est prétendue par les informateurs et est confirmée quantitativement dans le meilleur des cas. Le nombre d'informateurs confirmants devient ainsi un instrument de la validation de données.

Des types morpho-lexicaux sont limités à une famille linguistique. La question qui se pose avec cela est la suivante: par quelle forme un type morpho-lexical devrait être représenté dans la zone de recherche de la carte interactive? Eu égard à la famille linguistique germanique et slave la réponse est plutôt facile parce que les deux sont représentées chacune par une seule langue standardisée ('Deutsch' [deu] respectivement 'Slowenisch' [slo]). Les types morpho-lexicaux peuvent être rendus sous la forme de leur variantes standard, évidemment à condition que des correspondances de ce type existent dans la langue standard. Ainsi, par exemple, tous les types phonétiques correspondants de l'alémanique et du bavarois qui sont des variantes de la forme standard 'fromage' peuvent être appelées par cette forme standard. Si des variantes standard n'existent pas, on prend les lemmes des grands dictionnaires de références (Idiotikon, WBÖ) à titre d'exemple.

Au cas de la famille linguistique romane la situation est beaucoup plus complexe à cause des nombreuses langues petites qui ne sont pas assez standardisées. Par des raisons pragmatiques on a choisi la solution suivante: tous les types morpho-lexicaux sont représentés par les formes standard françaises et italiennes, si existantes. Ainsi tous les types phonétiques qui sont variantes de par ex. beurre/burro peuvent être appelées par ces deux formes. Les dictionnaires TLF et Treccani font office de dictionnaires de références. Si seulement une de ces deux langues standard présente une variante convenable, c'est celle-ci qui apparaît, comme dans le cas de ricotta (l'appartenance à l'italien est signalée par la convention de notation -/ricotta). S'il n'y a aucune variante du type dans les deux langues de références romanes, on recourt à l'entrée d'un dictionnaire de références dialectal, comme par ex. le LSI. Au cas où il n'existe aucune entrée dans les dictionnaires dialectaux, VerbaAlpina propose un type de base qui est représenté graphiquement par le sigle 'VA'.

Il est prévu aussi la réduction à types phonétiques des matériaux linguistiques ; cette étape de travail est pourtant secondaire est n'est pas faite de façon cohérente. La catégorie correspondante est indispensable surtout à cause des atlas linguistiques et des dictionnaires qui documentent parfois exclusivement (par ex. SDS, VALTS) des types phonétiques. Lors de la réduction à types phonétiques faite par VerbaAlpina, les tokens sont classés selon les critères de la phonétique historique dans des types phonétiques (case de base de données 'phon_typ'); une automatisation de la réduction à types phonétiques sur la base d'algorithme Levenshtein et soundex sera examinée et, si possible, appliquée.

Par la réduction à types (constitution de classes) la diversité de données devient plus claire; il est valable en règle générale: nombre des tokens > nombre des types phonétiques > nombre des types morpho-lexicaux > type de base. On note le cas extrême d'une seule attestation (hapax): l'attestation correspond à un token, un type phonétique et un type morpho-lexical comme seul représentant d'un type de base. Il est éventuellement raisonnable de filtrer ces formes d’hapax de la représentation.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Référent (Citer)

Au sein du triangle des catégories linguistiques reliées entre elles « Désignation » – « Concept » – « Référent », la dernière désigne la substance individuelle d’un concept, qui par essence, est toujours abstraite, en d’autres mots un élément concret et individuel. Parmi le matériau de VerbaAlpina, on rencontre la plupart du temps des référents permettant une représentation imagée (dessin ou photographie). En comparaison des désignations et des concepts, les référents jouent un rôle de moindre importance dans le programme VerbaAlpina. Dans le cadre du "Crowdsourcings" surtout, les représentations des référents , la plupart du temps des photos, sont utilisées en même temps comme « outils de travail » afin de rendre saisissables, pour ceux qui désirent s’informer, les descriptions conceptuelles de temps à autre nécessairement compliquées.

(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Linguistique



Région étudiée (Citer)

"Une historie globale et cohérente des Alpes n'est pas encore réalisable à l'heure actuelle" (http://www.hls-dhs-dss.ch/textes/f/F8569.php), plutôt des définitions différentes, "naturräumliche" et "wirtschaftlich-politische" (traduction: définitions géophysiques et politico-économiques, cf. Bätzing 1997, 23 s.) sont en concurrence. Dans le sens d'une délimitation transparente et pragmatique, la région étudiée de ce projet correspond au domaine d'application clairement défini de la Convention alpine; on a été prêt à accepter les "Inkonsistenzen zwischen den Mitgliedstaaten" (traduction: les inconsistances entre les États membres, cf. Bätzing 1997, 31) y fixées. Elles concernent les Préalpes bavaroises (incluses), "grössere randalpine Gebiete wie das Emmental oder das Zürcher Oberland" (traduction: des zones plus grandes au bord des Alpes comme l'Emmental ou l'Oberland zurichois, (Bätzing 1997, 32), exclues) ainsi que le maniement de quelques villes plus importantes au bord des Alpes: Lucerne et Salzbourg y sont incluses, Graz et Biella sont par contre exclues. Le périmètre de la Convention alpine peut être téléchargé ici. Le but d'origine du projet est pourtant de recenser les Alpes dans ce cadre formellement fixé comme espace linguistique-culturel et de représenter la similarité des lieux qui en font partie.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Repositoria (Citer)

Le concept de „Repositorium“ n’a pas été jusqu’ici suffisamment et clairement défini, en particulier, la limite qui le sépare du concept d’ « archive » est floue. En principe, on entend par Repositorium dans le domaine digital, des systèmes de sauvegarde pensés pour une conservation de longue durée des données. Dans le champ scientifique, les Repositoria sont administrées la plupart du temps par des institutions publiques qui ont de plus en plus la charge de sauvegarder des données liées à la recherche. Les avantages les plus importants d’un repositorium sont : la sécurité physique des données à conserver tout comme le maintien de leur intégrité, le stockage pérenne par l’institution en charge du repositorium, la documentation concernant le contenu, la structure et l’encodage des données sauvegardées tout comme le fait qu’elle soient disponibles tout le temps, quel que soit le lieu. Du point de vue des sciences humaine, le Clarin D-Verbund ainsi que le Textgrid-Repositorium jouent actuellement (2016) en Allemagne un rôle particulièrement important.
VerbaAlpina s’efforce de consigner toute version VA dans un ou plusieurs repositoria.


(auct. Stephan Lücke)

Tags: Page Web



Représentation quantifiée (Citer)

[Remarque préliminaire: l’article suivant est lié en partie aux fonctionnalités de VA_WEB qui sont encore actuellement en travaux et qui ne sont pas encore accessible au public actuellement.

La carte interactive de VerbaAlpina permet, à côté d’une cartographie qualitative, également une visualisation de données agrégées dans le sens d’une représentation quantifiable des données dans l’espace. L’agrégation s’oriente toujours à cet égard sur des régions géographiques. L’utilisateur a le choix entre une agrégation sur la base d’une surface communale (petit espace), les soit- disant régions NUTS-3 (espace moyen) et enfin les régions de diffusion des trois grandes familles linguistiques germano-roman-slave (grand espace). En outre, il y a la possibilité de définir à volonté les surfaces communales comme des régions individuelles qui ensuite fonctionnent inversement comme des valeurs de référence de l’agrégation. Une toute dernière option peut agir contre des effets déformants qui résultent dans la perspective d’une agrégation au-delà des surfaces administratives et ainsi dans la perspective de la linguistique des régions communales ou bien des régions NUTS-3. Dans des cas particuliers, cette procédure correspondante peut bien entendu n’être qu’heuristique, l’utilisateur a cependant la possibilité de sauvegarder les cohérences régionales qu’il aura découvertes comme étant éloquentes, de les commenter, de les réutiliser et de les mettre à disposition de la communauté.
En relation avec les régions choisies, respectivement avec les surfaces, l’ensemble des données qualitatives choisies jusqu’à l’activation de la représentation quantitative sont agrégées. Grandeur et rendu des couleurs de chaque symbole cartographique sont corrélés à cet égard avec le nombre des données qualitatives singulières focalisées sur un symbole à chaque fois. La valeur maximale fondée de manière arithmétique, par l’accès duquel un symbole contient toujours une grandeur maximale et un rendu des couleurs, correspond à cet égard de manière standard la quantité la plus grande en matière de données agrégées, qui apparaît dans l’une des surfaces, respectivement des régions choisies. Cette valeur de référence maximale peut être appliquée à souhait sur l’ensemble des données agrégées prise une par une, ce qui conduit à une modification de la représentation cartographique.
Lorsque la fonction quantification est activée, on peut extraire des données quantitatives, par désactivation de chaque entrée dans une liste dans la légende de la carte, les données qualitatives correspondantes ou bien ajouter d’autres données par un autre choix.
A côté de la quantification d’une carte géo-référencée qui reproduit les tracés frontaliers en temps réel, VerbaAlpina permet également la représentation de données quantifiées sur une carte dénommée « en alvéoles ». Son modèle est un dessin Wikipedia qui visualise les résultats des élections britanniques à la Chambre des Communes de 2015. Sur celle-ci, on a d’abord restitué fidèlement la carte en ses points, distances et angles (celle-ci désigne la « carte géographique ») avec les résultats des élections dans chaque circonscription. Au final, on y représente une carte en alvéoles sur laquelle chaque circonscription est figurée par un hexagone de grandeur identique.




Source : https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Source : https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (demandées le 03.11.2016)
La confrontation des deux types de cartes montre leurs avantages et inconvénients respectifs. La carte en alvéoles renvoie à des imprécisions géographiques, respectivement même à des informations erronées. On reconnaît ainsi par exemple dans le district Greater London une alvéole rouge isolée qui se trouve entourée d’alvéoles bleues imposantes – un fait anodin mais qui ne trouve pas de preuve sur la carte géographique. D’un autre côté, la carte en alvéoles possède l’avantage de mieux visualiser les relations réelles entre les chiffres, par chaque couleur, étant donné que, sur la carte géographique, une multitude de toute petites circonscriptions du point de vue de la surface sont perçues par l’observateur comme inférieurs, bien que leur importance politique est mise sur le même plan que celle des grands districts d’un point de vue de la surface. C’est ainsi que les deux types de cartes se complètent et leur véritable plus-value réside dans la possibilité de pouvoir consulter les deux cartes et de confronter leur visualisation.
La carte alvéolaire de VerbaAlpina se distingue du fait qu’elle représente l’ensemble des communes politiques de l’espace alpin par de grands hexagones de taille identique à chaque fois. A cet égard, on cherche, à peu près, à conserver au moins la logique géographique. Le calcul du rendu des couleurs des hexagones pris un par un s’ensuit de la même manière que sur la carte à points. L’avantage d’une telle carte alvéolaire consistant, contrairement à une simple coloration des surfaces communales, en une carte géo-référencée, est que les effets suggestifs sont mis au second plan par rapport aux grandeurs variables des surfaces communales.


(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Technologie de l'information Page Web



Rhéto-roman (Citer)

Conformement à la Constitution fédérale de la Confédération suisse, l'expression allemande 'Rätoromanisch' (version française de la Constitution: 'romanche') est utilisée dans le projet VerbaAlpina pour les variétés romanes du Canton des Grisons qui traditionnellement ne font pas partie des variétés italiennes (cf. Gross 2004 et Liver 2010). En faisant ainsi, on n'affirme pourtant absolument pas l'union de ce romanche grison avec le ladin des Dolomites et le frioulan dans le sens d'une 'lange' commune; c'est justement pour ce concept (qui aujourd'hui n'est plus acceptable) que l'expression 'Rhéto-roman' a été forgé par la linguistique au 19ème siècle. Graziadio Isaia Ascoli a développé l'idée en tant que telle et a désigné cette langue comme 'ladino' en italien.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Rubrique onomasiologique (Citer)

Pour décomposer les concepts en catégories fonctionnelles, ceux-ci sont répartis en produits, processus, personnes, appareils et contenants. On peut les caractériser comme suit :

produits
Ils constituent une partie de la catégorie « produit » dans son sens le plus large, c’est-à-dire que le lait peut aussi faire partie de ce groupe. En outre, la crème, le petit-lait, tout comme les restes de fermentations sont aussi des produits, desquels on peut tirer de nouveaux produits :

processus
Par des processus, on tire d’un produit d’autres produits (par exemple petit-lait/ fromage blanc).
personnes
La plupart du temps, les personnes sont liées à des processus, comme par exemple le vacher.
appareils
Les personnes utilisent des appareils, pour transformer les produits au cours d’un processus. L’appareil est utilisé pour porter un produit d’un état à un autre (par exemple pour briser le lait caillé à l’aide d’une harpe à fromage). Lors de l’utilisation d’un appareil, une forme d’énergie, par exemple la force musculaire ou le courant électrique est toujours en jeu. La sélectivité d’un contenant n’est pas toujours donnée. Un contenant qui est destiné à un processus de maturation ou bien qui est retiré avec le liquide par la pesanteur d’un produit, par exemple la masse de fromage, représente ainsi également un appareil. C’est la même chose concernant les différentes formes des tonneaux à beurre. Ils contiennent certes la crème, mais leur but n’est pas qu’ils soient entreposés, mais qu’ils soient utilisés pour le processus suivant : séparer la crème en beurre et en petit-lait.
contenants







(auct. Markus Kunzmann)