Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


Rassembler et trier  (Citer)

En sélectionnant une catégorie sur la 'carte interactive', on obtient souvent déjà de nombreuses expressions linguistiques : la recherche du 'concept' BEURRE a par exemple 1748 attestations pour résultat. Pour cette raison, la plate-forme permet de rassembler et de trier toutes les expressions pertinentes selon des critères différents: voir concept BEURRE

Un tri d'après des types de base montre des superficies de diffusion dépassant les frontières linguistiques. Voilà un exemple du type roman butyru(m) dans les régions germaniques et du type allemand Schmalz dans les régions romaines: Voir carte.

Une option correspondante s'obtient via la recherche par types morpho-lexicaux; le tri d'après le critère 'concept', montrant la polysémie de chaque expression (voir type morpho-lexical malga), est aussi intéressant indépendamment de la région linguistique considérée.
Les significations suivantes, clairement en relation métonymiques entre elles, en résultent: Voir carte Polysémie du type morpho-lexical malga.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Page Web



Réduction à types  (Citer)

La réduction à types des données géoréférenciées fait partie des exigences fondamentales de VerbaAlpina. Là où c'est possible parmi les données d'entrées étant déjà passées par la retranscription, une première étape de la réduction à types sera l'extraction de tokens ('mots individuels'), ils sont alors inscrits dans la case de base de données du même nom.

Le point de mire de VerbaAlpina est la réduction à types morphologiques des matériaux linguistiques rassemblés. Un type morphologique est défini par la concordance des propriétés suivantes: famille linguistique – partie du discours – mot simple versus mot affixé – genre – type de base lexical. La forme indiquée du type morphologique s'oriente aux lemmes correspondants de certains dictionnaires sélectionnés (voir ci-dessous).

Par l'attribution à un type de base lexical commun, l'union de tous les types morpho-lexicaux associés devient claire – même au delà des frontières linguistiques. Ainsi les noms et verbes suivants (qui ne sont pas décrits en détail ici) peuvent être attribués à un seul type de base malga (ALPAGE, TROUPEAU), malgaro (VACHER), malghese (BERGER), immalgare (ENALPER), dismalgare (DÉSALPER). Toutefois, le type de base lexical en dit peu rien sur l'histoire de parole d'un seul type morpho-lexical: on doit faire ressortir chaque fois séparément si un type avec étymon latin-roman aujourd'hui attesté dans la région linguistique germanique ou slave (par exemple slovène baita 'maison simple') remonte à un substrat local ancien ou bien à un contact linguistique roman plus récent. Pour cette raison, la désignation "étymon", faisant référence au stade historique immédiatement préliminaire d'un mot, est évitée dans ce contexte, même si le type de base lexical correspond en beaucoup de cas à l'étymon d'un type morpho-lexical.

Les types morpho-lexicaux forment la catégorie directrice dans la gestion des données linguistiques; ils sont comparables aux lemmes de la lexicographie. Au moyen des critères susnommés, résistants et bien mesurables, on peut réduire par ex. les quatre types phonétiques barga, bark, margun, bargun avec le sens CHALET DE MONTAGNE, ÉTABLE D'ALPAGE à trois types morphologiques.





L'appartenance des types morpho-lexicaux à des familles linguistiques (gem., roa., sla.) dépend de la source correspondante; dans le cas des données d'enquêtes traditionnelles d'atlas ou de dictionnaires, elle résulte automatiquement des informateurs correspondants et sera notée corrélativement dans la banque de données. Dans le cas des données que VerbaAlpina relève par crowdsourcing, l'appartenance linguistique ou bien dialectale est affirmée par les informateurs et sera confirmée quantitativement dans le meilleur des cas. Le nombre d'informateurs concordants devient ainsi un instrument de la validation de données.

Les types morpho-lexicaux sont limités à une famille linguistique. La question qui se pose alors est la suivante : sous quelle forme un type morpho-lexical devrait être représenté dans la zone de recherche de la carte interactive? Eu égard à la famille linguistique germanique et slave la réponse est plutôt facile parce que les deux sont représentées chacune par une seule langue standardisée ('Deutsch' [deu] et 'Slowenisch' [slo]). Les types morpho-lexicaux peuvent être rendus sous la forme de leur variante standard, évidemment à condition que des correspondances de ce type existent dans la langue standard. Ainsi, par exemple, tous les types phonétiques correspondants de l'alémanique et du bavarois étant des variantes de la forme standard 'fromage' peuvent être appelées par cette forme standard. Si des variantes standard n'existent pas, les lemmes des grands dictionnaires de références (Idiotikon, WBÖ) seront pris à titre d'exemple.

Dans le cas de la famille linguistique romane, la situation est beaucoup plus complexe à cause des nombreuses plus petites langues qui ne sont parfois pas suffisamment standardisées. Par des raisons pragmatiques, la solution suivante a été choisie : tous les types morpho-lexicaux sont représentés par les formes standard françaises et italiennes, si existantes. Ainsi tous les types phonétiques variantes de par ex. beurre/burro peuvent être appelées par ces deux formes. Les dictionnaires TLF et Treccani font office de dictionnaires de référence. Si seulement une de ces deux langues standard présente une variante convenable, c'est celle-ci qui apparaît, comme dans le cas de ricotta (l'appartenance à l'italien est signalée par la convention de notation -/ricotta). S'il n'y a aucune variante du type dans les deux langues de références romanes, on recourt à l'entrée d'un dictionnaire de références dialectal, comme par ex. le LSI. Au cas où il n'existe aucune entrée dans les dictionnaires dialectaux, VerbaAlpina propose un type de base qui est représenté graphiquement par le sigle 'VA'.

La réduction à types phonétiques des matériaux linguistiques est aussi prévue; cette étape de travail est pourtant secondaire est n'est pas faite de façon cohérente. La catégorie correspondante est indispensable surtout à cause des atlas linguistiques et des dictionnaires qui documentent parfois exclusivement (par ex. SDS, VALTS) des types phonétiques. Lors de la réduction à types phonétiques faite par VerbaAlpina, les tokens sont classés selon les critères de la phonétique historique dans des types phonétiques (case de base de données 'phon_typ'); une automatisation de la réduction à types phonétiques sur la base d'algorithme Levenshtein et soundex sera examinée et, si possible, appliquée.

Par la réduction à types (constitution de classes) la diversité des données devient plus claire; en règle générale: nombre des tokens > nombre des types phonétiques > nombre des types morpho-lexicaux > type de base. On note le cas extrême d'une seule attestation (hapax): l'attestation correspond à un token, un type phonétique et un type morpho-lexical comme seul représentant d'un type de base. Il peut éventuellement être raisonnable de filtrer ces formes d’hapax de la représentation.


(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique



Référent  (Citer)

Au sein du triangle des catégories linguistiques reliées entre elles « Désignation » – « Concept » – « Référent », la dernière désigne la substance individuelle d’un concept, qui par essence, est toujours abstraite, en d’autres mots un élément concret et individuel. Parmi le matériau de VerbaAlpina, on rencontre la plupart du temps des référents permettant une représentation imagée (dessin ou photographie). En comparaison des désignations et des concepts, les référents jouent un rôle de moindre importance dans le programme VerbaAlpina. Dans le cadre du "Crowdsourcings" surtout, les représentations des référents, la plupart du temps des photos, sont utilisées en même temps comme « outils de travail » afin de rendre saisissables, pour ceux qui désirent s’informer, les descriptions conceptuelles de temps à autre nécessairement compliquées.

(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Linguistique



Région étudiée  (Citer)

"Une histoire globale et cohérente des Alpes n'est pas encore réalisable à l'heure actuelle" (http://www.hls-dhs-dss.ch/textes/f/F8569.php), ce sont plutôt des définitions différentes, "naturräumliche" (géophysiques) et "wirtschaftlich-politische"(politico-économiques cf. Bätzing 1997, 23 s.) qui sont en concurrence. Dans le sens d'une délimitation transparente et pragmatique, la région étudiée de ce projet correspond au domaine d'application clairement défini de la Convention alpine; on en a accepté les "Inkonsistenzen zwischen den Mitgliedstaaten" (traduction: les inconsistances entre les États membres, cf. Bätzing 1997, 31). Ces inconsistances concernent les Préalpes bavaroises (incluses), les grandes zones touchant les Alpes comme l'Emmental ou l'Oberland zurichois, (Bätzing 1997, 32), exclues) ainsi que le traitement de quelques villes importantes en périphérie des Alpes: Lucerne et Salzbourg sont incluses, par contre Graz et Biella sont exclues. Le périmètre de la Convention alpine peut être téléchargé ici. Le but d'origine du projet est pourtant de recenser les Alpes dans ce cadre formellement fixé comme espace linguistique-culturel et de représenter la similarité des lieux qui en font partie.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Contexte extralinguistique



Repositoria  (Citer)

La notion de „Repositorium“ n’a pas été jusqu’ici suffisamment et clairement définie, la limite qui la sépare du concept d’ « archive » notamment est floue. En principe, dans le domaine numérique on entend par repositorium un système de sauvegarde pensé pour une conservation de longue durée des données. Dans le domaine scientifique, les repositoria sont administrés la plupart du temps par des institutions publiques qui, de plus en plus reçoivent la charge de sauvegarder les données liées à la recherche. Les avantages les plus notables d’un repositorium sont : la sécurité physique des données à conserver et le maintien de leur intégrité, le stockage pérenne par l’institution en charge, la documentation concernant le contenu, la structure et l’encodage des données sauvegardées tout comme le fait qu’elle soient disponibles à tout moment, quel que soit le lieu. Au niveau des sciences humaines, le Clarin D-Verbund ainsi que le Textgrid-Repositorium jouent actuellement (2016) en Allemagne un rôle particulièrement important.
VerbaAlpina s’efforce de consigner toute version VA dans un ou plusieurs repositoria.


(auct. Stephan Lücke)

Tags: Page Web



Représentation quantifiée  (Citer)

[Remarque préliminaire: l’article suivant est lié en partie aux fonctionnalités de VA_WEB qui sont encore actuellement en travaux et qui ne sont pas encore accessibles au public]

La carte interactive de VerbaAlpina permet, à côté d’une cartographie qualitative, également une visualisation de données agrégées dans le sens d’une représentation quantifiable des données dans l’espace. L’agrégation s’oriente toujours à cet égard sur des régions géographiques. L’utilisateur a le choix entre une agrégation sur la base d’une surface communale (petit espace), les soit- disant régions NUTS-3 (espace moyen) et enfin les régions de diffusion des trois grandes familles linguistiques germano-roman-slave (grand espace). En outre, il y a la possibilité de définir à volonté les surfaces communales comme des régions individuelles qui ensuite fonctionnent inversement comme des valeurs de référence de l’agrégation. Une toute dernière option peut agir contre des effets déformants qui résultent dans la perspective d’une agrégation au-delà des surfaces administratives et ainsi dans la perspective de la linguistique des régions communales ou bien des régions NUTS-3. Dans des cas particuliers, cette procédure correspondante peut bien entendu n’être qu’heuristique, l’utilisateur a cependant la possibilité de sauvegarder les cohérences régionales qu’il aura découvertes comme étant éloquentes, de les commenter, de les réutiliser et de les mettre à disposition de la communauté.
En relation avec les régions choisies, respectivement avec les surfaces, l’ensemble des données qualitatives choisies jusqu’à l’activation de la représentation quantitative sont agrégées. Grandeur et rendu des couleurs de chaque symbole cartographique sont corrélés à cet égard avec le nombre des données qualitatives singulières focalisées sur un symbole à chaque fois. La valeur maximale fondée de manière arithmétique, par l’accès duquel un symbole contient toujours une grandeur maximale et un rendu des couleurs, correspond à cet égard de manière standard la quantité la plus grande en matière de données agrégées, qui apparaît dans l’une des surfaces, respectivement des régions choisies. Cette valeur de référence maximale peut être appliquée à souhait sur l’ensemble des données agrégées prise une par une, ce qui conduit à une modification de la représentation cartographique.
Lorsque la fonction quantification est activée, on peut extraire des données quantitatives, par désactivation de chaque entrée dans une liste dans la légende de la carte, les données qualitatives correspondantes ou bien ajouter d’autres données par un autre choix.
A côté de la quantification d’une carte géo-référencée qui reproduit les tracés frontaliers en temps réel, VerbaAlpina permet également la représentation de données quantifiées sur une carte dénommée « en alvéoles ». Son modèle est un dessin Wikipedia qui visualise les résultats des élections britanniques à la Chambre des Communes de 2015. Sur celle-ci, on a d’abord restitué fidèlement la carte en ses points, distances et angles (celle-ci désigne la « carte géographique ») avec les résultats des élections dans chaque circonscription. Au final, on y représente une carte en alvéoles sur laquelle chaque circonscription est figurée par un hexagone de grandeur identique.




Source : https://upload.wikimedia.org/wikipedia/commons/3/3e/2015UKElectionMap.svg (abgerufen am 03.11.2016)




Source : https://upload.wikimedia.org/wikipedia/commons/c/cd/2015_UK_general_election_constituency_map.svg (demandées le 03.11.2016)
La confrontation des deux types de cartes montre leurs avantages et inconvénients respectifs. La carte en alvéoles renvoie à des imprécisions géographiques, respectivement même à des informations erronées. On reconnaît ainsi par exemple dans le district Greater London une alvéole rouge isolée qui se trouve entourée d’alvéoles bleues imposantes – un fait anodin mais qui ne trouve pas de preuve sur la carte géographique. D’un autre côté, la carte en alvéoles possède l’avantage de mieux visualiser les relations réelles entre les chiffres, par chaque couleur, étant donné que, sur la carte géographique, une multitude de toute petites circonscriptions du point de vue de la surface sont perçues par l’observateur comme inférieurs, bien que leur importance politique est mise sur le même plan que celle des grands districts d’un point de vue de la surface. C’est ainsi que les deux types de cartes se complètent et leur véritable plus-value réside dans la possibilité de pouvoir consulter les deux cartes et de confronter leur visualisation.
La carte alvéolaire de VerbaAlpina se distingue du fait qu’elle représente l’ensemble des communes politiques de l’espace alpin par de grands hexagones de taille identique à chaque fois. A cet égard, on cherche, à peu près, à conserver au moins la logique géographique. Le calcul du rendu des couleurs des hexagones pris un par un s’ensuit de la même manière que sur la carte à points. L’avantage d’une telle carte alvéolaire consistant, contrairement à une simple coloration des surfaces communales, en une carte géo-référencée, est que les effets suggestifs sont mis au second plan par rapport aux grandeurs variables des surfaces communales.


(auct. Stephan Lücke – trad. Pierre Herrmann)

Tags: Technologie de l'information Page Web



Rhéto-roman  (Citer)

Conformément à la Constitution fédérale de la Confédération suisse, l'expression allemande 'Rätoromanisch' (version française de la Constitution fédérale : 'romanche') est utilisée dans le projet VerbaAlpina pour les variétés romanes du Canton des Grisons qui ne font traditionnellement pas partie des variétés italiennes (cf. Gross 2004 et Liver 2010). En faisant ainsi, on n'affirme absolument pas la réunion de ce romanche grison avec le ladin des Dolomites et le frioulan dans le sens d'une 'langue' commune; c'est justement pour ce concept (qui aujourd'hui n'est plus acceptable) que l'expression 'Rhéto-roman' a été forgé par la linguistique au 19ème siècle. Graziadio Isaia Ascoli a développé l'idée en tant que telle et a désigné cette langue comme 'ladino' en italien.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique



Rubrique onomasiologique  (Citer)

Afin de décomposer les concepts en catégories fonctionnelles, ceux-ci sont répartis en produits, processus, personnes, appareils et contenants. On peut les caractériser comme suit :

produits
Ils constituent une partie de la catégorie « produit » dans son sens le plus large, c’est-à-dire que le lait peut aussi faire partie de ce groupe. En outre, la crème, le petit-lait, tout comme les restes de fermentation sont aussi des produits, desquels on peut tirer de nouveaux produits :

processus
Par des processus, on tire d’un produit d’autres produits (par exemple petit-lait/ fromage blanc).
personnes
La plupart du temps, les personnes sont liées à des processus, comme par exemple le vacher.

appareils
Les personnes utilisent des appareils pour transformer les produits à travers un processus. L’appareil est utilisé pour porter un produit d’un état à un autre (par exemple, briser le lait caillé à l’aide d’une harpe à fromage). Lors de l’utilisation d’un appareil, une forme d’énergie, par exemple la force musculaire ou le courant électrique est toujours en jeu. La distinction avec le contenant n'est pas toujours précise. Un contenant destiné à un processus de maturation, ou bien encore à retirer le liquide d'un produit à l'aide de la pesanteur, représente ainsi également un appareil. Il en va ainsi pour les différentes formes de baratte de beurre. Elles contiennent certes la crème, or leur but n’est pas de la stocker, mais elles sont utilisées pour le processus suivant : séparer la crème en beurre et en petit-lait.

contenants







(auct. Markus Kunzmann)

Tags: Linguistique