Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


Technologie (Citer)

Dans la mesure du possible, VerbaAlpina utilise la technologie en ligne. Le noyau du projet est une installation Wordpress (Modul VA_WEB) à laquelle sont reliées plusieurs base de données MySQL (Modul VA_DB). Wordpress est un framework PHP disponible gratuitement, open source et extensible individuellement dont les fonctionnalités sont complétées par l'utilisation de bibliothèques Javascript. Cela s'applique surtout au plan interactif en ligne qui, dans les premières versions de VerbaAlpina, utilisait la Javascript-Bibliothek von Google Maps. La conversion vers le framework open source Javascript-Framework "Leaflet", devrait avoir lieu avec la version 19_1, qui sera accompagnée par l'implémentation d'un layer WebGL pour la visualisation de grandes quantités de données.

Toutes les fonctionnalités développées par VerbaAlpina sont implémentées sous forme de plug-ins. Les plug-ins sont ensuite stockés sur "Github", une plateforme bien connue et fermement établie dans la communauté des développeurs (https://github.com/VerbaAlpina/). Ils peuvent être téléchargés et réutilisés librement et sans restrictions de la plateforme. L'utilisation des plug-ins est possible grâce à la MIT qui est largement utilisée dans le domaine du développement de logiciels. La distinction entre les plug-ins PHP et Javascript affichée sur Github est artificielle et a été automatiquement saisie par la même plateforme. La plupart des plugins développés par VerbaAlpina contiennent toujours certaines parties de code Javascript en plus du code PHP. Actuellement (novembre 2018) les plugins "TranscriptionTool-Plugin", "Interactive-Map_Plugin", "Verba-Alpina-Plugin" sont disponibles sur la page Github de VerbaAlpina. De plus, le "Thème Verba-Alpina", design utilisé pour le frontal, peut être téléchargé à partir de là. VerbaAlpina a prévu de proposer d'autres extensions fonctionnelles sous forme de plug-ins à télécharger sur Github.

Liste des principales extensions fonctionnelles développées par VerbaAlpina jusqu'à présent:
  • Plan interactif en ligne (visualisation multicouche des analyse de données)
  • Outil de transcription (surtout pour la transcription des atlas linguistiques)
  • Outil de typisation (catégorisation du matériel relevé et affectation aux types)
  • Arbre conceptuel (gestion de la structure hiérarchique du monde conceptuel extra-linguistique)
  • CS-Tool ("Crowdsourcing"-Tool; collecte de matériel linguistique via Internet pour compléter les données)
  • SQLtoHTML (intégration directe des résultats des requêtes SQL dans les contributions Wordpress)

A côté de ces outils complexes, qui peuvent être utiles aussi pour les utilisateurs en dehors de VerbaAlpina, plusieurs fonctionnalités ont été développées, dont la transformation en plug-ins modulaires ne semble pas logique, car elles apparaissent soit trop petites soit trop spécifiquement adaptées aux besoins de VerbaAlpina. Cependant, cette catégorie de développements est également accessible, d'autant plus que le code complet du logiciel de VerbaAlpina est stocké sur Github en plus des plug-ins ci-dessus.

Le back-end connecté à Wordpress est constitué de plusieurs bases de données MySQL. La base de données va_wp est basée sur le modèle standard d'une base de données MySQL, couramment utilisée comme back-end pour les installations Wordpress. A travers cette base de données, on gère principalement les fonctionnalités "génériques" d'une installation Wordpress comme par exemple la gestion des utilisateurs. La base de données scientifique centrale de VerbaAlpina telle que les transcriptions (tableau 'tokens'), typisations au sens large (tableau 'morph_typen', 'basistypen', 'etyma' et 'lemmata'), concepts ('konzepte'), contributions méthodologiques ('glossar') et du Lexikon Alpinum ('im_comments') ou la bibliographie ('bibliographie') se trouve dans la base de données va_xxx. Le suffixe "xxx" indique les différentes versions de VerbaAlpina, dont la base de données est soumise à des modifications constantes en cours de fonctionnement. Lors de la création d'une version de VerbaAlpina, une copie stable de cette base de données est créée. Le nom de cette copie stable sera composé par "va_" et le suffixe contiendra le numéro de version (par exemple: va_181). De plus, il existe une base de données MySQL pour différents partenaires de VerbaAlpina. Les noms de ces bases de données portent le préfixe "pva_" (=Partenaires de VerbaAlpina) suivi d'une abréviation du projet partenaire (par exemple: pva_ald-i).

Les fichiers multimédia (images, vidéos, enregistrement sonores) collectés par VerbaAlpina dans la médiathèque (Modul VA_MT) de l'installation Wordpress sont stockés dans le système de fichiers du serveur web, comme il est de coutume pour les installation Wordpress.

Toutes les instances technologiques de VerbaAlpina, à savoir l'installation Wordpress ainsi que les bases de données, utilisent l'infrastructure informatique du groupe de la technologie de l'information des sciences humaines de la LMU. Cette institution dispose d'un système de gestion informatique professionnel avec des serveurs web et de bases de données à haute disponibilité et utilise également les services du centre informatique de l'académie bavaroise. Avec un total de sept postes permanents, le stock actuel du groupe est assuré à long terme. Une partie du personnel se consacre exclusivement à l'exploitation, à la maintenance et à l'entretien du matériel et des logiciels du serveur.

Tous les développements de logiciels ont été réalisés par les informaticiens David Englmeier (collaborateur scientifique; depuis octobre 2016), Filip Hristov (assistant; depuis septembre 2016) et Florian Zacherl (collaborateur scientifique; depuis octobre 2014).

(auct. Stephan Lücke – trad. Beatrice Colcuc)

Tags: Technologie de l'information



Terminologie (Citer)

On fait souvent une distinction entre les données brutes, les données primaires et les métadonnées. Il n'existe pas encore de définition contraignante de ces catégories.

Données brutes: données après l'adoption à partir de la "source" (par exemple à partir des données des partenaires, par OCR à partir de dictionnaires, par transcription...)

VA est basé sur le modèle Stuart Card (infovis-reference-model; modèle de référence pour la visualisation).

En conséquence, une distinction est faite entre les données brutes et les données primaires. Les données brutes sont toutes les données sous la forme existante avant le transfert électronique des données dans la structure de VA. Ceci s'applique également dans le cas où les données à transférer sont déjà disponibles dans la structure de VA, puisque l'interaction humaine est également nécessaire pour le transfert de données dans ce cas (par exemple, pour déterminer *que* la structure est identique).

Les données primaires sont toutes les données qui peuvent être récupérées via l'API avec le paramètre "getRecord" (exemple: https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getRecord&id=C1&version=182&format=xml&empty=0; pas encore complètement implémenté). Une distinction est faite entre les données primaires de base (= données linguistiques) et les données primaires périphériques (périphérie linguistique comme par exemple les données archéologiques).

Les métadonnées sont définies comme l'ensemble des données décrivant les données primaires (par exemple, les données administratives décrivant l'ensemble du projet, tous les textes explicatifs, par exemple dans la méthodologie [qui met en évidence différents aspects du projet global] ou le Lexikon Alpinum).

Les données secondaires sont toutes les données utilisées pour traiter toutes les autres données (code, requêtes, etc....).

(auct. David Englmeier | Filip Hristov | Thomas Krefeld | Stephan Lücke | Christina Mutter | Florian Zacherl – trad. Beatrice Colcuc)

Tags: Technologie de l'information



Transcription (Citer)

Les matériaux linguistiques sont rendus graphiquement de manière double pour satisfaire aux deux principes contraires de la fidélité à la source et de la comparabilité facile:

(1) Version d'entrée dans la transcription originale

Le portail de VerbaAlpina réunit des sources qui proviennent de traditions scientiques différentes (philologie romane, allemande et slave) et qui représentent différentes phases historiques de la recherche dialectologique. Quelques données lexicographiques ont été relevées au début du siècle dernier (GPSR) et d'autres il y a peu d'années (ALD) seulement. Pour cette raison, il est nécessaire du point de vue historique et épistémologique de respecter la transcription originale à quelques détails près. Par des raisons techniques, il est pourtant impossible de maintenir certaines conventions intégralement; cela est regarde en particulier les combinaisons verticales de caractère de base ('lettre') et signes diacritiques comme par exemple la superposition typographqiue d'un diacritique pour l'accent, d'un diacritque pour la durée, d'une voyelle et d'un diacritique pour la fermeture. Ces conventions sont transférées dans des séries linéaires de signes selon des transcriptions techniques définies pour chaque convention en utilisant exclusivement des caractères ASCII ("Beta code"). Jusqu'à un certain point on peut profiter des ressemblances graphiques intuitivement compréhensibles entre les diacritiques originaux et les pendants ASCII chosis pour l'encodage beta; ces ressemblances sont mnémoniquement favorables.

(2) Version de sortie en API

Pour satisfaire à la comparabilité et aussi à la convivialité, il est en plus souhaitable de rendre toutes les données également dans une transcription uniforme. C'est pourquoi tous les beta codes seront transférés dans des caractères API au moyen de routines de remplacement spécifiques. On n'est confronté qu'à peu de problèmes qui pourtant sont inévitables: c'est le cas si un caractère de base spécifié par des diacritiques dans la transcription d'entrée correspond à deux caractères de base différentes en API. Cela concerne surtout les degrés d'aperture des voyelles où par ex. deux caractères de base <i> e <e> combinés avec un point de fermeture et un ou deux crochets d'aperture permettent de représenter six degrés d'aperture dans la série palatale; dans l'encodage beta ce sont les suivants: i – i( – i((– e?-- e – e(– e((. Pour représenter cela, API n'offre que quatre caractères de base: i – ɪ – e – ɛ.

(auct. Thomas Krefeld – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information