Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W  X  Y  Z 


Beta code  (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) qui a développé le concept correspondant au début des années soixante-dix pour la saisie électronique de textes en grec ancien avec des moyens de technique informatique d'alors, la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est désigné "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Tout d'abord, on distingue les caractères de bases des diacritiques lors de la transmission de la transcription phonétique utilisée dans l'atlas linguistique selon Böhmer-Ascoli dans des séquences composées par des caractères ASCII. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté par lui-même lors de la transmission (ce qui est entièrement le cas dans l'exemple présenté). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII spécial. L'affectation des diacritiques à des caractères ASCII est claire dans VerbaAlpina et elle est documentée dans des tableaux de la base de données VerbaAlpina. Le choix de l'affectation est guidé par le principe de la ressemblance optique autant que possible. Ainsi dans l'exemple mentionné, la coche sous l'u dans la parole tu est rendue par une parenthèse ouvrante: tu(. Les diacritiques sont écrits en partant des leur disposition près le caractère de base dans l'ordre de bas en haut et de gauche à droite après le caractère de base. En raison du principe de la ressemblance optique l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d.: même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche est rendue malgré tout en les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques pour chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d.: le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a un nombre d'avantages:
- la saisie des données peut être fait sur des claviers standard traditionnels à relativement grande vitesse et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissances de systèmes de transcription phonétique;
- n'importe quel caractère respectivement diacritique peut être saisi, indépendamment s'il est codé dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque n'importe quel autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent se passer éventuellement; celles-ci sont pourtant crées par l'essence des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée qui n'est pas prévue dans le système API.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information