Méthodologie

Tri

Montrer toutes les contributions

A   B   C   D   E   F   G   H   I   J  K  L   M   N   O   P   Q  R   S   T   U   V  W   X  Y  Z 


Beta code (Citer)

En référence à la terminologie du Thesaurus Linguae Graecae (TLG) (qui a développé au début des années soixante-dix, avec les moyens de technique informatique d'alors, un concept similaire pour la saisie électronique de textes en grec ancien), la transcription de systèmes d'écriture complexes à l'aide exclusif de caractères ASCII est désignée "Beta code" dans le cadre de VerbaAlpina.
Le graphique suivant illustre le procédé à l'aide d'un exemple de l'Atlante italo-svizzero (AIS):





Pour permettre la retranscription en caractères ASCII des transcriptions phonétiques selon Böhmer-Ascoli, utilisée dans les atlas, il faut tout d'abord distinguer caractères de base et diacritiques. Si un caractère de base est présent dans le code ASCII, ce caractère est représenté tel quel lors de la transmission (ce cas se retrouve dans l'exemple). Tous les diacritiques liés au caractère de base le suivent immédiatement après. Chaque diacritique est remplacé par un caractère ASCII dédié. L'attribution des diacritiques à des caractères ASCII est sans équivoque au sein de VerbaAlpina et des tableaux dédiés de la base de données VerbaAlpina consignent le processus. Autant que possible, le choix de l'attribution est guidé par le principe de la ressemblance optique. Ainsi dans l'exemple mentionné, la coche sous le u dans le mot tu est rendue par une parenthèse ouvrante: tu(. Les diacritiques sont retranscrits en partant de leur position par rapport au caractère de base dans l'ordre suivant : de bas en haut et de gauche à droite, après le caractère de base. En raison du principe de la ressemblance optique, l'affectation des diacritiques se fait indépendamment de leur sémantique dans la source spécifique, c.-à-d. que même si une coche sous un caractère de base a un sens phonétique complètement différent dans une source que dans une autre, la coche sera rendue dans les deux cas par une parenthèse fermante. Les différences sémantiques sont documentées dans des tableaux de transcription spécifiques à chaque source: ceux-ci règlent la conversion du beta code à la transcription d'output selon API, c.-à-d. que le même beta codage peut conduire à des codages API entièrement différents suivant la source.
Le procédé décrit a nombre d'avantages:
- la saisie des données peut être faite sur des claviers standard traditionnels, à relativement grande vitesse, et elle est complètement indépendante du système d'exploitation;
- les transcripteurs n'ont bas besoin de connaissance des systèmes de transcription phonétique;
- n'importe quel caractère ou diacritique peut être saisi, qu'ils soit codés dans Unicode ou pas;
- la saisie des données électronique se fait sans perte d'information.
Le beta code peut être converti en presque tout autre système de transcription par des routines de remplacement. Dans le cadre de telles conversions, des pertes d'information peuvent éventuellement se passer; mais c'est là le caractère même des systèmes de transcription. Ainsi, la transcription phonétique selon Böhmer-Ascoli fait une distinction des différents degrés d'ouverture d'une manière très détaillée, qui n'est pas prévue dans le système API.



(auct. Thomas Krefeld | Stephan Lücke – trad. Susanne Oberholzer)

Tags: Linguistique Technologie de l'information