Multilingue, traduction et hiérarchie des versions
Traduire un canon ne consiste pas seulement à déplacer un texte d’une langue à une autre. Cela consiste à préserver un périmètre d’autorité, des exclusions, une temporalité, une portée et parfois une juridiction. Autrement dit : ce qui doit survivre à la traduction, ce n’est pas uniquement le sens général. C’est la structure normative de ce qui peut être affirmé.
Un corpus multilingue ne produit donc pas naturellement une seule vérité stable. Il produit plusieurs surfaces linguistiques qui peuvent être équivalentes, partiellement équivalentes, localement adaptées, ou temporairement désynchronisées. Sans hiérarchie déclarée, un système de synthèse traite souvent cette pluralité comme un même gisement disponible pour recomposition.
Cette page ne réclame ni simultanéité parfaite ni uniformité mondiale. Elle établit une chose plus exigeante : en multilingue, il faut gouverner ce qui peut être combiné, ce qui doit prévaloir, et ce qui ne doit pas voyager sans condition.
1. Un canon traduit n’est pas nécessairement un canon identique ligne à ligne
Deux versions linguistiques peuvent être canoniquement compatibles sans être textuellement symétriques. Une formulation peut devoir être adaptée pour préserver une nuance juridique, un usage local, une distinction sectorielle ou un niveau de lisibilité.
L’exigence doctrinale n’est donc pas l’identité verbale. L’exigence est la stabilité de :
- la frontière de ce qui peut être déduit ;
- la hiérarchie entre affirmation, condition et exclusion ;
- la date ou version de validité ;
- la relation entre règle générale et variante locale.
Un texte bien traduit lexicalement peut être doctrinalement faux s’il affaiblit une exclusion, universalise une exception, ou laisse croire qu’une langue secondaire fait foi sur un attribut qu’elle ne gouverne pas.
2. Les principales dérives multilingues
Le cas le plus visible est déjà documenté dans Multilingue et temporalité : quand les versions FR et EN ne vieillissent pas ensemble. Mais la désynchronisation temporelle n’est qu’un cas parmi d’autres.
Les dérives multilingues les plus structurantes sont généralement les suivantes :
- recomposition hybride : une réponse combine des fragments issus de plusieurs langues sans déclarer leur statut ;
- glissement de portée : une adaptation locale est lue comme règle universelle ;
- effacement des exclusions : la traduction conserve l’affirmation mais perd la négation ;
- archivage asymétrique : une langue devient l’archive involontaire de l’autre ;
- primauté implicite : la langue la plus détaillée ou la plus facile à synthétiser l’emporte, même si elle ne devrait pas gouverner l’attribut concerné.
Dans tous ces cas, le problème n’est pas seulement lexical. Il est hiérarchique.
3. Ce qu’un corpus multilingue doit déclarer
Un corpus multilingue gouvernable doit pouvoir répondre, pour les attributs critiques, à des questions simples :
- quelle langue est référence pour quel type d’information ;
- quand une version locale prévaut sur la version générale ;
- quels écarts temporaires sont tolérés ;
- quelles informations sont en cours de traduction et ne doivent pas être combinées ;
- quels éléments doivent rester strictement synchronisés.
Cette discipline vaut particulièrement pour les attributs qui engagent la portée réelle d’une entité : offre, disponibilité, localisation, conformité, délais, prix, exclusions, procédure de contact, rôles et périmètres.
Elle rejoint directement la question des sources produit : une documentation FR et une tarification EN peuvent être parfaitement exactes séparément, puis produire ensemble une description qui n’existe nulle part.
4. Traduire aussi les négations, les silences et les conditions
Un canon n’est pas fait seulement d’énoncés positifs. Il est aussi fait de silences intentionnels, de bornes, d’interdictions d’inférence et de conditions de réponse.
C’est pourquoi la silence canonique ne doit jamais être traité comme un oubli de traduction. Ce qui n’est pas dit dans une langue n’est pas automatiquement comblable par une autre. Une synthèse multilingue gouvernée doit pouvoir distinguer :
- ce qui est vraiment équivalent d’une langue à l’autre ;
- ce qui reste non spécifié dans toutes les langues ;
- ce qui est localement dit, mais non exportable ;
- ce qui est temporairement absent et ne doit pas être complété.
Traduire seulement les affirmations, sans traduire les exclusions et les conditions, revient à ouvrir un espace d’inférence plus large dans une langue que dans l’autre.
5. Temporalité, mémoire et persistance des anciennes versions
En multilingue, la mémoire du système ne se limite pas aux archives internes. Elle inclut aussi les anciennes versions linguistiques, les captures, les traductions partiellement reprises, les extraits indexés et les citations externes.
C’est ce qui explique que la rémanence interprétative soit souvent plus forte dans les corpus bilingues ou multirégionaux. Une correction dans une langue ne déplace pas automatiquement la mémoire de l’autre.
Le pouvoir de version doit donc être lu avec la gouvernance de la mémoire : ce qui reste accessible dans une langue secondaire peut continuer de gouverner la synthèse, même si la langue primaire a été corrigée.
6. Ce que gouverner le multilingue ne signifie pas
Gouverner un corpus multilingue ne signifie pas :
- imposer une symétrie textuelle absolue ;
- supposer qu’une seule langue doit toujours prévaloir sur tout ;
- interdire les adaptations locales ;
- exiger une traduction instantanée de chaque changement.
Cela signifie plutôt rendre visibles les règles de priorité, les écarts admissibles et les zones non combinables. Sans ces règles, la traduction cesse d’être un dispositif d’équivalence et devient une réserve de fragments pour synthèse opportuniste.
7. Portée doctrinale
Cette page étend la doctrine à un objet souvent sous-gouverné : la coexistence de vérités linguistiques partiellement alignées. Elle ne remplace ni une politique de traduction, ni une procédure juridique, ni une architecture de localisation.
Elle établit seulement ceci : un site multilingue n’a pas plusieurs langues à gérer, mais plusieurs juridictions d’interprétation à ordonner.
Raccords canoniques
- Multilingue et temporalité : quand les versions FR et EN ne vieillissent pas ensemble
- Gouvernance endogène : canoniser l’entité on-site
- Le pouvoir de version dans un web interprété par les IA
- Documentation, centre d’aide, tarification et changelog : hiérarchie des sources produit
- Surfaces de synthèse et réattribution silencieuse de l’autorité
- Lire la doctrine SSA-E + A2 + Dual Web