Artefacts de gouvernance
Fichiers de gouvernance mobilisés par cette page
Cette page est arrimée à des surfaces publiées qui déclarent l’identité, la préséance, les limites et les conditions de lecture du corpus. Leur ordre ci-dessous donne la séquence de lecture recommandée.
Q-Layer en Markdown
/response-legitimacy.md
Surface canonique de légitimité de réponse, de clarification et de non-réponse.
- Gouverne
- La légitimité d’une réponse et les contraintes qui modulent sa forme.
- Borne
- Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.
Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.
Q-Layer en YAML
/response-legitimacy.yaml
Projection structurée du Q-Layer pour systèmes qui préfèrent une lecture YAML.
- Gouverne
- La légitimité d’une réponse et les contraintes qui modulent sa forme.
- Borne
- Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.
Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.
Politique d’interprétation
/.well-known/interpretation-policy.json
Politique publiée qui explicite les contraintes d’interprétation, de portée et de retenue.
- Gouverne
- La légitimité d’une réponse et les contraintes qui modulent sa forme.
- Borne
- Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.
Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.
Artefacts complémentaires (3)
Ces surfaces prolongent le bloc principal. Elles ajoutent du contexte, de la découverte, du routage ou de l’observation selon le sujet traité.
Politique d’usage IA
/ai-usage-policy.md
Notice publique qui explique comment lire les surfaces de gouvernance et leurs limites.
Output Constraints
/output-constraints.md
Surface qui explicite les conditions de réponse, de retenue, d’escalade ou de non-réponse.
Routeur sémantique
/semantic-router.json
Surface qui oriente la lecture vers les bonnes zones du corpus selon le type d’intention.
Gouvernance RAG : contrôle du retrieval et de l’inférence
Le RAG (Retrieval-Augmented Generation) améliore la pertinence en injectant des sources externes dans la génération. Mais sans gouvernance, il déplace simplement le problème : au lieu d’inventer, le système sélectionne mal, mélange ou extrapole à partir de sources hétérogènes.
La gouvernance RAG vise à contrôler deux choses distinctes : ce qui est récupéré et ce qui est inféré à partir de ce qui est récupéré.
Définition opératoire
Gouvernance RAG : cadre normatif visant à encadrer la sélection de sources (retrieval), la qualification de leur légitimité (Q-Layer) et la génération finale, afin de garantir la fidélité au canon, la gestion des conflits d’autorité et la production de preuves auditables.
Problèmes typiques du RAG non gouverné
- mauvais chunk sélectionné
- sources contradictoires mélangées
- absence de hiérarchisation d’autorité
- extrapolation normative à partir d’un fragment partiel
- absence de non-réponse légitime en cas d’ambiguïté.
Architecture gouvernée
Canon → Retrieval → Q-Layer → Génération → Sortie
- Canon : sources versionnées et qualifiées.
- Retrieval : sélection pondérée et contrôlée.
- Q-Layer : conditions de réponse et frontière d’autorité.
- Génération : inférence bornée.
Règles (GRAG-1 à GRAG-9)
GRAG-1 : qualification des sources
Toute source doit être classée par niveau d’autorité.
GRAG-2 : hiérarchisation explicite
En cas de conflit, une règle d’arbitrage doit être déclarée.
GRAG-3 : interdiction d’extrapolation hors chunk
Le modèle ne peut pas déduire au-delà du fragment récupéré sans règle explicite.
GRAG-4 : contrôle d’ambiguïté
Si le retrieval est ambigu, déclencher clarification ou non-réponse.
GRAG-5 : traçabilité des chunks
Journaliser quels fragments ont été utilisés.
GRAG-6 : preuve de fidélité sur attributs critiques
Exiger correspondance explicite entre chunk et réponse.
GRAG-7 : gestion des collisions internes
Détecter si deux fragments renvoient à des entités différentes.
GRAG-8 : tests adversariaux
Injecter des requêtes ambiguës et comparer les sorties.
GRAG-9 : monitoring et version
Versionner le corpus et revalider les résultats après mise à jour.
Artefacts attendus
- Registre des sources classées par autorité.
- Journal des retrievals (chunks utilisés).
- Rapports de conflits d’autorité.
- Batterie de tests adversariaux.
- Rapports d’écart canon-sortie.
FAQ
Le RAG suffit-il à garantir la fidélité ?
Non. Il améliore la disponibilité de sources, mais sans gouvernance, il peut amplifier la confusion.
Pourquoi intégrer le Q-Layer ?
Parce que le retrieval ne garantit pas la légitimité de l’inférence.
La gouvernance RAG est-elle différente en environnement fermé ?
Oui. Le contrôle est plus direct, mais les conflits internes peuvent être plus subtils.
Pages associées
Voir aussi
Couche de définitions canoniques phase 7
Ce framework est maintenant soutenu par des surfaces de définition dédiées : gouvernance RAG, contrôle de récupération, admission des sources, admissibilité du corpus, provenance de récupération, autorité du fragment, chaîne documentaire, web de réponse, budget de correction et résorption.
Le framework doit être lu comme la couche appliquée. Les définitions sont les surfaces canoniques de possession SERP et de lecture machine.
La récupération n’est pas la légitimité
Ce framework part d’une distinction critique : récupérer un document ne rend pas la réponse finale légitime. Le RAG peut améliorer l’accès aux sources, mais il peut aussi créer une fausse confiance lorsque le succès de récupération est confondu avec l’autorité, l’admissibilité, la fidélité ou l’autorisation de réponse.
La première étape consiste à gouverner ce qui peut entrer dans le corpus. La deuxième consiste à gouverner les passages qui peuvent être récupérés. La troisième consiste à gouverner ce que la réponse peut inférer à partir d’eux. Ces trois contrôles sont différents. Une source peut être admissible sans être décisive. Un passage peut être pertinent sans être autoritaire. Un fragment récupéré peut soutenir le contexte sans autoriser une conclusion.
Séquence de gouvernance
Une séquence pratique consiste à définir l’admissibilité du corpus, créer une hiérarchie des sources, attacher une provenance aux passages récupérés, assigner une autorité aux fragments, restreindre l’inférence et appliquer les conditions de réponse avant la sortie. Cela relie le framework à la gouvernance RAG, au contrôle de récupération, à la chaîne documentaire et à la légitimité de réponse.
Le framework doit aussi noter la version, la date, la classe de source et les conditions d’exclusion. Sans discipline de version, un système RAG peut récupérer un passage périmé mais sémantiquement pratique et le traiter comme actuel.
Modes de défaillance
Les défaillances fréquentes consistent à surfaire confiance aux extraits récupérés, mélanger sources canoniques et contextuelles, citer un passage qui ne soutient pas la conclusion et laisser le modèle synthétiser entre sources sans ordonnancement d’autorité. La correction n’est pas toujours une meilleure récupération. Parfois, la correction est un refus, une qualification, une exclusion de source ou un périmètre de réponse plus étroit.
La récupération n’est pas une autorisation
Un système RAG peut récupérer une source pertinente, récente et sémantiquement proche tout en ne disposant pas de l’autorité requise pour répondre. Ce framework sépare donc la réussite de récupération de la légitimité de réponse. La récupération répond à la question « qu’a-t-on trouvé ? ». La gouvernance interprétative répond à la question « que peut-on conclure de ce qui a été trouvé ? ».
Le framework évalue l’admission des sources, l’autorité des fragments, la provenance, l’état de version, la hiérarchie des sources et les limites d’inférence. Un passage récupéré peut être admis comme preuve, rejeté comme périmé, utilisé seulement comme contexte ou subordonné à une surface plus canonique. Sans ces distinctions, une chaîne RAG peut transformer la proximité en autorité.
Points de contrôle
Les principaux points de contrôle sont l’admission du corpus, le filtrage de récupération, les métadonnées de fragment, l’ordonnancement de l’autorité, la qualification de la réponse et la traçabilité post-réponse. Chaque point doit déclarer ce qu’il peut et ne peut pas décider. Un filtre de récupération peut réduire le bruit. Il ne crée pas la validité procédurale. Une citation peut exposer une source. Elle ne garantit pas la fidélité.
Ce framework relie la gouvernance RAG, le contrôle de récupération, la chaîne documentaire et la légitimité de réponse. Sa valeur pratique est d’empêcher la mécanique de récupération de devenir silencieusement une gouvernance.
Liste d’application
En pratique, ce framework doit devenir un tableau de revue de récupération. Chaque ligne doit enregistrer la source, le fragment, l’état de version, le statut d’admission, le niveau d’autorité, l’inférence permise et la condition de réponse. Un fragment pertinent mais non canonique doit être marqué autrement qu’un fragment à la fois pertinent et autoritaire.
La revue doit aussi inclure un chemin de refus. Si la récupération retourne des sources mais qu’aucune ne satisfait la hiérarchie des sources ou le seuil de légitimité de réponse, le système doit pouvoir déclarer que le corpus est insuffisant. Cela protège le RAG de son mode de défaillance le plus fréquent : traiter le matériau récupéré comme automatiquement suffisant.